官术网_书友最值得收藏!

3.1 控制范式

移動機器人被設計用來完成各種任務。最基本的任務能夠四處移動,并可以避開障礙物到達某個給定的目標點。其他任務包括追蹤氣味、繪制未知地形圖紙、對聲音和手勢做出回應、關注以人為中心的環境(博物館、劇院、機場等)。

最簡單的機器人至少包含一組配對的傳感器與執行器。配置更多的傳感器和執行器可以提高機器人的能力,增加其多樣性。其他重要的參數是對機器人的約束,以及對過程、安全考量、自我保存和優化性能的約束。本章主要討論機器人的控制范式和體系結構,并嘗試在工程上實現上一章所提概念。

一個好的控制范式包含三個重要方面:閉環控制、實時響應以及克服傳感器誤差的魯棒性。閉環控制是其中一個關鍵。這點可從最簡單的一種機器人——巡線機器人的例子中看到。該類機器人裝有一個光傳感器,它會跟蹤一條用某種顏色標記的線(通常是黑色或白色)。任何偏離直線的不理想偏差都是由光傳感器和電機之間的感知運動對來避免的。ANIMAT的推論假設有一個眼睛盯著路面的虛擬動物,如圖3.1所示。閉環與開環的信息流對比則如圖3.2所示。如果沒有光傳感器,機器人將無法跟蹤這條線,它將會在線段端部指向的方向上任意移動。

缺少反饋機制 反饋在控制系統和電子學中是一個很重要的概念,并且結果表明基于反饋的閉環系統比開環系統更為穩定。將使機器人無法與環境進行交互,流程圖中對此進行了解釋。此外,移動機器人應該具有最小延遲的實時響應。該組傳感器執行器配對是由一個微控制器進行調節,并由一組控制規則和參數所構成。通常,這是在準確性和延遲時間之間進行的權衡。第三點是,傳感器容易出現故障,并會給出錯誤的和有噪音的讀數。在這種情況下,該系統需要在某一領域的實際應用中保持良好的運行。因此,移動機器人的控制應該采用并行的方法進行組織,包含柔性降級并高雅地處理異常,如此一來,單一的硬件或軟件模塊故障就不會妨礙機器人的總體目標。

設計一款機器人有三種廣義方法。第一種方法簡稱SPA(sense-plan-act),它遵循了傳統人工智能的概念。它在20世紀50年代早期興起,通過處理感官信息來生成計劃和地圖是這種方法的基礎。機器人必須繪制出詳盡的、近似的環境地圖用以進行導航,其中,建筑物近似為長方體,云近似為球體,人近似為一個橢圓形的頭、一個圓柱形的軀干以及較小的圓柱形手臂,道路近似為一組平坦的直線段等。當繪制出了這樣的環境地圖,機器人必須從中找到合適的路徑以到達目標點。

圖3.1 基于ANIMAT的巡線者——一個一直盯著路面的人工動物。該模型等同于一個基本的帶有光傳感器的線跟蹤器。然而,這樣一個只有光傳感器的設計不會有太多的實用價值。一個高魯棒性的設計應有一圈光或超聲波傳感器,以及其他先進的硬件、反饋方式和傳感器融合,并考慮到摩擦、不平坦地形以及其他環境因素的影響

圖3.2 閉環系統。在a)中,光傳感器會考慮到與環境的交互,線追蹤器會對線進行跟蹤,直到線的末端;在b)中,沒有光傳感器,機器人沒辦法獲得環境的任何相關信息,將進行沒有任何目標或動機的隨機移動。這種情況下,機器人將不會優雅地停止移動,并很可能會導致一些碰撞

這種方法可以概括為一個結合了Google地圖的《我的世界》(Minecraft)。即使是20世紀60年代后期最好的電腦也無法制作出像今天的《我的世界》或Google地圖,但其理念卻大致相同。正如第1章所討論的,Nilsson[253]通過制作基于網格的(先驗的)地圖設計了Shakey的導航。這種方法依賴于從環境中獲取的信息,然后對這些信息進行處理,從而實現智能移動。由于與傳感器的范圍相比,空間顯然是無限的,機器人的移動將通過一個循環過程進行,在這個過程中,傳感器感知環境,微處理器制定在這種環境中的導航規劃,最后執行器將觸發運動。

第二種方法則依據行為主義原則[52,53],這個原則里不需要制作一個先驗地圖,而是機器人憑借在所處環境中接近實時的傳感器讀數搭配即時驅動,并利用這個感知-運動對開始移動,該方法中沒有良好的規劃或者地圖,類似動物與所處環境的交互。這種方法取消了先驗的規劃,并將環境動態實時處理為即時信息。這種方法在導航和其他低級任務中非常有效,但是我們將發現,它不能擴展到更高級別的任務上。

第三種方法,既包含規劃,又包含行為主義。這樣的建構可以在大多數最先進的機器人中看見。在后面的章節中,我們將討論混合架構對于以人為中心的機器人和機器人倫理的重要性。

1.協商式方法(協議法),需執行前進行細致規劃。在導航環境中實施時,機器人必須在開始移動之前設計詳細的環境地圖。

2.反應式方法,主體將根據環境來行動,沒有提前規劃。從動物和昆蟲世界獲得的靈感,當看到障礙物時會向左轉也許是最簡單的反應式范式。當主體跨多個傳感器、通過各種并行任務行動時,反應式范式將生成基于行為的機器人設計方法。

3.混合法,兩種方法的結合,嚴謹的規劃將以一種被動方式進行執行。

下一章是關于神經科學家及控制論專家Valentino Braiten-berg做的一些思維實驗,為基于簡單感知運動設計的行為發展提供了很好的例子。它擴展了反應式方法對設計機器人的描述。

SR圖(刺激反應圖)

刺激反應(Stimulus Response,SR)圖是用圖像呈現受到刺激(Stimuli,S)導致反應(Response,R)而產生的反應式行為。由Ronald Arkin在20世紀90年代初期所發展。

通過將SR圖疊加在一起,可以設計出完整的智能體控制機制,正如Braitenberg的車輛-3c一樣簡單,如圖3.6所示。傳統上,簡單行為被放在下端,復雜行為被放在上端,如圖3.19所示。

對行為的等價代數方法可使用函數進行表示:

其中,行為為β,給定的刺激為s,導致的回應為r。

[1] 反饋在控制系統和電子學中是一個很重要的概念,并且結果表明基于反饋的閉環系統比開環系統更為穩定。

主站蜘蛛池模板: 梁平县| 汝南县| 永济市| 沂水县| 绥宁县| 望都县| 会东县| 新余市| 通山县| 呼和浩特市| 沽源县| 通州市| 柘荣县| 渭南市| 桐城市| 文登市| 宁乡县| 绵竹市| 安阳市| 北宁市| 家居| 丹寨县| 周宁县| 五家渠市| 木里| 浪卡子县| 萝北县| 疏勒县| 上高县| 区。| 长沙县| 莎车县| 岳西县| 理塘县| 安陆市| 科尔| 秭归县| 渭南市| 太保市| 卢湾区| 简阳市|