- 機器意識:人工智能如何為機器人裝上大腦
- (印)阿卡普拉沃·包米克
- 10716字
- 2021-07-23 16:15:28
2.4.4 人工動物——ANIMAT
ANIMAT(或人工動物)是靈感來自動物行為和運動學的機器人。在Toda之后,其他許多人(Braitenberg、Holland、Brooker及Wilson[356,357])也提出了相似的人工動物模型,“ANIMAT”這一術語是Wilson在20世紀80年代中期創造出來的。他的ANIMAT是Walter的海龜的升級版,因為它不僅可以與環境交互,而且還可以從經驗中學習。行為主義和條件反射構成了Wilson模型的基本原則。具體包括規則適應性、遺傳進化、涌現和聯想等范式。Wilson提出了定義ANIMAT的四個原則:
1.人工動物處于感覺信號的海洋里,但在任何特定情況下,只有一些信號(對運動行動)是重要的,而其余的是多余的。
2.人工動物有行動的能力,而這實際上會傾向于改變這些信號。
3.某些信號和/或某些信號的缺失對人工動物來說具有特殊的地位,如缺乏食物會觸發生存本能,看到捕食者、遇到危及生命的地形等,會對人工動物的生存造成問題,并取代所有其他行為。
4.人工動物在外部行動,并且也會通過內部的操作,以最佳地優化特殊信號的出現。
前兩個原則是關于感覺運動和具身化的概念,第三個原則將生存能力視為最基本的行為,第四個原則將條件反射和規則適應性結合了起來。
有人提議,將感覺信號與理想的行動結合起來的最合適的規則,必須由ANIMAT作為一種偶然的練習來“發現”,否則不理想的規則應該被忽略。模仿動物可以允許行為在不受外界影響的情況下在體外開始[349]。因此,在相關的背景下,它允許在一個范圍內來精確、靈活和有效地設計這些行為,這在真實動物的研究中可能永遠不會被觀察到,我們將在后面的章節中舉例說明。ANIMAT的研究對于基于行為的范式發展和塑造人工生命(ALIFE)學科有一定幫助。
如圖2.10所示是《圣經·創世記》故事的詩意改編,在這里,Beavers思考了ANIMAT發展的各種原則,如學習、涌現、形成具有智力成長性的復雜生物等,為人工進化和成長提供了依據。達爾文的自然選擇會受到自然災害的影響(如諾亞洪水的傳說),未來反烏托邦機器人啟示錄在這里也是為了保證質量,這些也可以作為故障安全技術和眾所周知的“切斷開關”。
ANIMAT在探索自然世界的過程中發揮了重要作用,利用來自大自然的設計,與已知的數學模型和技術協同工作。當然,設計ANIMAT的途徑并不是單一的,研究者已經用了各種各樣的方法來設計人工生物。如圖2.11所示的臂式機器人控制器是通過觀察靈長類動物從一棵樹擺蕩到另一棵樹而設計出來的。Nakanishi等[250]將這種運動作為修正的擺振建模,并用神經網絡添加了機器學習方面。與之形成鮮明對比的是gastrobot[353]以及之后的其成熟版本ECOBOT系列機器人,它們是基于人類的消化過程和胃腸道系統設計的,目的是利用微生物燃料電池(MFC)實現能量自主。

圖2.10 孿生地球的創世記。Beavers對《創世記》的戲仿,這里ANI-MAT由“神一般的運營和開發團隊”開發出來,并編碼了進化版AI,有從簡單的到復雜的類型(如機器人)。隨著時間的推移,它們形成了自由意志和倫理價值觀。如果事情發展出現偏差,點綴著如諾亞洪水和未來機器人啟示錄的達爾文式自然選擇就是用來使用的工具。Antony Beavers,University of Evansville,授權使用

圖2.11 Brachiatron,基于靈長類動物臂力擺蕩的機器人。Nakanishi等通過修正擺振而設計了這個運動。右圖來自wikipedia.org,CC-by-SA 3.0許可,左圖來自NASA JPL Laboratory,www-robotics.jpl.nasa.gov
研究總是試圖把更新的想法從大自然引入人工智能,如將在后面章節討論的機會主義[11]和內心世界[149]。最有趣和最復雜的ANIMAT研究之一涉及基于大腦神經形態的機器人,是基于動物的大腦功能建模的。新千年的ANIMAT研究集中于學習中的神經網絡應用,并模仿人類的神經系統和神經過程。CPG和基于大腦的機器人是ANIMAT研究和仿生設計中比較新的流行詞匯。
以動物為原型的機器人開發不僅有助于記錄已知的自然行為,而且有助于將機器人的設計、行為和過程作為一個單一系統的融合來理解。研究者已經用各種方式應用了ANIMAT范式,我們在后面的段落中會配合案例研究討論。
1)ANIMAT中的行為建模:ANIMAT中的行為建模可以用于理解昆蟲和動物的運動的工程學和生物學機制。
(a)人工昆蟲項目。Beer、Lorenz、Baerends和Arkin分別獨立完成了將動物行為開發為由控制回路連接的交互模塊。如圖2.12所示,在Beer的人工蟑螂模型中,進食被建模為兩種行為:食欲和滿足。前一種行為是識別食物的努力,后一種行為是攝取食物的嘗試。能量水平決定人工蟑螂的覺醒與飽足程度,當它處于飽足的狀態時就不會再試圖獲取食物。運動沒有作為單獨的行為而明確地說明,它通過“邊界跟隨”和“漫游”在原地發生。Beer注意到進食(食欲和滿足)明顯比邊界跟隨優先級更高,然而如果在昆蟲覓食的路上有障礙物,那么這個順序就會反過來。然后人工蟑螂會跟隨著障礙物的邊緣過去,嘗試獲取食物。因此,這兩種行為之間的順序是可變的,并取決于環境。Baerends將這種方法命名為“行為的功能性解釋”。Beer的蟑螂和Baerends的掘土蜂和銀鷗顯示,動物行為可以被表示為一系列同時起作用的原始模塊,根據所遇到的情境,存在層級順序和/或抑制或者模塊抑制。Arkin等人設計了類似的螳螂行為解構模型并應用在了Miguel(一個Hermes-Ⅱ機器人)上。
(b)GRILLO III,跳躍機器人。浙江大學(中國杭州)的李霏等人和CRIM Lab(Polo Sant'Anna Valdera,意大利)的合作研究人員[205],從袋鼠、兔子、青蛙、蟋蟀、葉蟬和跳蚤身上獲得靈感,構建了一個50毫米×25毫米×20毫米的跳躍機器人——GRILLOⅢ,如圖2.13所示。設計考慮的是小體積、輕重量、較小的接觸面和高能效,以驅動跳躍。它們遵循半經驗關系式,這個關系式適用于毫米到厘米大小的昆蟲。


圖2.12 蟑螂的行為解構。人工蟑螂所用的傳感器是觸角傳感器和口腔傳感器,用于從環境中提取信息并與之交互。人工蟑螂能進食、移動、漫游和邊界跟隨。帶黑圈的線表示行為之間的抑制。改編自Beer[33]
這里,Fmax是昆蟲肌肉能施加的最大力,取決于接觸面,W是昆蟲的重量,l是昆蟲的特征長度。較小的特征長度使得ANIMAT的關節受力較小,確保更多的穩定性并保證通過跳躍更好地完成移動。這里,對各種昆蟲和動物的生態位都要加以利用,以對跳躍行為進行建模。GRILLOⅢ重22克,一次可以向前跳越200毫米。研究人員總結出,有了這樣一個模型,它確實補充了昆蟲如何選擇運動模式以及進化以改善自身健康的知識。

圖2.13 跳躍機器人——GRILLOⅢ,從袋鼠、兔子、青蛙、蟋蟀、葉蟬和跳蚤身上獲得靈感而開發出來。圖片來自Elsevier[205],授權許可
(c)迪士尼的步態機器人。迪士尼研究實驗室的單足跳[57,206]設計如圖2.14所示。這個單足步態機器人是獨一無二的,因為它完全依靠鋰電池運行。步態機器人通常是用液壓設計的,但是這個機器人使用了一個并行線性彈性驅動器(Linear Elastic Actuator in Parallel,LEAP)裝置,如圖2.14所示。LEAP有4個組件:編碼器、溫度傳感器、帶雙壓縮彈簧的并聯音圈驅動器和兩個能驅動做出跳躍動作的伺服電機。這款機器人仍處于研發階段,在翻倒之前,它可以跳約7秒或差不多19下,缺乏美感,頂部還有一堆電線。后續的版本將希望使用Odroid、Raspberry Pi等使其擁有更強的機上處理能力,讓機器人可以保持平衡更長時間。步態機器人的跳躍動作與《小熊維尼》動畫系列中跳跳虎的動作非常相似,盡管迪士尼尚未對此進行官方確認。

圖2.14 迪士尼的單足跳機器人,仍然處于研發階段,重2.3千克,高30.5厘米,在翻倒之前,它可以保持平衡約7秒或跳差不多19次。迪士尼粉絲們稱這個單足跳機器人讓人想起了小熊維尼最好的朋友跳跳虎,盡管迪士尼還沒有發表任何官方聲明
(d)兩足和四足行走的機器人:中樞模式發生器(CPG)是一種在中樞神經系統之上建模的振蕩神經元電路,它產生并控制與已知的動物/人類運動模式相似的節律性運動過程。在自然界中,這些過程是在有機體內部進行的,沒有任何來自四肢、其他肌肉或任何其他運動控制的感覺輸入,而且被認為是負責咀嚼、呼吸、消化和運動的。運動的這種節奏性過程已經在貓、狗和兔子身上得到證實,而且也被認為存在于人類的運動中。CPG可以說類似于鐘擺,以恒定的頻率產生正弦信號。模式發生器對于模擬涉及兩個或兩個以上的運動過程的已知的生物運動功能是有用的,這樣每個過程就會以串行順序依次跟隨。因此,為了設計一個動態問題的CPG解決方案,研究人員設計了一系列以串行順序工作的基元來實現一個生物過程(如行走或呼吸)。
CPG曾被用于設計步行機器人以作為手臂機器人的擴展,在逆向運動學原理之上建模。這被發現是難處理的和資源密集型的技術問題,并且通常是一個緩慢的過程,因為機載微處理器需要通過計算類人機器人的每一個手臂/腿的延伸來計算它的下一個位置,其運動與人類運動完全不同。如果從行為的角度解決同樣的問題,將“行走”考慮為一種來自“前進”和“平衡”的原始運動行為的自然發生行為,而不是明確地編寫一串代碼,這有助于顯著提高性能。應用CPG的仿生設計對于雙足和四足移動是一個很好的選擇,也讓設計變得簡單。生物過程讓數學建模落在了空處,但是可以從原始行為來認真地設計。
如圖2.15所示,Matos和Santos[222]通過讓“平衡運動”“屈曲運動”和“羅盤運動”這三個運動基元同時工作,設計了DARWIN機器人的行走。
CPG源安裝在兩足機器人靠近頭部的位置,為移動產生周期性運動動作。來自放置在四肢上的傳感器的反饋,通過修改CPG生成的模式以幫助適應環境。
2)ANIMAT作為小白鼠:ANIMAT為探索動物行為提供了一個現成的平臺,有助于推算在之后階段可能會用于人類的模型,也有助于理解動物心理學和運動學。在演示、教學和研究方面,與豚鼠和兔子相比,ANIMAT是一個更便宜、更高效、更合乎道德的選擇。

圖2.15 兩足運動是CPG的一種新型應用。Matos和Santos[222]使用運動基元——a)平衡運動;b)屈曲運動;c)羅盤運動。Matos和Santos,已經能夠使用DARWIN機器人展示行走了。圖片來自Elsevier,授權使用
(a)從嚙齒類動物到機器人,WR-3機器人和iRAT:以下兩個例子都是直接來自老鼠的靈感,幫助構建了老鼠的心理學和運動學模型,從而有助于開發用于藥物測試的實驗測試臺。東京早稻田大學的Ishii等人在已經制作出了類鼠機器人,首先是WM-6[161],之后是更精良的WR-3[151,162],如圖2.16所示。基于老鼠建模,用來誘發真實老鼠的壓力與抑郁,從而創建可以用于新藥測試的心理狀況實例。為了模仿老鼠的動態學和生物工程學,該機器人有14個活動自由度,其中12個用于模仿老鼠行為,另外2個活動輪裝備在其臀部。這個研究試圖探討壓力的心理刺激和導致應激易感性的精神障礙對老鼠體內平衡的影響。WR-3是為攻擊和追逐行為而開發的,作為一個實驗,它被放入3周大的老鼠群樣本中,并記錄下老鼠的行為模式和生理上的刺激反應。老鼠、豚鼠、兔子和倉鼠常用于實驗室試驗,這些試驗的結果可推及人類,讓進一步的人體試驗可以在類似條件下進行。為了誘發壓力和抑郁,老鼠的嗅覺能力被切斷或讓其被迫經歷極端的身體不適,如長時間的游泳,其他的替代方法還有基因改造和環境壓力,然而,這些方法都不能重現類人的抑郁。利用WR-3機器人進行的實驗中,則實時重現了人類經常發生的壓力、恥辱感和抑郁的發展過程。Ishii等人在兩組12只老鼠上進行了實驗。第一組老鼠持續受到機器鼠的攻擊行為騷擾,而第二組老鼠則是只要移動就會受到機器鼠的攻擊。對該研究進行量化的一般經驗法則是,抑郁的老鼠會表現出行動遲緩。而該研究發現,在前幾周有被騷擾史的老鼠受到間歇性攻擊時,會產生最高程度的抑郁。運用這些方法聯系上人類的情況,嘗試找到膿毒癥、燒傷和創傷的治療方法。如此調整臨床試驗也有效地降低了此類試驗的成本。此研究的進一步目標是把此類試驗擴展到精神障礙領域(如精神分裂癥和焦慮癥)。WR-3是早稻田大學“Mental Model Robot”小組在過去17年里對老鼠與機器人交互的研究的延續。

圖2.16 WR-3機器人,靈感來自老鼠,Ishii與合作研究人員在早稻田大學做的早期研究。Taylor & Francis Ltd(www.tandfonline.com)授權轉載[162]
類似的一個項目是iRat,名稱取自Intelligent Rat ANIMAT Technology[28]的首字母。如圖2.17所示,它是作為研究老鼠對人工老鼠的反應的一個工具在昆士蘭大學被開發出來的。研究發現這些老鼠會小心翼翼地接近它們的機器人伙伴,并與之互動。研究人員提出研究iRAT與真實老鼠之間的競爭與合作行為。iRAT已經配合RatSLAM一起使用,RatSLAM是來自生物靈感的一個SLAM系統,架構在控制大鼠大腦導航的神經過程的認知機制上。RatSLAM的優點是可以很好地處理低分辨率和低強度的剖面可視化數據。

圖2.17 iRAT(Intelligent Rat ANIMAT Technology[28])是一個人工老鼠,被用于操縱老鼠行為,作為機器-動物交互,也用于實施RatSLAM。Springer授權轉載
人們對基于大腦的模型和仿生認知機器人[56]的熱情越來越高。成人大腦重1300克到1400克,有約1011個神經元,它的復雜性使得任何試圖復制它的嘗試都只能望而卻步。測量動物大腦信息流和時序目前也還沒有可能,這增加了任何直接嘗試基于大腦的工作方式設計機器人的難度。然而,利用間接手段,像WR-3和iRAT/RatSLAM這樣的項目已經嘗試將嚙齒動物的行為與大腦功能直接聯系起來。OpenWorm項目[81,103]已經把這個問題交給了公民機器人專家,這是一種新的嘗試,旨在將大腦神經連接模型的眾包、設計和編碼集中起來。這樣的項目為不久的將來提供了機會,因為融入了現實世界,感官刺激是動物所經歷的,因此在神經網絡中研究信息流成為可能。基于大腦的機器人中的智能體設計可以通過三種方式來辨別[189]。
(1)根據這個研究領域的定義,認知機器人的基于大腦的模型與生物認知一起發揮作用,這作為測試大腦功能(如操作性條件反射、恐懼條件反射和技能習得)理論的一種手段,幫助我們更好地理解適應行為、學習和記憶,如我們在WR-3項目中所看到的。
(2)第二種類型是使用已知的神經地圖來設計機器人,讓它完成更多與人工智能相關的工作,如地圖制作、定位和導航。Damper和其合作研究者為Autonomous Robot Based on Inspirations from Biology(ARBIB)[82,83](以著名的控制論和神經學家Michael Arbib的名字命名)項目設計了一個人工生物,這個人工生物能夠應用使用了中樞模式發生器(CPG)的人工神經系統學習并適應環境。ARBIB是在經典條件反射之上建模,并證明了隨著經驗的積累,行為會有所改善。其他的例子還有來自iRAT的RatSLAM算法,利用老鼠的連接體在SLAM算法上進行改進。類似地還有OpenWorm項目[81,103,216],開始于2011年,模擬線蟲(秀麗隱桿線蟲)由302個神經元組成的神經網絡,形成6393個突觸連接體。這幫助開發了需要95個肌肉細胞的運動模型。這個代碼被下載到一個有兩個輪子的小樂高機器人上,用來演示簡單的避障過程,機器蟲的鼻子神經元被機器人上的聲吶傳感器取代。可以看出,樂高機器人在某種程度上復制了線蟲的行為:如果機器人距離障礙物不到20厘米,聲吶的刺激會讓機器人停止下來。一旦停止,從觸覺傳感器傳回的反饋會幫助機器人決定前進或者后退。在其他實驗中,也可以看到在聲音強度高于一個特定閾值時,這個機器人就會被“引誘”著朝著聲源移動。值得注意的是,這些簡單的行為都是源于機器蟲的連接體,沒有其他編碼或任何行為的基元創建。因此將Open-Worm連接體模型上升到人類大腦,在未來有著光明的前景。
(3)第三種類型是試圖復制特定的感知過程,特別是大腦的視覺或體感過程,來設計機器人。例如,為了方便基于大腦的機器人Darwin IX(如圖2.18所示)的體感感知,在它身上裝配了一組由聚酰胺條組成的“胡須”陣列,這些“胡須”排列成行或列,在彎曲時發出信號[225]。按列排列的“胡須”模擬了墻壁跟隨和躲避行為中的人工神經系統,與貓、刺猬等動物的類似能力相似。

圖2.18 帶胡須的DARWIN IX。達爾文系列機器人生產于2005—2007年,被作為基于大腦的機器人技術的試驗臺。在這個實驗里,Darwin IX最初是希望實現使用它的“胡須”作為新型觸摸傳感器完成避障和墻壁跟隨——就像在貓、刺猬等動物身上看到的那樣。還希望它在遇到高反射時能停止并返回,反射是通過它向下指向的紅外傳感器檢測到的,研究人員將這種行為稱為“足底電擊”。這些由高反射材料制成的“足底電擊”裝置被放置在如圖所示位置,并且機器人會在本地環境中進行訓練。之后,當“足部電擊”被移走后,機器人仍然會根據條件反射做出反應,避開這些區域。該機器人的模擬神經系統由17個神經區域組成,含1101個神經單元和大約8400個突觸連接。圖片來自Krichmar[189],Elsevier許可使用
擬人模型和基于大腦的機器人似乎殊途同歸于計算神經科學,而計算神經科學可以說是神經生物學建模(目的是重建動物神經網絡)和通過監督和/或非監督學習增強的并行分布式過程的折中。然而,缺點很多:①大腦-身體平衡缺乏關注,因為研究要么過于關注大腦功能和神經設計,要么則基于較低層次的行為開發了智能體,又預期會出現腦的高級功能。②還沒有顯示出高度并發性的認知機器人,擁有最先進視覺系統的認知機器人則沒有足夠好的軀體感覺系統或嗅覺感知系統,感覺系統之間也沒有無縫的集成。③ANIMAT模型不允許任何建模形態計算的嘗試。在動物中,身體系統在不同的感覺節點持續進行計算,并通過中樞神經系統傳輸到大腦。這還沒有被復制到人工領域。④最后,ANIMAT模型沒有考慮機器人的思維能力,而相反,認知機器人則依賴于神經地圖和大腦功能,但也沒有考慮主體的獨特經驗能力,因此不足以展現意識。這個主題會在第9章進一步討論。
(b)蛇形機器人:蛇形機器人由許多相互連接的模塊化關節組成,并通過CPG設計,如圖2.19所示。這種蠑螈的ANIMAT模型已經在瑞士洛桑的EPFL實驗室被開發出來,并希望能夠為脊髓損傷患者提供一個運動學模型,幫助其電刺激治療。

圖2.19 蛇形機器人。由許多相互連接的CPG模塊組成。圖片來自wikipedia.org
3)有組織的團體和群體中的社群行為研究:ANIMAT為我們提供了理解和探索動物-機器人社群中如合作、內聚、適應這樣的社群行為的機會,這被證明是群體機器人的一個福音。在下面的兩個場景中,第一個場景里面機器人為一群鴨子提供領導力;而在第二種中,機器人蟑螂在一個蟑螂群體中找到了社會認同感,反過來在修正群體行為方面發揮作用。值得注意的是,與WR-3不同,這兩個項目并沒有努力追求視覺效果良好的機器人模型,只是模仿其中一個目標物種,即鴨子和蟑螂。
(a)Robotic Sheepdog項目:Robotic Sheepdog項目[335]是Cam-eron和他在牛津大學的合作研究者的創意,這是對動物交互機器人的首次研究。該項目的目標是構建和編程一個自主機器人以放牧一群鴨子。機器人會展示領導力,把一群鴨子聚集在一起,并領著它們去往一個已知的安全區域。這個項目探索了動物、昆蟲和鳥類因為收集食物、躲避捕食者、社會凝聚力、以相同或相似的地理位置作為目標點、外貌、筑巢等而形成群體的一般趨向性。整個系統如圖2.20所示,由一個定制的探測車、兩個工作站和一個頭頂攝像頭組成。探測車的速度為1~2米每秒,大約是鴨子的兩倍,它需要將鴨子群作為一個整體而不是單個分開對待,同時也要避開障礙物。這個項目顯示了使用機器人完成行為仿真可以作為一個合適的設計工具,這種方法可以很容易地用于動物-機器人交互。

圖2.20 Robotic Sheepdog項目。來自Vaughan等[335],Elsevier許可使用
(b)INSBOT:蟑螂群體中的移動機器人。因為ANIMAT的靈感來自動物,它們應該能夠被動物社群所接受。由于Robotic Sheepdog項目是構建在鴨子的條件反應基礎上的,而且機器人能夠有效地驅趕鴨群,所以類似社群中的其他行為應該也是貌似合理的。Halloy等人[139,296]在一個跨越三個國家的4個實驗室的合作中,通過在一個蟑螂社群中引入一些機器人對其進行了探索。如圖2.21所示的INSBOT,被從雄性蟑螂身上采集的信息素處理過的濾紙包裹著,然后引入蟑螂群體。INSBOT上的信息素誘發了友善的接受行為,這在蟑螂的生理機能中是根深蒂固的。Halloy等人準備了兩個居所,一個是黑暗的,另一個是明亮的。眾所周知,蟑螂喜歡黑暗的條件。但是INSBOT沒有這樣的偏好。蟑螂群體在73%的時間中偏好比較黑暗的居所,但是在引入了INSBOT后,收集到的數據發生了根本性的變化,蟑螂-INSBOT社群只有在39%的時間中偏好黑暗居所——差異達到34%。這不僅表明蟑螂已經接受了INSBOT進入它們的社群,也證實了群體行為的一致性,INSBOT被當作蟑螂一樣對待。動物機器人集體動態和凝聚力已經引起了生態學家[87]和群機器人研究者的興趣。

圖2.21 蟑螂群體中的INSBOT。INSBOT被從雄性蟑螂身上采集的信息素處理過的濾紙包裹著,制作得并不像真的蟑螂,因為蟑螂的所有社群交互都是基于信息素的而非基于視覺的。圖片來自Elsevier[296],授權許可
4)行為模型的既有實現:可以使用ANIMAT方法來實驗驗證決定動物社群交互的最優性、食餌-捕食動態、信號發送、博弈論方面的控制模型。
為了支持基于行為的機器人的新架構范式,Brooks在麻省理工學院利用行為分層設計了他的機器人生物,在行為分層中每種行為都被設計為一個有限狀態模型。運動是這些生物的基礎,避障是最原始的行為,隨后的漫游是第2層,目標導向的運動是第3層。每個行為層都是一個完整的循環,從傳感器讀數到驅動,這些層之間的相互作用被限制為零。但是,更高的層可以支持、規避、中斷或覆蓋較低的層。Brooks稱他的人工生物為Mobots(Mobile Robots,移動機器人),他和他的團隊是根據以下原則進行設計的:
·人工生物必須相應地處理動態環境的變化。
·人工生物應該足夠健壯以承受其環境。
·人工生物應該能夠在多個目標之間完成協調。
·人工生物應該表現出它存在的目的,并采取行動以改變其世界。
Brooks的機器人生物是新的人工智能機器人的里程碑,這將在接下來的幾節和第3章中進行討論。這個新范式的突出特點是缺乏計劃模塊,甚至沒有環境建模和源自大自然的直接靈感。這與傳統已知的人工智能技術(如Nilsson為Shakey的移動而運用的基于網格的方法)完全不同。Brooks和他的合作研究者的全部研究包含許多機器人:Toto、Allen、Herbert、Seymour、Tito、Genghis、Labnav、Squirt以及其他。如圖2.22所示,Herbert是為辦公室工作空間而設計的。它的主要工作是四處漫游,用它的長手臂去搜集那些無法輕松拿到的空飲料罐。Genghis被設計成一個六條腿的機器人,它通過原始和簡單行為的快速同步方法來行走。Squirt是微型機器人制造的早期嘗試,Brooks幽默地稱它為“世界上最大的一立方英寸機器人”。

圖2.22 Herbert。它的頂部有一個機械臂,其目標是在一個雜亂的環境中尋找百事可樂罐并收集它們。圖片來自wikipedia.org,CC0 1.0通用公共領域專用許可
Cog(如圖2.23所示)是一個根據感覺運動原理設計的類人機器人。然而,這個趨勢并沒有成為真正的動力,所有現代最先進的類人機器人(如ASIMO、PR2和NAO)都有感覺運動和具身主義的信息。

圖2.23 Cog是一個根據感覺運動原理[92]設計的類人半身機器人。圖片來自wikipedia.org,CC0 1.0通用公共領域專用許可
完全相反的是,洛斯阿拉莫斯實驗室的Hasslacher和Tilden開發了一個完全不一樣的模型[145],在這個模型里是生存決定行為和移動。他們的人工生物叫作BIOMORPHS(BIOlogical MORPHology,生物形態學),依照在一個之前未知和明顯不友好的地形中生存的出發點而設計。這些機器需要遵循以下三個規則:
·機器必須保障其存在。
·機器必須獲取比其消耗更多的能量。
·機器必須有(定向)運動能力。
BIOMORPHS的設計是為了生存,而不是執行一組目標導向的任務。太陽能是這些機器人的燃料,制造它們時使用了BEAM(Biology、Electronics、Aesthetics、Mechanics,生物學、電子學、美學、機械學)技術。BEAM利用微型太陽能電池來模擬生物神經元,并產生微電機和LED所需的極少量電力。步態機器人是BIOMORPHS最流行的類型,Hasslacher和Tilden還設計了兩條腿、四條腿、六條腿的變體。BIOMORPHS不僅是最小的主體,而且試圖創造生命,這些機器人的控制核心包括一個人工神經系統,一個充當大腦功能的神經層。因此,它有豐富的行為范圍,并表現出卓越的學習能力。
5)對生物過程建模:食菌者能夠消化真菌并獲得能量。這種通過消化有機物質來產生運行動力的能量自主,是Gastrobot和Ecobot系列機器人的設計靈感來源。這些機器人通過在微生物燃料電池(Microbial Fuel Cell,MFC)中消化有機物質來產生能量。自2000年Wilkinson的Gastrobot項目[353]開始,以及較新的項目如Ecobot-Ⅲ和Ecobot-Ⅳ都已經展現了真實的能量自主。
Gastronome——Wilkinson的Gastrobot機器人,可以在現實世界中收集食物,通過咀嚼把食物分解成更小的可消化的塊,然后把它攝入人工胃,在胃里通過一個受控的化學反應產生能量,而廢物則作為排泄物排出。Gastronome由MFC供能,MFC通過微生物的作用,可以直接將各種食物成分和有機廢物的化學能直接轉化為電能。Wilkinson為該機器人確定了6個不同的操作:
·覓食,尋找和辨別食物
·收獲,收集食物
·咀嚼,咀嚼以把食物分解成更小的塊
·攝入,吞咽到人工胃
·消化,提取能量
·排便,排泄廢物
它的運動表現為趨光行為。然而,效率相當低,大約只有1.56%,在之后的版本里也沒有顯著改善,這也阻礙了它在商業領域(如家用機器人、辦公機器人等)的應用。這是在人工干預很少或沒有干預的情況下實現能源自主的第一步,但它仍然需要使用機載電池,需要從主電源進行初始充電。為了提高其性能和通用性,先進一些的設計應該有一系列傳感器,實現視覺和嗅覺感知以進行覓食和收獲,實現味覺感知以避免攝入可能對微生物工作有害的食物。
機器人能從本地環境中的自然資源中維持能量需要。能量自主在不久的將來的一些前景是:由落葉或水果供能的水果采摘機器人或土壤檢測機器人;由海草和藻類供能的海洋探索機器人模塊;以水果、蔬菜和草為燃料的森林探索機器人等。
根據設計范式,這些機器人通過微生物釋放的能量供能,機器人的收集機制則為微生物提供食物,這是一種非生物和生物之間獨特的相互依存關系,被稱為人工共生,共生機器人(SymBot)。
Ecobot系列機器人——Ecobot-Ⅰ(2002年)、Ecobot-Ⅱ(2004年)、Ecobot-Ⅲ(2010年,如圖2.24所示)和Ecobot-Ⅳ(進行中)是布里斯托機器人實驗室和布里斯托生物能源中心的Ieropoulos和他的合作者們為實現能量自主而制作的一系列機器人。Ecobots沒有機載動力源(如液態燃料或電池),它們移動前也不需要從外部電源充電。相反,它們近乎能量自主,通過收集廢料從環境中提取能量。Ecobot-Ⅰ重960克,以糖為燃料,通過以大腸桿菌為陽極、鐵素體為陰極的氧化作用來維持。Ecobot-Ⅱ更為先進,它使用污泥微生物,能夠通過蠅類和腐爛的水果合成能量。Ecobot-Ⅱ可以說是第一個實現能量自主,也符合人工共生的機器人。Ecobot-Ⅳ是這個系列中最新的也是正在研制中的機器人,旨在研究微型化設計的效果。

圖2.24 布里斯托機器人實驗室研發的ECOBOT III。能量自主,能夠消化有機物質來獲得運行能量。圖片來自wikipedia.org,SA 3.0授權許可
各種各樣的特殊ANIMAT可以通過它們的概念設計來辨別,在實現、軟件和平臺發生變化的情況下,機器人仍然會保持它們的抽象概念。例如,對于ARBIB,機器人在各種硬件實現上保留了它的CPG模型和神經模擬器(如圖2.25所示Zilog上的ARM或Khepera avatar)。其他這類例子如:Stiquito,不管硬件如何變化,其形狀記憶特征維持不變;以獨特的六足設計為特征的R-Hex,已經有了很多實現;以及擁有圓形底座、內置筆記本電腦和時髦的運動傳感器(如Microsoft Kinect或ASUS Xtion)的Turtlebot,已經有了三個正式版本,并為一些更新的機器人設計提供了靈感。

圖2.25 ARBIB(Autonomous Robot Based on Inspirations from Biology,基于生物靈感的自主機器人)。這里所示的為Zilog Z180 avatar。圖片出自Dampier等[83],Elsevier授權使用
根據定義,ANIMAT研究是人工智能與動物智能的交叉領域,如圖2.26所示,它受感覺運動交互的支配,依賴于較低級別的行為反應。友好的擬人化特征往往有助于機器人融入人類社會,如圖2.27所示,但這對于類人的認知過程是不夠的。第3章將簡要討論簡單的感覺運動設計如何也能表現與人類相似的情感和價值觀。

圖2.26 智能的三個領域。(1)動物和人類智能的融合可能是最常見的,并在馴養動物、利用動物力量(如騎馬等)等方面發揮作用。(2)ANIMAT研究是人工智能與動物智能的交叉領域。(3)人類智能與人工智能在聊天機器人、類人機器人和倫理責任(將在第8章中討論)中協同作用。(4)所有這三個領域的交叉則是神經形態和基于大腦的機器人技術的目標。本表改編自Yampolskiy[370]

圖2.27 圣誕節禮物(Toby,2/4)。爸爸把Toby帶到Walker家。來自作者的Toby系列卡通(2/4),SA 4.0授權許可
[1] Wilson將Walter的海龜視為“半人工動物”,因為它們缺少學習能力。