- 機器意識:人工智能如何為機器人裝上大腦
- (印)阿卡普拉沃·包米克
- 3388字
- 2021-07-23 16:15:27
2.3.2 自主AI智能體設計原則
Toda的模型從廣義來說是構建在感官運動原則的基礎上的,食菌者缺乏明顯的大腦活動能力,所以盡管它們是非常優秀的鈾挖掘者,但永遠不會聽到它們吹口哨或一起歌唱來活躍氣氛。畢竟,食菌者模型沒有考慮情感和動機。大約20年后,首先是Braitenberg,然后是Pfeifer,用簡單的感官運動原則設計了情感(即愛、恨、吸引等)模型,并證明反應模型也會促生情感和價值體系。這就產生了問題:自主、情感和價值體系就意味著智能嗎?食菌者和它之后的改進是智能嗎?答案將引導我們去探究具身認知的典型特征[354]。
1.認知是情境性的。與一般概念上的認知不同,具身認知是一種情境性活動。智能體與真實世界環境交互,然后由感知與行動配對而產生認知。情境性認知包含一個連續的過程,在這個過程中感知信息連續在傳感器中流動,促生運動行為,進而以與任務相關的方式改變環境。走路、擰緊螺絲、打開一盞燈都是一些情境性認知的例子。Wilson指出很大一部分人類認知是“離線”進行的,沒有任何與任務相關的輸入和輸出,當然也就沒有任何明顯的環境參與,從定義上來講就是非情境性的。創造性思維過程(如寫信或編寫音符)就是例子。
2.認知是有時間壓力的。具身認知經常伴隨著“實時”和“運行時”這樣的術語。因為具身認知是情境性的,它要求來自環境的實時響應。如果沒有滿足時間壓力,就會導致“表征瓶頸”,并且如果沒有連續的進化響應,系統將無法構建起一個完整的符號模型。基于行為的方法是對這些瓶頸的一種補救,它通過將實時的情境性行動視為認知活動的基礎,進而動態地生成適合于情境的行動,從而顯著地減輕時間壓力。然而,這樣的情境性認知模型不能被擴展,因此沒辦法促生出人類認知模型。
3.主體將認知工作轉移到環境中。情境性主體嘗試以策略方式利用環境,通過控制環境來處理手頭的工作,而不是完全形成對相關行為的系統響應。例如,指南針導航利用了地球的磁場排列,從而能夠找到正確的方向。類似地,在裝配任務中,零件的排列或使用幾乎是按照預期成品的順序和空間關系進行的。這些轉移發生的原因是,通常存在信息處理的限制、注意力的物理限制以及智能體可用的工作內存的限制。心理學和行為主義的概念證實了這一點,在本章后面可以看到。
4.環境是認知系統的一部分。認知不是大腦的一種活動,而是分布于主體與情境中(當它們交互時),是持續性的智能體-環境交互的結果。因此,情境和情境性主體是一個統一的系統。相似的觀點已經由Uexkull從生物學的角度表達出來了,我們也會在后面討論。
5.認知是為了行動。不像傳統人工智能的認知,具身認知總是以行動為導向的。感知是動態的、實時的,并且與運動行動同時發生。
6.離線認知是基于自身的。當不處于環境中時,解耦主體中的認知過程是由類似于感覺信息處理和運動控制的仿真的心智結構驅動的。內心世界的概念將會在后面有意識的主體的內容中詳細討論。
因此,食菌者可以被認為有最基本的認知行為。然而,就這種主體的心理狀態而言,這個模型還是不完整的,所實現的認知過程的層次也非常低。極具說服力的一個觀點是,思維必須被理解為智能體本身不斷與環境交互的一個屬性。生物進化見證了從單細胞有機體的純粹反應,到人類的認知思維的成長。也就是說,我們的提升是從具有感知傳感和運動的基礎技能的生物開始的,這些生物的認知更多是由直接、實時與環境的交互組成,而非大腦互動。因此,從這一論點來說,感官運動處理是一種底層智能行為。食菌者揭示了一系列開發人工自主AI智能體的設計原則和指導方針[262]:
1.完全的智能體,也就是“食菌者原則”。具身AI智能體應該是:
(a)自主的。具有在沒有人類干預的情況下在真實世界中執行指派的任務的能力。
(b)自我維持的。它們能自己維持運行很長時間。
(c)具身的。在真實世界中,它們必須被設計為動態系統。盡管仿真有用,但卻不足以了解智能體世界的動態。
(d)情境的。智能體世界的動態是從智能體的角度進行控制的,由經驗去充實。
“食菌者原則”與傳統的人工智能不一致,主體是由其實體和情境定義的。然而,完全滿足以上四個標準的主體目前還不存在。
2.生態位。第一條原則只有在智能體成為世界中的生態位時才有意義。AI智能體通常缺乏人類智能所具有的普遍性和廣泛性,而且常常是為特定的生態位而設計的。行為的執行是通過智能體與世界交互提供的能力而在真實世界中完成。例如,線跟蹤器不會注意到任何像“向前移動”這樣的命令,只有它的傳感器能夠感知到它應該跟隨的黑/白線時才會有所動作。類似地,多機器人系統中的群集算法是為考慮足夠大的群集被設計出來的,而且被發現在機器人數量比較少時無效。生態位可以被看作是將智能體與本地環境緊密聯系在一起的關系。它的概念與傳統人工智能形成了鮮明的對比,它不再是程序員編碼的計算機程序,智能被定義為智能體和本地環境的交互作用。
3.并行過程。源于生物學的觀察證實,認知是一系列并行過程的重疊。這些過程彼此并行運行,松散結合,異步而且只需少量或者不需要集中控制。缺乏集中控制會將表現降低為僅僅是反射性的運動。而這成了一個爭論的主題:在缺乏集中控制的情況下,是否能真正開發出更高層次的類人認知。對人類而言,我們的認知能力是五官的重疊,再結合大腦的記憶和推理,很明顯的是,我們參與的各種各樣的活動比那些昆蟲和鼠類等要更多樣化。但是,如我將在之后討論的,這個原則已經非常成功了,而且促進了基于行為的方法在設計移動機器人方面的發展。
4.學習機制和“價值原則”。“價值原則”從廣義上來說是指智能體能夠判斷什么對于自己有利,即有一組價值觀。隱式價值觀可以通過監督學習或調節傳感器響應來開發。
5.感官運動協調。在前面的兩個原則中提出的初級層次的認知(如移動),將會用感官運動模型來體現。這意味著分類、感知和記憶應該被看作感官運動的協調,更多依賴于反應表現而非獨立模塊。
6.生態平衡。為了讓每一個人工智能體有最優表現,傳感器、處理和行動之間需要有一個同步。例如,裝配有精密復雜運動傳感器的機器人不能有低的處理能力(如搭配初級PIC微處理器)。否則會增加時滯和瓶頸,影響其性能。
7.良好的設計,用于具身智能體發掘智能體世界交互及生態位。假設一個機器人的任務是沿逆時針方向圍繞一個5米見方的正方形運動。這個工作可以通過一個程序來完成,即讓該機器人每5米直角轉彎一次。或者用另一個方法,用一個光傳感器和一個根據機器人軌跡制作的黑條來實現,編程為每當這個黑條結束時機器人進行直角轉彎。第一個方法會因為摩擦和其他阻力而產生誤差,在幾次運行之后開始給出錯誤的軌跡。但是這個問題的第二個解決方案是與本地環境緊密聯系在一起的,并且總是會給出正確的軌跡,直到機載電池耗盡。這個原則比表面看起來更有用,特別是在群體機器人中,這將會在第6章討論。
2.4節將討論源于自然界的靈感是如何塑造基于智能體的機器人的。
Moravec悖論
Moravec觀察到,設計和開發基本的感官運動技能需要比讓其獲得高級邏輯推理能力更廣泛的資源。可以看到,讓人工主體玩跳棋游戲或者回應智商測試,要比讓其復制一歲嬰兒的感知和運動技能容易得多(示例如圖2.3所示)。

圖2.3 停車場問題。停著的車下面的數字是多少?要解答這個相當簡單的問題,用人類的能力只需把這個圖翻轉過來即可,而算法途徑卻失敗了。汽車圖像為在pixbay上的CC圖像
這個悖論是因為我們試圖通過編程途徑去重建生物智能實體而產生的。生物系統規則,如人類認知,在數十億年的進化過程中通過與環境的交互不斷進化,已經編碼到我們的遺傳物質之中。我們仍然不知道大多數這些過程是如何工作的,并且訴諸近似的數學模型來在人工領域中復制它們。一些研究者確實指出,爭論的焦點在于人工智能研究者、哲學家和心理學家在智能上還未達成一致的定義。然而,人類大腦與人工智能的對比可以給我們一些啟示。在人類大腦中,連接的神經元儲存記憶,通過從外部世界廣泛接收的感覺來分配信息和生成想法,并且通常會聯系從多年學習中獲得的記憶和刺激反應,從而對任何給定的情境提供不同的響應。我們對外部世界的感知是由感覺器官決定的,它們會影響我們的精神狀態。另一方面,CPU是在數字邏輯上構建起來的,遵循算法規則。人類感知的簡單方面通常不能由計算基礎解決,而這一般發生在非常初級的階段,比如一歲的嬰兒身上。而跳棋游戲或智商測試是可以通過算法方法解決的問題,因為其規則是已知的,并且可以被編程到AI智能體。
[1] 在第9章,這個爭論將從人工意識的角度進一步討論。