官术网_书友最值得收藏!

2.4.2 源自生態(tài)學(xué)的概念——視覺的獨一無二性

視覺感知在人工智能中有著特別的地位。它通常是所有人類感知中最強的部分,并形成最持久的記憶。視覺包括兩種感覺,一種是反應(yīng)式刺激(看),另一種是協(xié)商式感知,將環(huán)境中的物體和事件聯(lián)系起來(觀察)。在過去300年間各種各樣的視覺理論被提出,Berkley的經(jīng)驗論(18世紀初)、格式塔六項原則(20世紀20年代)和Gregory的自上而下分析法(1970)是視覺方向更為傳統(tǒng)的方法,這些方法中的視覺概念很大程度上依賴于已知的世界視覺呈現(xiàn)。因此,在傳統(tǒng)觀點中,視覺基于我們的環(huán)境、已知的呈現(xiàn)和記憶主動地構(gòu)建我們對現(xiàn)實的感知,并對環(huán)境或主體的動態(tài)或多或少保持沉默。

因為視覺不能像感覺運動那樣容易地被操縱,研究者已經(jīng)考慮其他的方法來對其建模,而圖像處理通常是一個支持工具,并被用于機器人研究。更簡單、便宜的機器人通常采用非視覺傳感器(如聲吶和紅外)來提供距離度量信息,在低層次任務(wù)和以導(dǎo)航為中心的行為中作為補充。

Gibson[121]和Marr[221]分別在20世紀80年代和20世紀90年代為將視覺作為一種生態(tài)現(xiàn)象建模提供了動力。視覺的功能是對視野內(nèi)的事物、形狀、空間和空間布局進行描述和呈現(xiàn),并幫助獲取更高層次的信息,如閱讀路標(biāo)。Gibson提出視覺不僅僅局限于這樣的認知過程,還常常是協(xié)調(diào)運動的機制。Gibson的自下而上法是第一個在心理學(xué)上將運動與感知聯(lián)系起來的方法,與傳統(tǒng)的視覺理論非常不同。Gibson不支持行為主義與內(nèi)部呈現(xiàn),并且發(fā)展了光流的概念。同樣,Marr也拒絕圖像處理,并認為視覺是信息流而不是孤立的獨立現(xiàn)象之間的相互聯(lián)系。

Gibson的方法是基于信息流的,把環(huán)境和觀察者看作“不可分的一對”。環(huán)境應(yīng)該從生態(tài)方面(媒介、物質(zhì)和表面等)去建模而不應(yīng)該被建模為坐標(biāo)系,因為動物感知的是前者而不是后者。視覺基于光流陣建模,它是由匯聚在一個給定點上的所有光線構(gòu)成的。光流陣在每一點上都不一樣,因此對于運動中的觀察者來說,陣列在不斷地變化,從而創(chuàng)建了一個光信息流場。由一個移動的觀察者同時采樣的光流陣中的變換指定了移動路徑,而不是更傳統(tǒng)的用于起點和終點等的坐標(biāo)系。光流包含了關(guān)于表面布局和主體運動的信息。Gibson的模型闡明,主體所感知到的環(huán)境屬性通常取決于觀察者的物理和生理能力。例如:(1)可供人類坐的一定高度、大小和傾斜度的表面以及那些可供踩踏的不同高度、大小的表面;(2)可供捕捉的以一定速度移動的物體,其他則太快或者太慢等。值得注意的是,這些行動都是源于人類心理學(xué)的普遍反應(yīng),而不是從經(jīng)驗等學(xué)習(xí)到的。對運動的這些可能性的感知是必要的,它們也包含在光流陣中。開始移動就是收縮肌肉,以讓前面的光流陣流出去,停止移動就是讓這個流動停止。因此,智能體的內(nèi)力是光流的函數(shù)[98]

這里,F(xiàn)internal是內(nèi)力,flow是光流。利用這些控制法則,并將生態(tài)心理學(xué)擴展到機器人領(lǐng)域,在機器人與障礙物和人類在實時動態(tài)環(huán)境中進行交互方面,已經(jīng)取得了可喜的成果。這種激進的視覺理論很明顯缺乏對光流或者內(nèi)力的量化,因為它依賴于情境和主體等。然而,這的確暗示了一些想法,即移動不是機械的牛頓力學(xué),而是由感知驅(qū)動的,而感知是由心理和生態(tài)原因觸發(fā)的。Duchon[99]在生物學(xué)方向擴展了Gibson的框架,為生態(tài)機器人總結(jié)了以下原則:

1.智能體與環(huán)境是“不可分的”,它們被視為一個系統(tǒng)。

2.智能體的行為產(chǎn)生于系統(tǒng)的動態(tài)。

3.根據(jù)感知和行動之間的關(guān)系,智能體的任務(wù)是將可用信息映射到控制,以實現(xiàn)系統(tǒng)的期望狀態(tài)。

4.環(huán)境提供信息和暗示,以此來鼓勵適應(yīng)性行為。

5.因為智能體是環(huán)境的一部分,所以不需要先驗的或?qū)崟r的3D地圖或模型。

Duchon利用以上原則演示了機器人導(dǎo)航與避障。

因為認知不是發(fā)生在智能體“內(nèi)部”的事物,而是歸結(jié)于其具身,主體在環(huán)境中的認知在適應(yīng)性交互本身中被標(biāo)記。因此,智能體經(jīng)歷的環(huán)境不僅受到其自身主體的限制,也被限定為通過智能體的自身活動而出現(xiàn)。經(jīng)歷的世界是由智能體的生理、感知運動回路以及環(huán)境 Varela、Thompson和Rosch通過擴展Merleau-Ponty的身體現(xiàn)象學(xué)而提出了主動方法。之間的共同交互來描繪和確定的,如圖2.6所示。這意味著,智能體自身是一個活的、有經(jīng)驗的結(jié)構(gòu),也是所有認知行動的情境[333],因此感知不會發(fā)生于主體或主體內(nèi)部,而是一種行動。根據(jù)主動方法(Enactive Approach)[320],主體“帶來了”自己的認知域,并有能力對自身進行一些控制,主要是為了健康和生存。因此,智能體讓其主體與其環(huán)境直接交互。符號計算和信息模型不是認知的本質(zhì),外界事件也不能支配認知過程。認知是情境性的,它從不發(fā)生在抽象中,通過具身認知和情境認知的重疊來實現(xiàn)對行動的適應(yīng)性協(xié)調(diào)和控制。最后,經(jīng)驗對于認知和大腦的理解是很重要的。

圖2.6 主動作用是對環(huán)境的一個連續(xù)的探索過程,其中智能體的自我構(gòu)成是其身份,它在與其環(huán)境的耦合過程中是守恒的(連續(xù)箭頭)。耦合關(guān)系隨自適應(yīng)性變化而變化(虛線箭頭)。摘自Froese and Di Paolo[113]

O'Regan和Noe[259,260]提出,視覺和視覺意識確實是一種與行動緊密關(guān)聯(lián)的感覺運動活動,相比作為嚴格意義上的感覺運動對,更多的是作為一種探索性的感覺活動工作。這個探索過程是由作者所定義的“感覺運動偶發(fā)事件”的知識來調(diào)節(jié)的。這種方法強調(diào)視覺的現(xiàn)象性,而不是其更傳統(tǒng)的表征性。“感覺運動偶發(fā)事件”可以被定義為根據(jù)感知者的行動而產(chǎn)生的感覺刺激的規(guī)律性。感知者的視覺讓其知道形狀、顏色、紋理、光線和行動過程,從而幫助其理解這個已知的世界。

例如,由于視覺可以被看作三維空間的二維投影的采樣,二維的方形和三維的方塊的頂部視圖可能是一樣的,但是朝著物體細微靠近或者遠離,都會導(dǎo)致進入視網(wǎng)膜的光量變大或者縮小,這樣眼睛感知到的就會不同。另一個例子是,由于反射的光量是由每一種顏色決定的,每個色塊對應(yīng)一個獨一無二的偶然性,因此經(jīng)常表達著心理意義,如紅色的光反射值在0.4到0.5之間,反射了幾乎一半的入射輻射,所以比其他顏色更能引起視網(wǎng)膜的興奮。因此,紅色是與興奮、溫暖等相關(guān)聯(lián)的。

在智能體已經(jīng)掌握或體驗了很多次這些已知法則,即大腦如何編碼視覺屬性,以發(fā)展“感覺運動偶發(fā)事件”,并使探索性感覺(換句話說,就是對世界的主動探索)成為可能時,會產(chǎn)生視覺經(jīng)驗。正如我們所看到的,視覺與行動緊密相關(guān),它可以說是主動作用最重要的感覺能力。

[1] Varela、Thompson和Rosch通過擴展Merleau-Ponty的身體現(xiàn)象學(xué)而提出了主動方法。

主站蜘蛛池模板: 德州市| 大丰市| 蛟河市| 九寨沟县| 蓬莱市| 嵊州市| 遂宁市| 禄丰县| 武山县| 通州市| 鲁山县| 德钦县| 彭山县| 沅江市| 临颍县| 惠安县| 普兰县| 高雄县| 仲巴县| 新泰市| 绿春县| 瓦房店市| 伽师县| 定安县| 巴彦淖尔市| 灵璧县| 临澧县| 天气| 郯城县| 台山市| 邵阳县| 浦县| 潮安县| 明星| 中超| 宝山区| 陆河县| 鄂州市| 新密市| 油尖旺区| 银川市|