官术网_书友最值得收藏!

2.3 物理信號的感知

2.3.1 物理信號感知的要求和特點

正如在討論感知的定義和準(zhǔn)則時所述,物理信號感知的基本要求是能理解、能完備、能成長。能理解是指只有智能體能理解的感知內(nèi)容才能進(jìn)入智能體的描述、學(xué)習(xí)、記憶、理解、控制、行為的智能過程中,不能理解的可以暫時保存,但不能干擾智能體相關(guān)功能的發(fā)展,不能影響智能體的資源使用需求,否則只能放棄。能完備是指感知功能體系能夠在兩個維度上趨近完備。一是相對于感知對象轉(zhuǎn)化的完備,也就是學(xué)習(xí)目的的完備;二是相對于任務(wù)的完備,即完成任務(wù)所需的都已經(jīng)感知了。相對于任務(wù)的完備是在智能體進(jìn)入成熟期,即開始承擔(dān)外部智能任務(wù)后實現(xiàn)的,存在時間約束。相對于感知對象的完備是一個漸進(jìn)過程,基于智能體對該感知對象的經(jīng)驗積累。如何實現(xiàn)完備,將在2.5節(jié)討論。

物理信號感知的特點有三個:一是類型眾多,二是簡繁不一,三是模式各異。類型眾多是指信號的物理、化學(xué)、生物特征,如圖2.4所示,每個大類中還有很多小類,小類中還有更多的具體信號。簡繁不一是指感知對象的復(fù)雜程度存在巨大的差異,有的只是一個單獨的、沒有歧義的信號,有的則需要在復(fù)雜的畫面中辨識出具有意義的內(nèi)容。模式各異是指感知處理過程需要采用不同的模式。最簡單的僅需要傳感器功能就完成了全部感知過程,如數(shù)控車床及自動化生產(chǎn)線的感知,信號轉(zhuǎn)換后進(jìn)入描述區(qū)就實現(xiàn)了需要的感知功能。對于復(fù)雜的感知模式,有的需要經(jīng)由分類和組合的多次循環(huán),有的需要通過后處理在感知存儲區(qū)采用模式識別的方式發(fā)現(xiàn)后確認(rèn)。

2.3.2 物理信號感知流程分析

就感知流程而言,物理信號感知的信號來源可以區(qū)分為兩類:一是現(xiàn)場感知,二是記錄模擬信號的二次感知。所有智能體接觸的,或智能體學(xué)習(xí)、行為需要感知的實物場景都屬于現(xiàn)場感知。二次感知主要是以物理信號方式感知已經(jīng)記錄下來的音視頻、圖片、文檔等內(nèi)容。

圖2.8所示為感知流程的框架,它是前后相繼的兩個過程:分類過程和識別過程。分類過程是感知對象與感知器匹配的過程;識別過程是感知器(感知功能組)將對象辨識與組合為有意義的智能體可理解、可利用的信息,并經(jīng)過一系列有序操作,保存到記憶中。

圖2.8 感知流程框架

將感知對象匹配到特定感知器的分類過程,有三種典型模式。首先是現(xiàn)場感知通道分類模式。圖2.8(a)的分類功能由置于現(xiàn)場的傳感器功能實現(xiàn)。不同的傳感器各自感知能感知的信號:攝像機(jī)感知光和聲,溫度計感知溫度,壓力傳感器感知氣壓,霾傳感器感知空氣中的微粒,等等。多次分類的產(chǎn)生基于不同的感知優(yōu)化方式或特定的感知對象。如對于光波,采用三元色感知器為第一次分類,清晰整體物件感知器為第二次分類,模糊整體或物體部件感知器為第三次分類,簡單形狀感知器為第四次分類。而攝錄像機(jī)感知的內(nèi)容,成為二次感知的一種來源。傳感器不能感知的狀態(tài)信息,原則上放棄,只保留形狀清晰但智能體已有的感知器尚不能識別的信息保存在感知存儲區(qū)。其次是二次感知模式。有兩種不同的處置場景,一種是感知通道傳來的信號已有標(biāo)識,這種標(biāo)識若是感知功能系統(tǒng)可以分辨的,則通過標(biāo)識分配到相應(yīng)的感知器處理;另一種是沒有標(biāo)識或感知功能不能辨識的標(biāo)識,則由內(nèi)置于感知通道的分配功能,如圖2.8(a)逐次適配,直至能被一個傳感器感知,若沒有傳感器可以感知,則進(jìn)入相應(yīng)的處置環(huán)節(jié)。最后是功能組介入的分類模式。功能組介入是指在第一類模式下,在第一層或某個層,感知對象進(jìn)入的是一個功能組的最高層,則此后的感知分類由功能組執(zhí)行。功能組按內(nèi)在的層次,逐次向下分配到可感知的感知器。

在分類區(qū),還有一個特殊過程,就是感知對象直接進(jìn)入執(zhí)行環(huán)節(jié)。這樣的場景源自特定的感知目的,智能體執(zhí)行自動控制類的任務(wù),需要根據(jù)任務(wù)執(zhí)行需要,部署感知獲取特定的狀態(tài)信息,如對環(huán)境溫濕度的調(diào)整。在圖2.8(a)中,對于這類信息給出了兩條通道:一是通向執(zhí)行,二是通向識別。并不是每次這類感知都需要識別,因為這種過程是反復(fù)重復(fù)的,由任務(wù)執(zhí)行器決定識別與不識別的規(guī)則,感知功能系統(tǒng)以此規(guī)則進(jìn)行操作。

經(jīng)分類過程轉(zhuǎn)換及物理性標(biāo)識之后,感知對象進(jìn)入識別過程。圖2.8(b)的識別過程也有三種進(jìn)程,即感知微處理器、感知功能組、外部反饋。

感知微處理器的識別過程有兩類。一是對來自分類區(qū)的對象的識別。感知對象經(jīng)由分類,已經(jīng)確定應(yīng)該由給定的感知器識別,只是可能,不是確定,因為物理信號存在模糊性。傳感器能感知,并已轉(zhuǎn)換為電信號,都需要經(jīng)過如圖2.8(b)所示的識別過程。識別基于感知微處理器擁有的知識和經(jīng)驗。感知微處理器的知識庫中保存并可以使用所有“可辨識組”。所謂“可辨識組”是指同類感知器能夠分辨并已經(jīng)被智能體認(rèn)可的一個信號集合。感知微處理器以感知框為對象,一次感知,遍歷所有已知經(jīng)驗,然后決定對該框的處置。二是由后處理功能確定,來自功能組感知和其他功能系統(tǒng)對重新識別的需求。反饋識別的過程與前者一致。

感知功能組識別有兩類主要功能。一是形成場景或事件感知,對本功能組的感知微處理器識別的內(nèi)容增加相關(guān)關(guān)系的識別結(jié)果。如同一個人在連續(xù)的視頻框中的位置和動作,在同一框或相關(guān)框中可辨識對象的相互關(guān)系,如一個人與一只狗。二是辨識一個或一組感知框中存在的與功能組層次一致的識別對象的關(guān)系,或明確其關(guān)系,或組合識別對象為相似度更高、表達(dá)含義更正確的識別結(jié)果。這里的相似度是指識別對象與知識庫中的相應(yīng)對象的一致性。對一個傳感器的感知內(nèi)容添加時間、空間或所感知內(nèi)容的特定場景標(biāo)識,對一組相關(guān)傳感器根據(jù)場景組合為相關(guān)的含義組,由描述功能體系描述為智能體能理解、可使用的含義,并保存到智能體的記憶中,這些都是功能組識別的例子。

物理信號的感知依賴于傳感器的發(fā)展。所有可以利用的傳感器都應(yīng)成為智能體感知功能體系的組成部分。感知功能的增長和優(yōu)化基于知識和經(jīng)驗的積累,基于規(guī)則、流程的完善和知識庫的增加。

2.3.3 物理信號感知的示例說明

1.示例的概況及識別前置條件

感知對象:假設(shè)用于識別的是一個路況攝像頭一段記錄的一幀,含有聲音,如圖2.9所示。

感知模式:感知通道以廣播方式將信號發(fā)布,感知器平等(不分層)接收傳來的光波和聲波。

圖2.9 從圖片識別物體示例

感知器和感知器組:假定智能體已經(jīng)擁有車、樹、樓、塔、路等物體感知功能組,以及相應(yīng)的感知微處理器,如轎車、出租車、貨車、機(jī)動摩托車等;已經(jīng)擁有是否遵循交通規(guī)則、交通事故等事件感知功能組,以及相應(yīng)的感知微處理器,如交通信號燈、道路、道路交通標(biāo)識等;已經(jīng)擁有路況分析、噪聲分析等實時場景感知功能組,以及相應(yīng)的感知微處理器,如多種頻段的聲波感知器、特定車聲感知器、全路面感知器等。

知識庫:假定相關(guān)感知微處理器及感知功能組在初始、賦予的基礎(chǔ)上已經(jīng)完成了功能測試,能夠?qū)崿F(xiàn)自身知識庫中的已知對象與圖像中對應(yīng)物體或?qū)ο蟮钠ヅ洌瑩碛姓业綄?yīng)物體的匹配算法。假定知識庫已經(jīng)包含圖2.9中給出數(shù)字標(biāo)記的感知對象的相同或相似知識,擁有與特定物體識別一致的判斷及推理能力。

標(biāo)識體系:智能體擁有的標(biāo)識規(guī)則及標(biāo)識體系,主要包括感知對象相關(guān)的標(biāo)識,如來源、與前后的感知對象的位置、時間關(guān)系、感知對象的時空標(biāo)識等;以及與識別過程相關(guān)的標(biāo)識,如感知功能組、感知微處理器、使用的感知方法和知識。

符號體系:智能體確定的內(nèi)部統(tǒng)一符號體系。

2.物體識別

認(rèn)識物體是智能體提升認(rèn)知能力與承擔(dān)認(rèn)知任務(wù)的重要內(nèi)容。視頻是連續(xù)的圖片,通常一秒的視頻由20~30幀圖片構(gòu)成,因此,這里先討論從圖片中識別物體,再補充討論視頻中識別物體的其他內(nèi)容。

假定感知任務(wù)要求識別圖中所標(biāo)1、2、3、4、5的電動三輪車、出租車、貨車、樹、大樓,假定有車、樹、樓三個感知功能組分別對應(yīng),選擇從功能組高層到低層的識別模式,則感知過程分別如下。

(1)車的識別。感知對象由功能組逐次分類,直到被感知微處理器識別為止。識別過程的正確性與速度主要與功能組及感知器擁有的知識相關(guān)。假定功能組的知識庫中有關(guān)于識別車的場景知識,其中包括行駛中車輛識別大類、交通干道車輛識別子類的判定知識,并確定了該圖屬于交通干道識別場景,則相應(yīng)的車輛子類:三輪車、轎車、貨車開始啟動,繼續(xù)向下分類,最后為電動三輪車、出租車、廂式小貨車感知微處理器識別,其中出租車至少可以識別出三輛。使用的識別模式、確定識別對象的知識、識別對象在圖像中的時空坐標(biāo)均成為識別對象的標(biāo)識,并一起向描述功能區(qū)傳送。

識別的基礎(chǔ)是感知器已有的知識,車的圖像,不同類車的不同特征,同類車、不同型號的形狀差別;被識別車的場景區(qū)分能力,高層功能組知識庫的場景區(qū)分知識及判斷規(guī)則;知識與感知對象匹配的算法與/或流程,判斷規(guī)則與賦予的簡單推理能力,如距離與大小。

(2)樹的識別和樓的識別。與車的識別過程和方法一致。這里的任務(wù)只要求識別樹或樓,沒有要求識別什么樓、什么樹,所以功能組沒有必要啟用更深的層次。

假定識別過程反之,先由具體的感知微處理器識別,再經(jīng)功能組逐層組合,或者其他識別方式,其前提和識別的具體過程是一致的。

3.實時狀態(tài)識別

假定感知任務(wù)要求判別路況及噪聲。

(1)路況的識別。路況識別是道路識別功能組下層功能組—城市交通干道路況識別的下層功能組。

路況識別有兩個基礎(chǔ),一是感知功能組擁有系統(tǒng)、完整的知識庫;二是感知對象具有識別的可能。圖2.9可以識別部分路況,但有些路況不能判斷。例如,要判斷車輛速度,還需要車輛速度感知裝置;要為導(dǎo)航系統(tǒng)提供基礎(chǔ)路況,還需要更長距離的道路通行狀態(tài)。

實時路況經(jīng)由交通干道感知功能組進(jìn)行判斷。該功能組根據(jù)畫面,結(jié)合知識庫中的判斷規(guī)則,從車輛密度及通行狀態(tài)可以得出通行順暢、沒有交通事故的結(jié)論。

(2)噪聲的識別。噪聲識別是聲音識別功能組下很小但又比較簡單的類別。感知能力只需要頻率和強(qiáng)度,判別標(biāo)準(zhǔn)是關(guān)于場景的強(qiáng)度。

圖2.9自身沒有可供識別的聲源,但源自攝像機(jī),聲音只需要以視頻方式播放,并與圖片時間同步就可獲得聲源。能否識別,關(guān)鍵在于功能組的知識庫,其他方面沒有復(fù)雜性。

智能體實時狀態(tài)識別還有兩個最基本的需求:特定任務(wù)的執(zhí)行和智能體自身環(huán)境的感知。這兩類實時狀態(tài)感知的成熟度比上述兩個例子更高。只要在初始、賦予時將可以得到的成熟的知識輸入智能體,智能體則在此后的成長中通過學(xué)習(xí)機(jī)制與感知實踐持續(xù)完善,就能夠保持智能體在這個類型中的識別能力。

4.場景或事件識別

本書中場景和事件是同義詞,指一個有特定含義的連續(xù)過程。在有些文獻(xiàn)中,同一事件可以跨越時空不連續(xù)發(fā)生,從感知的角度看,本書不考慮時空不連續(xù)的場景或事件。

從接收和轉(zhuǎn)換過程看,場景或事件的感知與物體、狀態(tài)的感知一樣,此處不重復(fù)討論。

場景或事件感知的重點在于相應(yīng)的功能組的組合識別能力。一段連續(xù)感知對象中的人物、物件、環(huán)境狀態(tài)在感知后,與場景相關(guān)的功能組即依據(jù)智能體的感知目的開始工作。識別場景并組合(復(fù)原)感知對象中內(nèi)含的場景,是基于功能組的知識庫。場景或事件感知器的知識庫除擁有已知場景或事件的典型情景、主要特征、進(jìn)程的實景及描述外,還擁有基于感知對象中特定的客體,如人、動物、植物、物體,通過這些客體的變化來辨識、確定事件的功能性規(guī)則與流程。

當(dāng)一般性地討論場景識別時,會感覺難度很大、不知從何入手,但只要將需要識別的場景如同需要識別的物體一樣持續(xù)細(xì)化,用數(shù)以千計的場景功能組識別路況,用數(shù)以萬計的專用感知功能組識別城市路口的不同場景,甚至可以設(shè)想一個更為直接的方法,將任何有必要識別而又具備特殊性的場景都用一個場景感知功能組承擔(dān)這個場景的識別的時候,識別就不是問題,反而變成另一個命題,能否構(gòu)造這么多的功能組?其實,這些功能組都是邏輯形態(tài),不用說幾萬個,就是幾億個、數(shù)十億個都不是問題。

回到圖2.9中開始事件的感知識別。假定目的是判斷有沒有超速、逆行、超高超寬的事件存在。顯然,感知并做出判斷十分容易,今天的道路監(jiān)控已經(jīng)能夠做到自動識別這樣的事件。

不同的是,今天的監(jiān)控系統(tǒng)只能做出判斷,監(jiān)控系統(tǒng)也能通過經(jīng)驗的積累,持續(xù)提升其性能、能力。智能體感知即使采用完全相同的方法做出了判斷,但積累的知識和經(jīng)驗將以智能體可管理、可識別的方式進(jìn)入記憶,從而成為智能體擁有的知識和經(jīng)驗,為其他功能系統(tǒng)所用,其他功能系統(tǒng)的積累,同樣可以為這一感知功能組所用。

5.交互與反饋

小孩看到、聽到、觸摸到不認(rèn)識的物體,第一反應(yīng)就是提出問題,然后才是思考:通過類比、歸納,得出進(jìn)入記憶的正確或錯誤的結(jié)論。人工智能界認(rèn)為無法表示的常識問題,就是從出生開始的日常生活中歷經(jīng)數(shù)十年積累起來的。這種模式也是智能體感知的實現(xiàn)和成長過程。

這里的交互是指感知功能系統(tǒng)中任何一個組件向其他智能體提出問題,得到回答,并將回答轉(zhuǎn)化為自身可用的知識。這里的反饋是指感知功能系統(tǒng)接收并處置來自智能體其他功能系統(tǒng)的、與感知結(jié)果相關(guān)的信息。

由于感知微處理器、感知功能組是高度細(xì)分的,每個只承擔(dān)一種具有特殊性的感知識別任務(wù)。高層的功能組看起來是一個復(fù)雜的概念或過程,如人的識別、路況的識別,但實際上它們依然是一個簡單、獨特的感知任務(wù)。人的識別這種高層物體識別功能組,其實只有一個具體識別任務(wù),就是把人從其他動物中區(qū)分出來,而路況識別功能組也只有一個具體任務(wù),就是把路從其他同類物體中區(qū)分出來,如山、河、房屋等。具體什么樣的人,是誰,什么樣的路,什么路況,都由下面層次的具體感知微處理器識別。當(dāng)出現(xiàn)高層識別不了的場景時,可以在得到下層的識別結(jié)果后再次識別。

也因為感知器的高度細(xì)分,其何時提出什么問題,提出問題的語句都是簡單的填空模式。如圖2.9中遠(yuǎn)處的樓,感知器若區(qū)分不出是樓還是其他物體,可以自己生成“這是什么”或“這是樓嗎”的提問,接收到問題的人,回答的格式也是固定的:“樓”或“是”。顯然,這樣的過程,具有操作系統(tǒng)和知識庫的感知微處理器很容易處理。更加復(fù)雜的問題,如“為什么”“為什么不是塔”一定是以邏輯功能為主的功能組才能提出的,第一個問題,是為了修改知識庫,由樓的功能組提出;第二個問題是由識別“塔”的功能組與識別“樓”的功能組的上位功能組提出。

反饋基于其他功能區(qū)域發(fā)現(xiàn)新的結(jié)果,通向記憶區(qū)后,發(fā)現(xiàn)不一致,然后根據(jù)溯源的標(biāo)識反饋至源頭感知器。源頭感知器,不管是感知微處理器還是感知功能組,應(yīng)據(jù)此修改知識庫或流程。修改之后,需要執(zhí)行判斷過程,如果在記錄中有類似的感知過程,則應(yīng)再次感知。

本節(jié)討論的所有過程及前提條件都是現(xiàn)有技術(shù)可以實現(xiàn)的。智能體感知物理信號所依據(jù)的原則是能識別則識別,不能識別則通過交互系統(tǒng)進(jìn)行請教,若交互后仍不能識別,則放棄或留存等待知識庫增長后再識別。

外部的客觀存在,無論是一個客體、一個場景,還是一個事件的過程,存在不同的維度和顆粒度。感知什么維度,到什么樣的顆粒度,首先基于智能體的感知能力,其次基于智能體提升認(rèn)知能力和執(zhí)行智能任務(wù)、問題求解的需求。因此,初始、賦予應(yīng)該對智能體感知維度的擴(kuò)展和顆粒度的細(xì)化或組合方面具有發(fā)展的能力,這樣的能力嵌套在2.2節(jié)討論的感知功能系統(tǒng)中。

主站蜘蛛池模板: 蓝田县| 灵山县| 谢通门县| 高平市| 齐河县| 新津县| 明星| 思茅市| 蒙自县| 潜江市| 梨树县| 哈密市| 扎囊县| 洪洞县| 达州市| 交口县| 海淀区| 宝鸡市| 酉阳| 靖安县| 乌鲁木齐县| 南澳县| 遂溪县| 阿拉尔市| 婺源县| 内黄县| 大石桥市| 中西区| 彭山县| 梅州市| 德庆县| 琼海市| 芦山县| 咸丰县| 江安县| 元氏县| 淮安市| 台东市| 定日县| 仁化县| 陆河县|