2.1 智能體的感知
2.1.1 感知的要求與定義
智能體面對一幀圖片、一段聲紋、一段文字(見圖2.1)等來自外部的信息,需要通過感知來接收、轉(zhuǎn)換、組合、判斷,并通過描述功能成為智能體記憶、理解和使用的材料。智能體通過感知器接收圖片的光信號、聲紋的波長、字符串特征,通過前置的通道和不同的傳感器,依據(jù)規(guī)則和經(jīng)驗(yàn),對接收到的信號或符號進(jìn)行標(biāo)注、組合,辨別出智能體當(dāng)前能理解的部分,如路、車、樹、語音、詞或詞組、句子等,并根據(jù)感知的結(jié)果,分別將接收到的內(nèi)容傳送到描述區(qū)或感知存儲區(qū)。
智能體將來自感知通道的所有內(nèi)容,按照規(guī)則和感知器的特點(diǎn),分門別類,逐一感知,直到對所有的信號或符號做出能否感知、能否完整感知的判斷,將結(jié)果做出相應(yīng)的處置,并完成感知器經(jīng)驗(yàn)值的調(diào)整,這就是感知功能的基本要求。

圖2.1 感知對象示例[1]
根據(jù)上述對智能體感知的要求,本書給出定義:智能體感知是指一個智能體在整個生命周期對所有來自外部世界的信號或符號通過接收、轉(zhuǎn)換、標(biāo)注、組合、判斷、處置,傳送到對應(yīng)的描述微處理器的過程。這個過程的意義就在于它所感知的所有對象,經(jīng)由描述微處理器轉(zhuǎn)換之后,就可以成為智能體可理解、可積累、可利用的記憶。這個過程也隱含了不能轉(zhuǎn)換為智能體可理解、可利用的不感知對象。
定義中的信號泛指所有來自外部環(huán)境、智能體可以感知的物理性刺激,它們都被稱為物理信號或信號,如溫度、壓力、光、聲波等;由這些物理信號顯示的狀態(tài)、場景、事件,以及被轉(zhuǎn)換為模擬信號的對象,如照片、記錄音視頻的磁帶等歸屬為感知對象中的信號系列。定義中的符號是指智能體接收到的所有數(shù)字化信息,特指由0和1構(gòu)成的電磁信號,如來自已經(jīng)連接的信息系統(tǒng)或網(wǎng)絡(luò)的一篇文章、一段音樂或視頻。智能體感知經(jīng)由數(shù)字化的信息系統(tǒng)或網(wǎng)絡(luò)傳輸過來的信息統(tǒng)稱為數(shù)字符號或符號。感知的定義強(qiáng)調(diào)了感知對外部信息范疇的全覆蓋,無論是動態(tài)還是靜態(tài),主動還是被動,連續(xù)還是斷續(xù),系統(tǒng)還是片段,都屬于感知的對象。
感知的定義強(qiáng)調(diào)了智能體感知只處理自身可描述、可理解、可利用的外部信號或符號,如果不能滿足這個要求,則放棄或擱置。這樣的設(shè)定基于從智能的角度對信息的理解。本質(zhì)上,智能體對物理信號感知的是信息的載體,對數(shù)字符號感知的是信息的外殼,經(jīng)感知過程轉(zhuǎn)換之后的是可描述的含義。這也是感知與傳感、模式識別或分類的不同。關(guān)于信息由載體、外殼和含義組成的三層結(jié)構(gòu)的解釋見參考文獻(xiàn)[2]。將信息構(gòu)成進(jìn)行三層區(qū)分,并將智能體可理解、使用的含義作為感知的結(jié)果,是構(gòu)建智能體的必要前提。
感知定義中的智能體是指一個具有控制自身全部行為能力的非生物智能體,強(qiáng)調(diào)了感知是由智能體控制的一類行為。定義中的智能體生命周期是指一個智能體從設(shè)計(jì)開發(fā)到終止的全過程。定義中的接收是指外部信號或符號進(jìn)入智能體的感知器。接收過程的重點(diǎn)是將來自外部的信號或符號進(jìn)行區(qū)分,逐一歸到智能體可以理解、操縱、使用的類別中。定義中的轉(zhuǎn)換是指智能體將接收到的物理信號或數(shù)字符號轉(zhuǎn)換為智能體可以理解和使用的含義的過程。定義中的標(biāo)注是指智能體感知器對轉(zhuǎn)換過的對象按規(guī)則添加智能體可理解和處理的標(biāo)識。定義中的組合是指智能體感知器對標(biāo)注好的對象根據(jù)該感知器的經(jīng)驗(yàn)將智能體能辨識的部分組合成一個個可描述的客體。定義中的判斷是指對感知對象結(jié)果進(jìn)行分類并按不同類型予以相應(yīng)處置的過程。根據(jù)對感知對象的感知結(jié)果的判斷,有三種處置模式:放棄、保存及輸送到描述區(qū)。
感知也可以如下形式定義:

式(2.1)表達(dá)的是,任何智能體的感知對象a必須經(jīng)由感知通道和感知器進(jìn)行識別,被識別的內(nèi)容經(jīng)過描述(D)進(jìn)入記憶(M),否則放棄或暫時保留。感知通道和感知器是外部信息進(jìn)入智能體的唯一途徑,而且這個過程是由智能體控制的。
智能體感知不包含智能體內(nèi)部的感知,如智能體生存系統(tǒng)及工作系統(tǒng)的狀態(tài)感知。盡管這些感知中有部分與外部的感知有相同的機(jī)理及功能構(gòu)成,需要調(diào)用感知功能系統(tǒng)中的相應(yīng)功能組件,但主導(dǎo)者已經(jīng)不是感知功能系統(tǒng),而是智能體的生存和意識思維控制等功能系統(tǒng)。
作為工程目標(biāo)的智能體的感知,必須做到過程可控制、技術(shù)可實(shí)現(xiàn)、目標(biāo)可達(dá)成。過程可控制是指感知的所有過程不僅處于智能體控制下,還要求如果出現(xiàn)不能控制、不能操縱、超出智能體當(dāng)時能力的感知過程,那么智能體應(yīng)該具備放棄、不予處置的能力。這個要求也隱含了智能體的感知功能是一個隨著智能體的成長而成長、完善的過程。技術(shù)可實(shí)現(xiàn)是指所有的感知過程處理只采用已經(jīng)存在且智能體已經(jīng)擁有并可使用的技術(shù)。目標(biāo)可達(dá)成是指所有感知過程需要取得的最終結(jié)果都是可控、可實(shí)現(xiàn)的。
感知功能由機(jī)械功能模塊和邏輯功能模塊組成。機(jī)械功能模塊具有將物理信號和數(shù)字符號接收和傳輸?shù)墓δ埽贿壿嫻δ苣K具有將物理信號和數(shù)字符號進(jìn)行轉(zhuǎn)換、調(diào)整和反饋的功能。感知器是感知功能的主要承擔(dān)者,通常既有機(jī)械功能,又有邏輯功能。
智能體感知不是模式識別。必要時,利用模式識別的工具或算法將保存在感知存儲區(qū)內(nèi)的內(nèi)容恰當(dāng)歸類是智能體的學(xué)習(xí)功能。感知的判斷全部基于相應(yīng)感知功能系統(tǒng)預(yù)置及積累的經(jīng)驗(yàn),依據(jù)不同的閾值做出如何處置的判斷。判斷的規(guī)則與閾值以一個感知微處理器為單位,并在感知的過程中持續(xù)調(diào)整、提升。
智能體感知不是信息系統(tǒng)的輸入,而是感知對象載體或外殼的轉(zhuǎn)換及其內(nèi)在含義的提取,使獲取的內(nèi)容轉(zhuǎn)化為智能體可操縱的符號體系,以及智能體可理解、利用的含義。
2.1.2 感知的對象、類型與來源
智能體感知的對象由兩大類構(gòu)成:物理信號和邏輯符號。依據(jù)感知過程及所需感知功能的不同,可以進(jìn)一步細(xì)化感知的對象。物理信號感知對象的類型,包括:光波、聲波、壓力、味道、溫度、速度,物理或化學(xué)、生物成分,狀態(tài)、場景、事件等。狀態(tài)、成分、場景、事件在這里都是泛指。邏輯符號感知對象的類型可分為模擬的和數(shù)字的。若討論邏輯符號中包含的內(nèi)容則涵蓋了物理信號的所有類別。
從感知處理的特征和目的看,感知的對象可以分為表2.1中所列的八類。這個分類兼顧了信號類型與感知目的。音、視頻屬于邏輯符號范疇,而其他六類均兼具物理信號和邏輯符號的存在方式。區(qū)分這六類是服務(wù)于感知的目的,識別什么、為什么識別。
表2.1 感知對象大類列舉

注:物體是指場景中的存在物;事件是指場景中進(jìn)行的有關(guān)聯(lián)的活動;場景不包含自動化系統(tǒng)、物聯(lián)系統(tǒng)等狀態(tài)量已被相應(yīng)系統(tǒng)處理的情形,這些感知在狀態(tài)變量識別中
感知類型還可以按感知器進(jìn)行分類。傳感器有多種分類標(biāo)準(zhǔn)。按工作機(jī)理,可分為結(jié)構(gòu)型、物性型、復(fù)合型和智能型;按被檢測量,可分為物理變量、化學(xué)變量、生物變量;按制造材料,可分為半導(dǎo)體傳感器、單晶體傳感器、陶瓷傳感器、薄膜傳感器、光纖傳感器、高分子材料傳感器、生化酶傳感器等[2]。
從感知內(nèi)容的顆粒度看,感知對象至少需要分為三層:單點(diǎn)、可描述客體、整體。
單點(diǎn)是指一個智能體相對于特定感知功能的感知器的最小可感知單位。例如,符號的一個0或1,信號的一條光束、一段聲波。光束、聲波的范圍、長度,依賴于感知器的功能。
可描述客體是指在一個描述對象體中需要或可以用作獨(dú)立觀察、認(rèn)知對象的一個感知單點(diǎn)集合。可描述客體本身具有不同的粒度。如一張人物相片,可描述對象可以是相片中關(guān)于人的全部,可以只是臉部或眼睛、眼睫毛、眼珠、眼袋等部分。可描述對象的粒度基于智能體識別的目的和能力。如圖2.1所示,圖中可以分辨出成百上千的可描述客體,若非作為教育分析等特殊用途,智能體只分辨學(xué)習(xí)和行為所需的可描述客體。例如,要分析機(jī)動車違規(guī),只需要對機(jī)動車是否違規(guī)的要素區(qū)分,如靜態(tài)的車道、動態(tài)的車速。
感知對象整體包括靜態(tài)整體和動態(tài)整體。靜態(tài)整體是指時間上獨(dú)立的一幀信號或自然隔斷的一組符號。動態(tài)整體相對于信號是指一個時間序列構(gòu)成的可獨(dú)立場景或事件,相對于符號則是一串完整的輸入集合。動態(tài)整體是一組靜態(tài)整體的集合。視頻的一幀、音頻的一段、被分割的一串符號是靜態(tài)整體,一個連續(xù)音/視頻、一個獨(dú)立文本是動態(tài)整體。
感知對象的來源主要有兩類:一是智能體的傳感設(shè)施可觸及的環(huán)境,包括由智能體控制的、傳感設(shè)施可以移動或連接的來源,以及與智能體并非處于同一空間、地域的對象;二是智能體可連接、可利用的網(wǎng)絡(luò)信息,包括互聯(lián)網(wǎng)及其他信息系統(tǒng)或網(wǎng)絡(luò)。
2.1.3 感知功能的構(gòu)成及與智能體其他部分的關(guān)系
在2.1.1節(jié)中,已經(jīng)介紹了智能體感知的功能要求,本節(jié)討論實(shí)現(xiàn)這些功能要求的基本模塊及其與智能體其他部分的關(guān)系。
圖2.2是實(shí)現(xiàn)智能體感知要求的功能劃分,由三條通道、六個功能模塊構(gòu)成。三條通道是感知通道、控制通道、成長通道。感知通道是智能體所能管理和控制的信息輸入通道。控制通道承擔(dān)智能體對感知功能的完全控制,主要包括感知過程對智能體其他資源的調(diào)用,感知功能系統(tǒng)與其他系統(tǒng)的協(xié)調(diào),不同感知系統(tǒng)之間超越感知功能相互協(xié)調(diào)的部分,輸入環(huán)境的協(xié)調(diào),成長通道的控制和協(xié)調(diào)。成長通道承擔(dān)感知功能系統(tǒng)自身及智能體其他相關(guān)功能系統(tǒng)的處理過程中所有對其成長相關(guān)信息的反饋及處置,涉及所有感知功能模塊的成長。六個功能模塊分別是輸入分類、轉(zhuǎn)換、標(biāo)識、分類、后處理、輸出,這些模塊承擔(dān)的任務(wù)及實(shí)現(xiàn)將在2.2節(jié)進(jìn)行介紹。

圖2.2 智能體感知功能構(gòu)成
感知是智能體各項(xiàng)功能形成和發(fā)展的起點(diǎn)。如圖2.3所示,感知功能體系與其他功能體系之間存在大量的聯(lián)系,其中最重要的是與下列10個功能體系的關(guān)系。

圖2.3 感知功能體系在智能體架構(gòu)中的位置
圖2.3列舉的是通用智能體必須具備的11個功能體系。感知功能體系與另外10個功能體系存在不同程度的雙向關(guān)系。
感知功能體系與交互功能體系存在功能相互調(diào)用和信息交互的關(guān)系。感知通道也可以用作交互功能體系的外部連接通道,交互功能的相關(guān)結(jié)果可以成為感知功能體系的規(guī)則和背景知識提升的一種來源。
感知功能體系接受智能體控制功能體系的管理。除屬于感知功能體系一部分的連接、感知結(jié)果的處置等功能外,其他所有與智能體功能體系之間功能的協(xié)同均通過控制系統(tǒng)的管理功能。
感知功能體系使用連接功能體系的功能,感知功能擁有的連接是連接功能體系的組成部分,接受兩個功能體系的雙重管理。感知功能體系內(nèi)部的連接以自己管理為主,與外部共用的連接以連接功能體系的管理為主。
感知功能體系的結(jié)果是描述功能體系的一個起點(diǎn),但不是唯一起點(diǎn),描述功能體系還要完成來自學(xué)習(xí)、任務(wù)、管理等功能體系的描述要求。描述功能體系的結(jié)果是感知功能體系完善、提升的重要來源。
感知功能體系的結(jié)果是學(xué)習(xí)功能體系的重要來源。感知存儲器是學(xué)習(xí)的重要材料來源。經(jīng)由連接到達(dá)記憶區(qū)域的感知—描述的結(jié)果成為學(xué)習(xí)功能體系的處置對象。學(xué)習(xí)功能體系與感知相關(guān)的成功是感知功能體系完善和提升的主要來源。
感知功能體系的處理能力是處理功能體系的組成部分,兩個功能體系對此均有管理權(quán)。感知功能體系保持使用的管理權(quán),處理功能體系保持處理功能提升的管理權(quán)。
感知功能體系與記憶功能體系的關(guān)系主要通過描述結(jié)果體現(xiàn);與任務(wù)功能體系的關(guān)系主要是為任務(wù)功能體系執(zhí)行任務(wù)提供感知相關(guān)的功能;與生存功能體系的關(guān)系主要是接受生存功能體系的管理和調(diào)整;與資源功能體系的關(guān)系主要是申請并獲取滿足功能需求的資源。
需要再次強(qiáng)調(diào)的是,智能體所有的功能體系是一個有管理、有控制的整體。
2.1.4 感知的基本準(zhǔn)則
感知在智能體的構(gòu)成和成長中居于基礎(chǔ)的位置,沒有感知就沒有智能,感知要成為通用、可成長智能體形成和發(fā)展的起點(diǎn)。智能體感知功能要達(dá)到這樣的要求,需要精心設(shè)計(jì)若干基本準(zhǔn)則,主要有:含義形成并為后續(xù)與理解相關(guān)的要求奠定基礎(chǔ)、漸進(jìn)提升的能力、大規(guī)模并行及協(xié)同、可操作可容忍的歧義處理、跨時間和場景的參照及一致性等。
第一,含義和理解準(zhǔn)則,也可稱為目的性準(zhǔn)則,即要求所有的感知是為了將感知對象轉(zhuǎn)換為智能體能理解的含義,感知形成含義并為后續(xù)與理解相關(guān)的要求奠定基礎(chǔ)。這是智能體感知的首要準(zhǔn)則,其他準(zhǔn)則都應(yīng)滿足這個要求,所有功能設(shè)計(jì)都必須遵循這個準(zhǔn)則。含義和理解準(zhǔn)則是指經(jīng)由感知的信號或符號必須轉(zhuǎn)換、組合為智能體可描述、可利用、可理解的含義,如果做不到這一點(diǎn),感知功能體系可以選擇放棄或留置,即保存于臨時存儲區(qū)域,而不能進(jìn)入智能體的記憶及其他工作區(qū)域。
第二,自主準(zhǔn)則,即感知的進(jìn)程由智能體控制,即使在智能體形成早期的調(diào)試階段,如果智能體無法識別、組合測試過程及測試數(shù)據(jù)集應(yīng)立即停止,絕不接收任何不理解的信號或符號。智能體只有記憶,沒有存儲。
第三,成長準(zhǔn)則,也可稱為漸進(jìn)提升準(zhǔn)則,是指智能體的感知是一個長期的發(fā)展和完善過程,即感知是成長的。漸進(jìn)提升包括功能漸進(jìn)、模式漸進(jìn)和結(jié)果漸進(jìn)。功能漸進(jìn)是指智能體感知的物理和邏輯功能,以及整體功能,如計(jì)算資源和執(zhí)行的規(guī)則,都是漸進(jìn)的,在整個生命周期可以持續(xù)增長。模式漸進(jìn)是指智能體感知模式在智能體的生命周期可以持續(xù)增加或調(diào)整。結(jié)果漸進(jìn)是指在感知過程中,以前感知、已經(jīng)進(jìn)入智能體記憶區(qū)域的結(jié)果可以被后續(xù)的感知結(jié)果調(diào)整、修改。
第四,窮盡準(zhǔn)則,也可稱為完備準(zhǔn)則,就是對每個感知對象,要窮盡對象中的所有內(nèi)在含義,使得每次感知趨近完備。在后面對不同感知執(zhí)行過程中的后處理和反饋不厭其煩,不管是否重復(fù)的組合,都是這一準(zhǔn)則的體現(xiàn)。
第五,可操作準(zhǔn)則,即每個感知操作都是可執(zhí)行的,所有不能操作的設(shè)想不應(yīng)出現(xiàn)在一切感知流程中。
第六,容錯準(zhǔn)則,是指感知器針對存在歧義的單點(diǎn)感知或感知?dú)w類,采用可實(shí)現(xiàn)的簡易操作處置,對感知的結(jié)果允許在使用或?qū)W習(xí)過程中發(fā)現(xiàn)差錯。一般地,容錯操作有三種方式:試錯、容錯和前饋式校對。試錯是指在單點(diǎn)感知和組合時,若結(jié)果不能確認(rèn)可否接受,則繼續(xù)轉(zhuǎn)到其他感知器或采用其他組合方式,直至沒有可選的感知器或組合模式。容錯是指智能體允許每個感知器及感知組合功能保留少量未經(jīng)驗(yàn)證的感知結(jié)果,等待后續(xù)驗(yàn)證;保留什么、保留多少則根據(jù)已經(jīng)存在的相關(guān)規(guī)則執(zhí)行。前饋式校對是指每次感知結(jié)果經(jīng)由后續(xù)的描述、記憶進(jìn)程及智能體在學(xué)習(xí)和智能任務(wù)執(zhí)行過程中相關(guān)內(nèi)容的證實(shí)或證實(shí)結(jié)果梯次向前反饋,用作感知器及組合功能的參照。漸進(jìn)準(zhǔn)則隱含的一個規(guī)則是允許不完整,允許有錯,在此后的發(fā)展中趨向完整,改正錯誤。
第七,大規(guī)模并行準(zhǔn)則,是指智能體的感知不僅必然采取大規(guī)模并行的模式,還要保證并行的有效性,智能體不因大規(guī)模并行而失去控制或感知成果間的不一致。這里的“大規(guī)模”是指數(shù)量巨大,“并行”則有兩層含義:一是不同功能和模式的感知并行進(jìn)展;二是指具有相同功能或模式的感知也采取并行方式。采用大規(guī)模并行既是感知的需要,也是智能體以數(shù)量換時間,加快感知進(jìn)度的結(jié)果。大規(guī)模并行達(dá)到什么規(guī)模,大體上感知器數(shù)量可能達(dá)到十億或者更高的數(shù)量級。功能相同,但感知對象不同的,分設(shè)不同的感知微處理器;功能對象均相同,但感知對象眾多的,可并行設(shè)立多個相同的感知器,但應(yīng)該具有整合的功能。
第八,一致性準(zhǔn)則,是指智能體應(yīng)該能夠?qū)碜圆煌瑫r間與/或場景的感知對象保持含義的一致性。這一準(zhǔn)則的目的在于感知對象在含義上本來具有一致性,但在不同的時間被感知,如相同感知對象第一次沒有恰當(dāng)組合,感知器在提升經(jīng)驗(yàn)之后又能夠組合或形成新的組合,要保證前后的一致性。同樣,相同的內(nèi)容在不同的場景中出現(xiàn),需要保證不同場景的一致性。這個準(zhǔn)則是感知成長的基本要求。
- 機(jī)器學(xué)習(xí):Python實(shí)踐
- PVCBOT零基礎(chǔ)機(jī)器人制作(第3版)
- 為機(jī)器立心(通用人工智能的中國藍(lán)圖系列)
- TensorFlow移動端機(jī)器學(xué)習(xí)實(shí)戰(zhàn)
- ChatGPT速學(xué)通:文案寫作+PPT制作+數(shù)據(jù)分析+知識學(xué)習(xí)與變現(xiàn)
- 生命3.0
- 深度強(qiáng)化學(xué)習(xí)實(shí)踐(原書第2版)
- 機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué)(基于R的統(tǒng)計(jì)學(xué)習(xí)方法)
- 深度學(xué)習(xí)實(shí)戰(zhàn):基于TensorFlow 2和Keras(原書第2版)
- 豆包:人人都能上手的AI工具
- AI律師助手:律師實(shí)務(wù)ChatGPT實(shí)戰(zhàn)指南
- 體感交互技術(shù)
- 人工不智能:計(jì)算機(jī)如何誤解世界(見識叢書52)
- 人工智能:智能制造
- 人工智能