官术网_书友最值得收藏!

1.3 Agent的體系架構(gòu)

除了1.2節(jié)所給出的Agent概念之外,還需要強調(diào)一種不同的觀點。這種觀點把Agent看做是軟件系統(tǒng)的建模抽象,面向Agent的軟件工程就是基于這種觀點。在這里,Agent通常用于模擬現(xiàn)實中的實體,軟件系統(tǒng)被看做是為了實現(xiàn)預(yù)期功能而相互作用的一系列Agent。Agent憑借自主性、預(yù)動性和/或反應(yīng)性等一系列特征,為應(yīng)用程序開發(fā)人員描繪了一種很有前景的方法。更一般的,這意味著復(fù)雜應(yīng)用程序可以在動態(tài)環(huán)境中運行。

基于這種觀點,可以把Agent體系架構(gòu)看做是軟件模塊的詳盡集合,用帶箭頭的方框來表示數(shù)據(jù)和模塊之間的數(shù)據(jù)流控制。Agent體系架構(gòu)可以分為慎思型、反應(yīng)型和混合型。慎思型體系架構(gòu)是最先出現(xiàn)的,其標(biāo)志就是采用明確表示的世界符號模型,基于模式匹配的決策進程和符號操作技術(shù)。因此,體系架構(gòu)需要解決的問題就是:如何把真實世界轉(zhuǎn)換為符號,以及如何有效準(zhǔn)確地描述決策進程。一般來說,解決這些問題需要大量的計算,這使得慎思型體系架構(gòu)不適合解決許多實際問題。這里不會詳盡地闡述這個問題,因為它們與傳統(tǒng)人工智能有著更多的聯(lián)系,而與Agent方法聯(lián)系較少,有興趣的讀者可以參閱(Ghallab等,2004)。這些困難導(dǎo)致了新的(和特定Agent)架構(gòu)相繼出現(xiàn),如反應(yīng)型和混合型體系架構(gòu)。

反應(yīng)型體系架構(gòu)涵蓋了范圍廣泛的方法,一般可以避免任何以符號為核心的世界模型或復(fù)雜的符號推理。由于這一點,這種類型的Agent對于環(huán)境變化可能會反應(yīng)更迅速。由于它們簡單,或許正因如此,反應(yīng)型體系架構(gòu)不可能用于開發(fā)那些“行為強依賴于執(zhí)行歷史”或“具有復(fù)雜推理”的Agent。

混合型體系架構(gòu)努力整合慎思型和反應(yīng)型體系架構(gòu)中好的一面,主要是通過包含兩個(或者更多)獨立的構(gòu)件:一個是協(xié)商型,另一個是反應(yīng)型。慎思型構(gòu)件負(fù)責(zé)規(guī)劃和推理行為,反應(yīng)型構(gòu)件處理需要快速響應(yīng)的重要事件。不過,構(gòu)件間的準(zhǔn)確關(guān)系和它們之間的控制取決于各自的具體架構(gòu)。

信念—期望—意圖(Belief-Desire-Intension,BDI)體系架構(gòu)(Haddadi等,1996;Wooldridge,1999b)是混合型體系架構(gòu)的一個重要類型。BDI體系架構(gòu)是Agent的表示形式,Agent的行為可以被描述成好像擁有信念、期望和意圖等思維狀態(tài)。信念表示Agent擁有的知識,期望描述Agent追求的目標(biāo),意圖說明Agent選擇計劃以實現(xiàn)哪些目標(biāo)。

BDI體系架構(gòu)形成了一個共享BDI觀點的體系架構(gòu)族,但是信念、期望和意圖在系統(tǒng)功能中被分配的角色,以及表示和控制它們的形式,各不相同。雖然信念已經(jīng)被充分理解,但是期望和意圖所扮演的角色卻受到了爭議。當(dāng)期望和意圖同時指Agent想要達到的一個事物狀態(tài)時,就意圖而言,必須有一定的承諾去實現(xiàn)它們。因此,雖然Agent會有一些期望,但是它可能永遠不會去開始完成這些任務(wù);而意圖卻會引起Agent的一個行動。有幾種理論試圖通過描述信念、期望和意圖之間的關(guān)系,來描述、分析和確定一個Agent的行為。這種理論背后的動機是多元化的,有一些理論旨在從觀察者的角度(Ferguson,1995)來解釋和預(yù)測Agent的行為,有一些則是用于設(shè)計Agent的體系架構(gòu)(d'Inverno等,2004),還有的是用于支持從事集體活動的Agent進行推理(Jennings,1993)。

自從BDI體系架構(gòu)出現(xiàn)以來,它們在Agent社區(qū)之中很流行,這主要是出于三個關(guān)鍵的理由:第一,基于意圖概念對系統(tǒng)進行建模,對我們?nèi)祟悂碚f更加自然。第二,大部分BDI體系架構(gòu)有一個基礎(chǔ)良好的哲學(xué)和理論背景。第三,這些體系架構(gòu)比純粹的慎思型或反應(yīng)型體系架構(gòu)更靈活。作為混合型,BDI體系架構(gòu)介于純粹反應(yīng)型和純粹慎思型之間。因此,在高度變化的環(huán)境中運行時,它們不可能表現(xiàn)出和純粹反應(yīng)式系統(tǒng)一樣的性能,但是可以根據(jù)特定的應(yīng)用需求,通過調(diào)整推理和慎思策略來提升性能。

BDI體系架構(gòu)不僅用于研究,還成功應(yīng)用于商業(yè)領(lǐng)域和工業(yè)領(lǐng)域。例如,空中交通管理系統(tǒng)OASIS(Rao和Georgeff,1995),它的發(fā)展是基于一種BDI體系架構(gòu)DMARS(d'Inverno等,2004),已經(jīng)在悉尼機場測試成功。OASIS中的Agent分為兩種類型:aircraft Agent和global Agent。每個aircraft Agent都同一架飛機相關(guān)聯(lián),并且控制該飛機的飛行。相比之下,global Agent負(fù)責(zé)aircraft Agent的先后順序和協(xié)調(diào)工作。在運行期間,高達80個Agent并發(fā)運行,給控制器發(fā)出實時控制指令。

BDI體系架構(gòu)的成功取決于以下方面:

● 應(yīng)用程序編制是基于計劃構(gòu)建,方便于模塊化和遞增式的開發(fā)。

● 由系統(tǒng)來管理反應(yīng)行為和面向目標(biāo)行為之間的平衡,終端用戶不需要參與復(fù)雜的低級語言編程,這改進了可靠性。

● 終端用戶采用人類的思維狀態(tài)來對知識進行編碼,而不是低級語言。

迄今為止,已經(jīng)提出了很多不同的體系架構(gòu),我們不可能在有限的篇幅里給出一個詳盡徹底的回顧。因此,我們把回顧限定在一些具有代表性的體系架構(gòu)上。在這個回顧中,我們不再討論慎思型體系架構(gòu),因為它本質(zhì)上和傳統(tǒng)人工智能中的規(guī)劃很相似,不是基于Agent計算的,回顧這種體系架構(gòu)并不會增加本書的內(nèi)容。

1.包容性體系架構(gòu)

包容性體系架構(gòu)(Brooks,1986)是Brooks對反應(yīng)型體系架構(gòu)的改進,其功能是基于行為存在和它們的抑制關(guān)系。每個行為都計劃完成一個明確的任務(wù),并且將感知到的輸入和行為聯(lián)系在一起。例如,交通控制應(yīng)用程序有這樣一個行為“如果發(fā)現(xiàn)前方有一個障礙,就改變方向”;把感知輸入“前方有障礙”和任務(wù)“改變方向”聯(lián)系在了一起。為了追求其目標(biāo),每個行為不斷地檢測環(huán)境狀態(tài),直到環(huán)境狀態(tài)與感知輸入相匹配,然后執(zhí)行這種情況下的相關(guān)行為。在這個例子中,不斷地檢測環(huán)境,直到發(fā)現(xiàn)交通工具前的障礙,然后執(zhí)行改變行為的指令。然而一個環(huán)境狀態(tài)可能會匹配多個行為,因此采用抑制關(guān)系來指明優(yōu)先權(quán)。根據(jù)這一抑制關(guān)系,行為被分為不同的層次,低層行為可以抑制高層行為,層次越高行為就越抽象(如圖1.1所示,說明了感知輸入、行為和動作之間的關(guān)系,虛線表示抑制關(guān)系)。

圖1.1 包容性體系結(jié)構(gòu)

例如,在交通工具的控制中,“避免碰撞”比“到達目的地”所處的空間層次更低,因為“避免障礙”的優(yōu)先級高于“到達目的地”的優(yōu)先級。

2.PRS

PRS(Procedural Reasoning System)(Georgeff等,1987)最初作為NASA工程的一部分被開發(fā),具有良好的理論背景。在PRS中,信念、期望和意圖被明確地描述,并且一起決定系統(tǒng)的行為。它們還會隨著推理機制動態(tài)改變。如圖1.2所示,PRS由解釋程序和幾個模塊構(gòu)成,模塊包括數(shù)據(jù)庫、目標(biāo)棧、知識區(qū)域庫和意圖結(jié)構(gòu)。數(shù)據(jù)庫包含關(guān)于當(dāng)前世界的事實,知識區(qū)域庫所包含的知識區(qū)域(Knowledge Area,KA)分別是“如何完成任務(wù)的知識”和“如何在特定環(huán)境下做出反應(yīng)的知識”。

KA由一個主體和調(diào)用條件組成。主體包含程序步驟,調(diào)用條件表明在什么情況下KA是可用的。KA庫中的某些KA是針對特定應(yīng)用的,而另一些則定位于PRS本身的通用管理,例如針對相關(guān)KA進行選擇的策略。

與其他BDI體系架構(gòu)相比較,在PRS中,目標(biāo)代表了系統(tǒng)所期望的行為,而不是所要達到的靜止?fàn)顟B(tài)。它們不僅在目標(biāo)棧中被表示,還作為KA的一部分。意圖是系統(tǒng)選擇立即執(zhí)行或?qū)韴?zhí)行的任務(wù),由一個初始KA和完成任務(wù)過程中所調(diào)用的其他一些子任務(wù)構(gòu)成。這樣的意圖被插入到意圖結(jié)構(gòu)中,意圖結(jié)構(gòu)實質(zhì)上就是一個帶優(yōu)先權(quán)的列表。

圖1.2 PRS架構(gòu)的主要組件

為了簡要起見,這里不再詳細(xì)闡述PRS的操作細(xì)節(jié)。簡言之,系統(tǒng)運行中的解釋程序控制過程如下:在一個給定的時間,系統(tǒng)具有某些目標(biāo)且持有某些信念,根據(jù)這些,某些KA變得可用,其中一個KA被選擇執(zhí)行且被置于意圖結(jié)構(gòu)中。當(dāng)執(zhí)行這個KA時,會產(chǎn)生一些目標(biāo)且置于目標(biāo)棧中。如果請求新的信念,就會應(yīng)用一致性檢查過程。新的信念和新的目標(biāo)也可以激活某些新的KA,在這種情況下,解釋程序可以決定去執(zhí)行其他某些目標(biāo)。這使得Agent更少地忠于意圖,更多地去感知環(huán)境。事實上,PRS中的KA可以實現(xiàn)對環(huán)境變化的快速響應(yīng),這就形成了混合型體系架構(gòu)中的反應(yīng)組件,雖然并不是作為一個單獨的體系架構(gòu)組件。

主站蜘蛛池模板: 开化县| 南安市| 定远县| 卢龙县| 南宁市| 屏东县| 平南县| 昭通市| 长治市| 上栗县| 临桂县| 新丰县| 红桥区| 繁峙县| 海丰县| 彭山县| 庆城县| 阿拉尔市| 溧阳市| 新巴尔虎右旗| 志丹县| 上杭县| 临清市| 噶尔县| 汕头市| 株洲县| 偃师市| 乌拉特后旗| 新沂市| 泰来县| 禄劝| 昭通市| 宁德市| 昭通市| 古交市| 琼海市| 阳曲县| 荣成市| 海盐县| 台南市| 东安县|