mg爆奖视频

書名：面向Agent的軟件設(shè)計開發(fā)方法
作者名：薛霄編著
本章字?jǐn)?shù)： 2990字
更新時間： 2018-12-27 12:38:34

1.3 Agent的體系架構(gòu)

除了1.2節(jié)所給出的Agent概念之外，還需要強調(diào)一種不同的觀點。這種觀點把Agent看做是軟件系統(tǒng)的建模抽象，面向Agent的軟件工程就是基于這種觀點。在這里，Agent通常用于模擬現(xiàn)實中的實體，軟件系統(tǒng)被看做是為了實現(xiàn)預(yù)期功能而相互作用的一系列Agent。Agent憑借自主性、預(yù)動性和/或反應(yīng)性等一系列特征，為應(yīng)用程序開發(fā)人員描繪了一種很有前景的方法。更一般的，這意味著復(fù)雜應(yīng)用程序可以在動態(tài)環(huán)境中運行。

基于這種觀點，可以把Agent體系架構(gòu)看做是軟件模塊的詳盡集合，用帶箭頭的方框來表示數(shù)據(jù)和模塊之間的數(shù)據(jù)流控制。Agent體系架構(gòu)可以分為慎思型、反應(yīng)型和混合型。慎思型體系架構(gòu)是最先出現(xiàn)的，其標(biāo)志就是采用明確表示的世界符號模型，基于模式匹配的決策進程和符號操作技術(shù)。因此，體系架構(gòu)需要解決的問題就是：如何把真實世界轉(zhuǎn)換為符號，以及如何有效準(zhǔn)確地描述決策進程。一般來說，解決這些問題需要大量的計算，這使得慎思型體系架構(gòu)不適合解決許多實際問題。這里不會詳盡地闡述這個問題，因為它們與傳統(tǒng)人工智能有著更多的聯(lián)系，而與Agent方法聯(lián)系較少，有興趣的讀者可以參閱（Ghallab等，2004）。這些困難導(dǎo)致了新的（和特定Agent）架構(gòu)相繼出現(xiàn)，如反應(yīng)型和混合型體系架構(gòu)。

反應(yīng)型體系架構(gòu)涵蓋了范圍廣泛的方法，一般可以避免任何以符號為核心的世界模型或復(fù)雜的符號推理。由于這一點，這種類型的Agent對于環(huán)境變化可能會反應(yīng)更迅速。由于它們簡單，或許正因如此，反應(yīng)型體系架構(gòu)不可能用于開發(fā)那些“行為強依賴于執(zhí)行歷史”或“具有復(fù)雜推理”的Agent。

混合型體系架構(gòu)努力整合慎思型和反應(yīng)型體系架構(gòu)中好的一面，主要是通過包含兩個（或者更多）獨立的構(gòu)件：一個是協(xié)商型，另一個是反應(yīng)型。慎思型構(gòu)件負(fù)責(zé)規(guī)劃和推理行為，反應(yīng)型構(gòu)件處理需要快速響應(yīng)的重要事件。不過，構(gòu)件間的準(zhǔn)確關(guān)系和它們之間的控制取決于各自的具體架構(gòu)。

信念—期望—意圖（Belief-Desire-Intension，BDI）體系架構(gòu)（Haddadi等，1996；Wooldridge，1999b）是混合型體系架構(gòu)的一個重要類型。BDI體系架構(gòu)是Agent的表示形式，Agent的行為可以被描述成好像擁有信念、期望和意圖等思維狀態(tài)。信念表示Agent擁有的知識，期望描述Agent追求的目標(biāo)，意圖說明Agent選擇計劃以實現(xiàn)哪些目標(biāo)。

BDI體系架構(gòu)形成了一個共享BDI觀點的體系架構(gòu)族，但是信念、期望和意圖在系統(tǒng)功能中被分配的角色，以及表示和控制它們的形式，各不相同。雖然信念已經(jīng)被充分理解，但是期望和意圖所扮演的角色卻受到了爭議。當(dāng)期望和意圖同時指Agent想要達到的一個事物狀態(tài)時，就意圖而言，必須有一定的承諾去實現(xiàn)它們。因此，雖然Agent會有一些期望，但是它可能永遠不會去開始完成這些任務(wù)；而意圖卻會引起Agent的一個行動。有幾種理論試圖通過描述信念、期望和意圖之間的關(guān)系，來描述、分析和確定一個Agent的行為。這種理論背后的動機是多元化的，有一些理論旨在從觀察者的角度（Ferguson，1995）來解釋和預(yù)測Agent的行為，有一些則是用于設(shè)計Agent的體系架構(gòu)（d'Inverno等，2004），還有的是用于支持從事集體活動的Agent進行推理（Jennings，1993）。

自從BDI體系架構(gòu)出現(xiàn)以來，它們在Agent社區(qū)之中很流行，這主要是出于三個關(guān)鍵的理由：第一，基于意圖概念對系統(tǒng)進行建模，對我們?nèi)祟悂碚f更加自然。第二，大部分BDI體系架構(gòu)有一個基礎(chǔ)良好的哲學(xué)和理論背景。第三，這些體系架構(gòu)比純粹的慎思型或反應(yīng)型體系架構(gòu)更靈活。作為混合型，BDI體系架構(gòu)介于純粹反應(yīng)型和純粹慎思型之間。因此，在高度變化的環(huán)境中運行時，它們不可能表現(xiàn)出和純粹反應(yīng)式系統(tǒng)一樣的性能，但是可以根據(jù)特定的應(yīng)用需求，通過調(diào)整推理和慎思策略來提升性能。

BDI體系架構(gòu)不僅用于研究，還成功應(yīng)用于商業(yè)領(lǐng)域和工業(yè)領(lǐng)域。例如，空中交通管理系統(tǒng)OASIS（Rao和Georgeff，1995），它的發(fā)展是基于一種BDI體系架構(gòu)DMARS（d'Inverno等，2004），已經(jīng)在悉尼機場測試成功。OASIS中的Agent分為兩種類型：aircraft Agent和global Agent。每個aircraft Agent都同一架飛機相關(guān)聯(lián)，并且控制該飛機的飛行。相比之下，global Agent負(fù)責(zé)aircraft Agent的先后順序和協(xié)調(diào)工作。在運行期間，高達80個Agent并發(fā)運行，給控制器發(fā)出實時控制指令。

BDI體系架構(gòu)的成功取決于以下方面：

● 應(yīng)用程序編制是基于計劃構(gòu)建，方便于模塊化和遞增式的開發(fā)。

● 由系統(tǒng)來管理反應(yīng)行為和面向目標(biāo)行為之間的平衡，終端用戶不需要參與復(fù)雜的低級語言編程，這改進了可靠性。

● 終端用戶采用人類的思維狀態(tài)來對知識進行編碼，而不是低級語言。

迄今為止，已經(jīng)提出了很多不同的體系架構(gòu)，我們不可能在有限的篇幅里給出一個詳盡徹底的回顧。因此，我們把回顧限定在一些具有代表性的體系架構(gòu)上。在這個回顧中，我們不再討論慎思型體系架構(gòu)，因為它本質(zhì)上和傳統(tǒng)人工智能中的規(guī)劃很相似，不是基于Agent計算的，回顧這種體系架構(gòu)并不會增加本書的內(nèi)容。

1.包容性體系架構(gòu)

包容性體系架構(gòu)（Brooks，1986）是Brooks對反應(yīng)型體系架構(gòu)的改進，其功能是基于行為存在和它們的抑制關(guān)系。每個行為都計劃完成一個明確的任務(wù)，并且將感知到的輸入和行為聯(lián)系在一起。例如，交通控制應(yīng)用程序有這樣一個行為“如果發(fā)現(xiàn)前方有一個障礙，就改變方向”；把感知輸入“前方有障礙”和任務(wù)“改變方向”聯(lián)系在了一起。為了追求其目標(biāo)，每個行為不斷地檢測環(huán)境狀態(tài)，直到環(huán)境狀態(tài)與感知輸入相匹配，然后執(zhí)行這種情況下的相關(guān)行為。在這個例子中，不斷地檢測環(huán)境，直到發(fā)現(xiàn)交通工具前的障礙，然后執(zhí)行改變行為的指令。然而一個環(huán)境狀態(tài)可能會匹配多個行為，因此采用抑制關(guān)系來指明優(yōu)先權(quán)。根據(jù)這一抑制關(guān)系，行為被分為不同的層次，低層行為可以抑制高層行為，層次越高行為就越抽象（如圖1.1所示，說明了感知輸入、行為和動作之間的關(guān)系，虛線表示抑制關(guān)系）。

圖1.1 包容性體系結(jié)構(gòu)

例如，在交通工具的控制中，“避免碰撞”比“到達目的地”所處的空間層次更低，因為“避免障礙”的優(yōu)先級高于“到達目的地”的優(yōu)先級。

2.PRS

PRS（Procedural Reasoning System）（Georgeff等，1987）最初作為NASA工程的一部分被開發(fā)，具有良好的理論背景。在PRS中，信念、期望和意圖被明確地描述，并且一起決定系統(tǒng)的行為。它們還會隨著推理機制動態(tài)改變。如圖1.2所示，PRS由解釋程序和幾個模塊構(gòu)成，模塊包括數(shù)據(jù)庫、目標(biāo)棧、知識區(qū)域庫和意圖結(jié)構(gòu)。數(shù)據(jù)庫包含關(guān)于當(dāng)前世界的事實，知識區(qū)域庫所包含的知識區(qū)域（Knowledge Area，KA）分別是“如何完成任務(wù)的知識”和“如何在特定環(huán)境下做出反應(yīng)的知識”。

KA由一個主體和調(diào)用條件組成。主體包含程序步驟，調(diào)用條件表明在什么情況下KA是可用的。KA庫中的某些KA是針對特定應(yīng)用的，而另一些則定位于PRS本身的通用管理，例如針對相關(guān)KA進行選擇的策略。

與其他BDI體系架構(gòu)相比較，在PRS中，目標(biāo)代表了系統(tǒng)所期望的行為，而不是所要達到的靜止?fàn)顟B(tài)。它們不僅在目標(biāo)棧中被表示，還作為KA的一部分。意圖是系統(tǒng)選擇立即執(zhí)行或?qū)韴?zhí)行的任務(wù)，由一個初始KA和完成任務(wù)過程中所調(diào)用的其他一些子任務(wù)構(gòu)成。這樣的意圖被插入到意圖結(jié)構(gòu)中，意圖結(jié)構(gòu)實質(zhì)上就是一個帶優(yōu)先權(quán)的列表。

圖1.2 PRS架構(gòu)的主要組件

為了簡要起見，這里不再詳細(xì)闡述PRS的操作細(xì)節(jié)。簡言之，系統(tǒng)運行中的解釋程序控制過程如下：在一個給定的時間，系統(tǒng)具有某些目標(biāo)且持有某些信念，根據(jù)這些，某些KA變得可用，其中一個KA被選擇執(zhí)行且被置于意圖結(jié)構(gòu)中。當(dāng)執(zhí)行這個KA時，會產(chǎn)生一些目標(biāo)且置于目標(biāo)棧中。如果請求新的信念，就會應(yīng)用一致性檢查過程。新的信念和新的目標(biāo)也可以激活某些新的KA，在這種情況下，解釋程序可以決定去執(zhí)行其他某些目標(biāo)。這使得Agent更少地忠于意圖，更多地去感知環(huán)境。事實上，PRS中的KA可以實現(xiàn)對環(huán)境變化的快速響應(yīng)，這就形成了混合型體系架構(gòu)中的反應(yīng)組件，雖然并不是作為一個單獨的體系架構(gòu)組件。

官术网_书友最值得收藏!

面向Agent的軟件設(shè)計開發(fā)方法

1.3 Agent的體系架構(gòu)