官术网_书友最值得收藏!

1.2.1 合理性的概念

在我們的范圍內,智能體合理地行動,這意味著合理的智能體應該做正確的事情。基于智能體對環境狀態的感知(這可能不是環境的真實狀態),一個合理的智能體做出正確的決定或執行正確的動作來響應環境。根據智能體所決定的動作,執行器與環境進行交互,請注意,在實際工程中可能并不是很精確。智能體的人工智能的核心問題是對于這種合理的智能體如何執行正確的動作。

統計決策理論可知,合理決策應該考慮決策的結果和與決策過程相關聯的先驗概率。結果可以用性能度量來表示。結果的性能度量可以用不同的方式命名,但為了便于計算,通常首選真實值映射的存在性。由于不確定性,通過引入概率或統計手段,合理的智能體通常會最大化期望的性能

博弈論:在馮·諾依曼和摩根斯特恩的先驅性探索中,效用被引入作為決策的性能衡量標準。效用函數u通過為每個結果x∈X分配一個效用值u(x)∈R來對性能進行建模。為了對狀態的不確定性進行建模,假設狀態空間S上的概率分布為p,這就是因馮·諾依曼和摩根斯特恩而聞名的風險決策。這種分布可以通過客觀統計或主觀認知來獲得。基于觀測x來表示決策a,從而可得期望效用

統計估計:在參數估計中,令為θ的估計,損失函數L定義如下,然后取期望E[L]。

●二次損失:L(θ,)=(θ-2

●絕對值損失:L(θ,)=|θ-|

●截斷二次損失:L(θ,)=min{(θ-2,d2}

類似地,在統計決策中,我們有時使用風險函數來代替損失函數。

數字通信:使用統計中的假設檢驗設計一個二元數字通信接收器來檢測信號“1”或“0”。傳輸“0”而檢測為“1”的代價通常設為1,表示一個錯誤。相似地,當傳輸“1”而檢測為“0”的代價也設為1,亦表示一個錯誤。在這種意義上,性能度量就是二元數字通信系統的位錯誤率(Bit Error Rate,BER)。

請注意,最好根據相應環境的實際需求來設計性能度量指標,而不是根據希望智能體在環境中的行為來設計性能度量指標。

主站蜘蛛池模板: 永登县| 尤溪县| 石嘴山市| 海淀区| 安庆市| 当阳市| 和田县| 岢岚县| 泌阳县| 大悟县| 阳山县| 浦县| 都匀市| 东光县| 唐山市| 庐江县| 义马市| 岑溪市| 郓城县| 大安市| 曲沃县| 泾阳县| 镶黄旗| 健康| 永和县| 炉霍县| 确山县| 克什克腾旗| 密山市| 宕昌县| 平南县| 根河市| 华安县| 泸西县| 安义县| 延川县| 建昌县| 铁力市| 张家界市| 宜兰市| 信丰县|