決策算法
本書源于斯坦福大學的相關課程,主要介紹不確定狀態(tài)下的決策算法,涵蓋基本的數(shù)學問題和求解算法。本書共分為五個部分:首先解決在單個時間點上簡單決策的不確定性和目標的推理問題;然后介紹隨機環(huán)境中的序列決策問題;接著討論模型不確定性,包括基于模型的方法和無模型的方法;之后討論狀態(tài)不確定性,包括精確信念狀態(tài)規(guī)劃、離線信念狀態(tài)規(guī)劃、在線信念狀態(tài)規(guī)劃等;最后討論多智能體系統(tǒng),涉及多智能體推理和協(xié)作智能體等。本書主要關注規(guī)劃和強化學習,其中一些技術涉及監(jiān)督學習和優(yōu)化。書中的算法是用Julia編程語言實現(xiàn)的,并配有大量圖表、示例和練習題。本書要求讀者具備扎實的數(shù)學基礎,適合計算機科學、數(shù)學、統(tǒng)計學、電氣工程、航空航天等領域的讀者閱讀。
·25.7萬字