- 深度強化學習算法與實踐:基于PyTorch的實現
- 張校捷編著
- 212字
- 2022-05-06 17:08:35
2.5 總結
在本章中,著重深入介紹了第1章中粗略介紹的一些強化學習的基礎名詞和概念。同時,通過使用一些簡單的例子,希望能夠幫助讀者深入理解強化學習中一些基礎的做法,比如,如何估計狀態價值函數,如何對狀態價值函數進行迭代,從而讓該函數收斂,以及如何進行策略迭代和價值迭代,以獲取最優的狀態價值函數和最優的策略。
由于本章涉及比較多的數學知識,讀者可以以本章作為參考,在需要的時候查閱對應的內容,這有助于讀者更好地理解后續的一系列算法。
推薦閱讀
- JavaScript全程指南
- C++面向對象程序設計(微課版)
- Vue.js快速入門與深入實戰
- 算法基礎:打開程序設計之門
- Android 7編程入門經典:使用Android Studio 2(第4版)
- Hands-On C++ Game Animation Programming
- Unity Shader入門精要
- 人人都懂設計模式:從生活中領悟設計模式(Python實現)
- Learning SciPy for Numerical and Scientific Computing(Second Edition)
- Windows內核編程
- R數據科學實戰:工具詳解與案例分析
- App Inventor 2 Essentials
- Backbone.js Testing
- Julia High Performance(Second Edition)
- Hack與HHVM權威指南