Cliff walking example of on-policy and off-policy of TD control
- Statistics for Machine Learning
- Pratap Dangeti
- 948字
- 2021-07-02 19:06:31
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- Java程序設計與開發
- Interactive Data Visualization with Python
- JavaScript語言精髓與編程實踐(第3版)
- Linux環境編程:從應用到內核
- Oracle BAM 11gR1 Handbook
- 人人都懂設計模式:從生活中領悟設計模式(Python實現)
- Java程序設計:原理與范例
- 可解釋機器學習:模型、方法與實踐
- SQL Server從入門到精通(第3版)
- Java系統化項目開發教程
- Vue.js應用測試
- C編程技巧:117個問題解決方案示例
- 工業機器人離線編程
- Appcelerator Titanium:Patterns and Best Practices
- Java EE程序設計與開發實踐教程