On-policy Monte Carlo control
書名: Python Reinforcement Learning作者名: Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo本章字數: 884字更新時間: 2021-06-24 15:17:37
上QQ閱讀APP看后續(xù)精彩內容
登錄訂閱本章 >
推薦閱讀
- 企業(yè)數字化創(chuàng)新引擎:企業(yè)級PaaS平臺HZERO
- 大數據可視化
- Architects of Intelligence
- Game Development with Swift
- MongoDB管理與開發(fā)精要
- Redis應用實例
- Learning JavaScriptMVC
- Lean Mobile App Development
- 數據架構與商業(yè)智能
- 數據中心數字孿生應用實踐
- Chef Essentials
- SQL Server深入詳解
- MySQL DBA修煉之道
- 聯(lián)動Oracle:設計思想、架構實現(xiàn)與AWR報告
- 區(qū)塊鏈+:落地場景與應用實戰(zhàn)