Trust region policy optimization
書名: Python Reinforcement Learning作者名: Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo本章字數: 122字更新時間: 2021-06-24 15:18:05
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 區塊鏈通俗讀本
- Lean Mobile App Development
- Microsoft Power BI數據可視化與數據分析
- 數據庫技術及應用教程
- 金融商業算法建模:基于Python和SAS
- Splunk智能運維實戰
- 視覺大數據智能分析算法實戰
- Mastering LOB Development for Silverlight 5:A Case Study in Action
- Hadoop 3實戰指南
- Access 2010數據庫程序設計實踐教程
- 利用Python進行數據分析(原書第2版)
- 大數據隱私保護技術與治理機制研究
- Practical Convolutional Neural Networks
- Access 2010數據庫應用技術教程(第二版)
- Oracle數據庫性能優化的藝術