Policy Gradients and Optimization
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 199字
- 2021-06-24 15:17:56
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 企業數字化創新引擎:企業級PaaS平臺HZERO
- 分布式數據庫系統:大數據時代新型數據庫技術(第3版)
- 數據驅動設計:A/B測試提升用戶體驗
- 辦公應用與計算思維案例教程
- Visual FoxPro數據庫技術基礎
- MySQL數據庫應用與管理
- 數據挖掘與機器學習-WEKA應用技術與實踐(第二版)
- 數據庫原理及應用:SQL Server 2016
- MySQL性能調優與架構設計
- Learn Selenium
- Foxtable數據庫應用開發寶典
- Computer Programming for Absolute Beginners
- Continuous Delivery and DevOps:A Quickstart Guide
- Hands-On Design Patterns with Java
- Getting Started with Paint.NET