Policy gradient
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 393字
- 2021-06-24 15:17:57
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 數據庫原理及應用教程(第4版)(微課版)
- 達夢數據庫編程指南
- MongoDB管理與開發精要
- 大話Oracle Grid:云時代的RAC
- Scratch 3.0 藝術進階
- 淘寶、天貓電商數據分析與挖掘實戰(第2版)
- R Machine Learning Essentials
- MySQL技術內幕:InnoDB存儲引擎
- Microsoft Dynamics NAV 2015 Professional Reporting
- 大數據隱私保護技術與治理機制研究
- Learning Ansible
- 大數據計算系統原理、技術與應用
- MySQL核心技術手冊
- 算力芯片:高性能CPU/GPU/NPU微架構分析
- Hands-On Java Deep Learning for Computer Vision