6.3 雙延遲深度確定性策略梯度算法(TD3)
- 深度強化學習算法與實踐:基于PyTorch的實現
- 張校捷編著
- 280字
- 2022-05-06 17:09:20
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 精通API架構:設計、運維與演進
- 區塊鏈:以太坊DApp開發實戰
- 面向對象程序設計(Java版)
- MATLAB for Machine Learning
- Java程序設計入門
- RabbitMQ Essentials
- Mastering ROS for Robotics Programming
- 21天學通C++(第5版)
- Node.js開發指南
- Cocos2d-x Game Development Blueprints
- Java Web從入門到精通(第3版)
- 零代碼實戰:企業級應用搭建與案例詳解
- Angular Design Patterns
- 3D Printing Designs:The Sun Puzzle
- Java設計模式深入研究