Trust region policy optimization
- Reinforcement Learning with TensorFlow
- Sayon Dutta
- 158字
- 2021-08-27 18:52:40
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 繪制進程圖:可視化D++語言(第1冊)
- 西門子S7-200 SMART PLC從入門到精通
- 大數(shù)據(jù)安全與隱私保護
- DevOps:Continuous Delivery,Integration,and Deployment with DevOps
- 大數(shù)據(jù)技術(shù)與應(yīng)用
- 完全掌握AutoCAD 2008中文版:機械篇
- 云原生架構(gòu)進階實戰(zhàn)
- MATLAB-Simulink系統(tǒng)仿真超級學(xué)習(xí)手冊
- 貫通開源Web圖形與報表技術(shù)全集
- 筆記本電腦維修之電路分析基礎(chǔ)
- Apache Spark Quick Start Guide
- 智能+:制造業(yè)的智能化轉(zhuǎn)型
- Kubernetes on AWS
- 計算機應(yīng)用基礎(chǔ)學(xué)習(xí)指導(dǎo)與練習(xí)(Windows XP+Office 2003)
- MySQL Management and Administration with Navicat