Lunar Lander using policy gradients
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 722字
- 2021-06-24 15:17:57
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 數(shù)據(jù)庫基礎(chǔ)教程(SQL Server平臺)
- 大數(shù)據(jù)可視化
- Lean Mobile App Development
- 深入淺出MySQL:數(shù)據(jù)庫開發(fā)、優(yōu)化與管理維護(hù)(第2版)
- 城市計算
- 大話Oracle Grid:云時代的RAC
- SQL優(yōu)化最佳實(shí)踐:構(gòu)建高效率Oracle數(shù)據(jù)庫的方法與技巧
- gnuplot Cookbook
- Oracle RAC日記
- Mastering LOB Development for Silverlight 5:A Case Study in Action
- 商業(yè)智能工具應(yīng)用與數(shù)據(jù)可視化
- 數(shù)據(jù)庫原理與設(shè)計實(shí)驗(yàn)教程(MySQL版)
- 一本書讀懂區(qū)塊鏈(第2版)
- INSTANT Windows Powershell 3.0 Windows management Instrumentation Starter
- Learning Game AI Programming with Lua