Temporal Difference Learning
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 163字
- 2021-06-24 15:17:38
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 復(fù)雜性思考:復(fù)雜性科學(xué)和計(jì)算模型(原書(shū)第2版)
- 卷積神經(jīng)網(wǎng)絡(luò)的Python實(shí)現(xiàn)
- Access 2007數(shù)據(jù)庫(kù)應(yīng)用上機(jī)指導(dǎo)與練習(xí)
- PySpark大數(shù)據(jù)分析與應(yīng)用
- 數(shù)據(jù)庫(kù)開(kāi)發(fā)實(shí)踐案例
- 云計(jì)算與大數(shù)據(jù)應(yīng)用
- 大數(shù)據(jù)架構(gòu)商業(yè)之路:從業(yè)務(wù)需求到技術(shù)方案
- 淘寶、天貓電商數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第2版)
- MySQL DBA修煉之道
- 中文版Access 2007實(shí)例與操作
- 企業(yè)級(jí)大數(shù)據(jù)項(xiàng)目實(shí)戰(zhàn):用戶搜索行為分析系統(tǒng)從0到1
- 云工作時(shí)代:科技進(jìn)化必將帶來(lái)的新工作方式
- MySQL數(shù)據(jù)庫(kù)應(yīng)用與管理
- Oracle 11g數(shù)據(jù)庫(kù)管理員指南
- 云原生架構(gòu):從技術(shù)演進(jìn)到最佳實(shí)踐