Policy gradient
- TensorFlow Reinforcement Learning Quick Start Guide
- Kaushik Balakrishnan
- 124字
- 2021-06-24 15:29:20
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 基于C語(yǔ)言的程序設(shè)計(jì)
- 電氣自動(dòng)化專(zhuān)業(yè)英語(yǔ)(第3版)
- Practical Data Wrangling
- 網(wǎng)頁(yè)編程技術(shù)
- 2018西門(mén)子工業(yè)專(zhuān)家會(huì)議論文集(上)
- 返璞歸真:UNIX技術(shù)內(nèi)幕
- 機(jī)器人智能運(yùn)動(dòng)規(guī)劃技術(shù)
- 城市道路交通主動(dòng)控制技術(shù)
- Embedded Programming with Modern C++ Cookbook
- CompTIA Linux+ Certification Guide
- Kubernetes for Serverless Applications
- 精通數(shù)據(jù)科學(xué):從線性回歸到深度學(xué)習(xí)
- 統(tǒng)計(jì)挖掘與機(jī)器學(xué)習(xí):大數(shù)據(jù)預(yù)測(cè)建模和分析技術(shù)(原書(shū)第3版)
- 無(wú)人駕駛感知智能
- 設(shè)計(jì)模式