Trust region policy optimization
- Reinforcement Learning with TensorFlow
- Sayon Dutta
- 158字
- 2021-08-27 18:52:40
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 精通MATLAB神經(jīng)網(wǎng)絡(luò)
- Java開(kāi)發(fā)技術(shù)全程指南
- 自動(dòng)化控制工程設(shè)計(jì)
- INSTANT Autodesk Revit 2013 Customization with .NET How-to
- 具比例時(shí)滯遞歸神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性及其仿真與應(yīng)用
- 傳感器與新聞
- 工業(yè)機(jī)器人運(yùn)動(dòng)仿真編程實(shí)踐:基于Android和OpenGL
- 手把手教你學(xué)Photoshop CS3
- C#編程兵書(shū)
- 大型機(jī)系統(tǒng)應(yīng)用基礎(chǔ)
- 數(shù)字多媒體技術(shù)與應(yīng)用實(shí)例
- JSP通用范例開(kāi)發(fā)金典
- 傳感技術(shù)基礎(chǔ)與技能實(shí)訓(xùn)
- 軟件測(cè)試管理
- iLike就業(yè)SQL多功能教材