Solving multi-armed bandit problems with the upper confidence bound algorithm
- PyTorch 1.x Reinforcement Learning Cookbook
- Yuxi (Hayden) Liu
- 223字
- 2021-06-24 12:35:03
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- Hands-On Intelligent Agents with OpenAI Gym
- AutoCAD快速入門與工程制圖
- 機器學習及應用(在線實驗+在線自測)
- 圖解PLC控制系統梯形圖和語句表
- 人工智能與人工生命
- 統計學習理論與方法:R語言版
- 具比例時滯遞歸神經網絡的穩定性及其仿真與應用
- 大學C/C++語言程序設計基礎
- 悟透JavaScript
- MATLAB-Simulink系統仿真超級學習手冊
- 簡明學中文版Flash動畫制作
- 樂高創意機器人教程(中級 上冊 10~16歲) (青少年iCAN+創新創意實踐指導叢書)
- 計算機辦公應用培訓教程
- Hands-On Agile Software Development with JIRA
- 基于Quartus Ⅱ的數字系統Verilog HDL設計實例詳解