The upper confidence bound algorithm
- Python Reinforcement Learning
- Sudharsan Ravichandiran Sean Saito Rajalingappaa Shanmugamani Yang Wenzhuo
- 669字
- 2021-06-24 15:17:42
上QQ閱讀APP看后續精彩內容
登錄訂閱本章 >
推薦閱讀
- 大數據技術基礎
- 有趣的二進制:軟件安全與逆向分析
- Greenplum:從大數據戰略到實現
- 云計算環境下的信息資源集成與服務
- DB29forLinux,UNIX,Windows數據庫管理認證指南
- 計算機信息技術基礎實驗與習題
- Creating Dynamic UIs with Android Fragments(Second Edition)
- 深入淺出MySQL:數據庫開發、優化與管理維護(第2版)
- Starling Game Development Essentials
- 云數據中心網絡與SDN:技術架構與實現
- Oracle RAC日記
- INSTANT Apple iBooks How-to
- Python數據分析與數據化運營
- Construct 2 Game Development by Example
- MySQL技術內幕:SQL編程