- Python強化學習:算法、核心技術與行業應用
- (美)埃內斯·比爾金
- 131字
- 2024-04-15 11:57:24
第一部分 強化學習基礎
本部分涵蓋強化學習的必要背景,包括定義、數學基礎以及強化學習解決方案方法論的概述,為你的后續學習奠定基礎。
本部分包含以下章節:
? 第1章 強化學習簡介
? 第2章 多臂老虎機
? 第3章 上下文多臂老虎機
? 第4章 馬爾可夫決策過程的制定
? 第5章 求解強化學習問題
本部分涵蓋強化學習的必要背景,包括定義、數學基礎以及強化學習解決方案方法論的概述,為你的后續學習奠定基礎。
本部分包含以下章節:
? 第1章 強化學習簡介
? 第2章 多臂老虎機
? 第3章 上下文多臂老虎機
? 第4章 馬爾可夫決策過程的制定
? 第5章 求解強化學習問題