- 深度強化學習算法與實踐:基于PyTorch的實現(xiàn)
- 張校捷編著
- 145字
- 2022-05-06 17:08:36
3.1 簡單的強化學習環(huán)境
在所有的強化學習環(huán)境中,最簡單的強化學習環(huán)境是僅僅涉及少數(shù)的狀態(tài),而且很容易給出對應獎勵的強化學習環(huán)境。在第2章中,我們已經(jīng)接觸了兩個這種類型的強化學習環(huán)境。對于這些強化學習環(huán)境,我們可以簡單地寫出一個實現(xiàn)。下面回顧一下這些環(huán)境,并給出一些常見的其他簡單的強化學習環(huán)境。
推薦閱讀
- C#完全自學教程
- C#編程入門指南(上下冊)
- Interactive Data Visualization with Python
- INSTANT Sencha Touch
- Learning Firefox OS Application Development
- 編譯系統(tǒng)透視:圖解編譯原理
- HTML5從入門到精通 (第2版)
- Windows Phone 7.5:Building Location-aware Applications
- Create React App 2 Quick Start Guide
- Troubleshooting Citrix XenApp?
- 零代碼實戰(zhàn):企業(yè)級應用搭建與案例詳解
- HTML5游戲開發(fā)實戰(zhàn)
- jBPM6 Developer Guide
- 面向?qū)ο蟪绦蛟O(shè)計教程(C#版)
- Python自動化開發(fā)實戰(zhàn)