球球英雄游戏破解版下载

書名：深度強化學習算法與實踐：基于PyTorch的實現(xiàn)
作者名：張校捷編著
本章字數(shù)： 145字
更新時間： 2022-05-06 17:08:36

3.1 簡單的強化學習環(huán)境

在所有的強化學習環(huán)境中，最簡單的強化學習環(huán)境是僅僅涉及少數(shù)的狀態(tài)，而且很容易給出對應獎勵的強化學習環(huán)境。在第2章中，我們已經(jīng)接觸了兩個這種類型的強化學習環(huán)境。對于這些強化學習環(huán)境，我們可以簡單地寫出一個實現(xiàn)。下面回顧一下這些環(huán)境，并給出一些常見的其他簡單的強化學習環(huán)境。

官术网_书友最值得收藏!

深度強化學習算法與實踐：基于PyTorch的實現(xiàn)

3.1 簡單的強化學習環(huán)境