官术网_书友最值得收藏!

3.2 OpenAI Gym環境

OpenAI Gym環境是一個非常重要的一系列強化學習環境的集合。之所以稱它為強化學習環境的集合,是因為它本身是一個框架,包含了一系列的強化學習環境,甚至可以通過Python類的繼承來自定義強化學習環境。實際上,因為這個強化學習環境的通用性和對應接口的簡單性,很多強化學習算法發表的論文都會在這個強化學習環境中做試驗來驗證算法的有效性。由于本書主要研究的是強化學習算法,書中的大多數算法示例也將會基于這個強化學習環境來展開敘述。另外,由于OpenAI Gym環境中包含的強化學習環境比較多,下面將會根據環境類型的不同來進行敘述。

主站蜘蛛池模板: 阿鲁科尔沁旗| 文水县| 黄平县| 赞皇县| 收藏| 大姚县| 黄梅县| 安新县| 若尔盖县| 墨脱县| 连城县| 佛冈县| 平江县| 兴安盟| 苍梧县| 本溪市| 仁怀市| 永嘉县| 施秉县| 于都县| 理塘县| 根河市| 六安市| 郧西县| 巫山县| 麻栗坡县| 新巴尔虎右旗| 黔西| 汉寿县| 寻乌县| 九江县| 衢州市| 郸城县| 平江县| 沁阳市| 临邑县| 驻马店市| 化德县| 砚山县| 策勒县| 武宣县|