官术网_书友最值得收藏!

3.5 本章小結

本章首先引入了強化學習中的一些基本概念,然后介紹了基于值函數的強化學習方法,敘述了值函數的理論和DQN,之后介紹了基于策略梯度的強化學習方法,敘述了策略梯度的理論以及AC、DDPG和A3C三種方法,最后以賽車游戲為例介紹如何使用A3C進行自動化測試。

在kindle搜索B089Y7R3XM可直接購買閱讀

主站蜘蛛池模板: 垦利县| 禄劝| 乐至县| 土默特左旗| 滦平县| 庆安县| 句容市| 湘阴县| 兴义市| 吉木乃县| 岳西县| 南澳县| 麻栗坡县| 林芝县| 达州市| 姜堰市| 梅河口市| 三门县| 宁波市| 民乐县| 宝鸡市| 北碚区| 林州市| 奉新县| 巴马| 嵊州市| 甘洛县| 虞城县| 乌恰县| 增城市| 随州市| 丹凤县| 霍山县| 同德县| 景谷| 莲花县| 简阳市| 托里县| 苏尼特左旗| 梁平县| 富川|