官术网_书友最值得收藏!

內容簡介

智能體AlphaGo戰勝人類圍棋專家刷新了人類對人工智能的認識,也使得其核心技術——強化學習受到學術界的廣泛關注。本書正是在此背景下,圍繞作者多年從事強化學習理論和應用的研究內容及國內外關于強化學習的最近動態等方面展開介紹,是為數不多的強化學習領域的專業著作。該著作側重于基于直接策略搜索的強化學習方法,結合了統計學習的諸多方法對相關技術及方法進行分析、改進及應用。

本書以一個全新的現代角度描述策略搜索強化學習算法。從不同的強化學習場景出發,講述了強化學習在實際應用中所面臨的諸多難題。針對不同場景,給定具體的策略搜索算法,分析算法中估計量和學習參數的統計特性,并對算法進行應用實例展示及定量比較。特別地,本書結合強化學習前沿技術將策略搜索算法應用到機器人控制及數字藝術渲染領域,給人以耳目一新的感覺。本書取材經典、全面,概念清楚,推導嚴密,以期形成一個集基礎理論、算法和應用為一體的完備知識體系。

主站蜘蛛池模板: 乌兰察布市| 武宣县| 石柱| 德昌县| 兴义市| 高邑县| 娄烦县| 永和县| 汾阳市| 平谷区| 沙河市| 内黄县| 南昌县| 烟台市| 平湖市| 衡阳县| 凤阳县| 延吉市| 麻城市| 商丘市| 逊克县| 登封市| 定兴县| 弋阳县| 鞍山市| 蓬安县| 永安市| 城固县| 钦州市| 阿克| 绵阳市| 定襄县| 彭泽县| 隆林| 淄博市| 息烽县| 普洱| 上杭县| 防城港市| 陇川县| 左云县|