官术网_书友最值得收藏!

THE TRANSLATOR'S WORDS
譯者序

眾所周知,強化學習在新一代人工智能的發展過程中發揮了關鍵作用,AlphaGo(會玩圍棋的智能體)、OpenAI Five(會玩《Dota 2》的智能體)、AlphaStar(會玩《星際爭霸》的智能體)等引起社會關注的技術和產品中都采用了強化學習核心算法,并結合深度學習,將此前不可能完成的任務以一種半“暴力”美學的方式完美解決。

本書是一本實用性很強的強化學習書籍。目前市面上講解強化學習的書籍大多從原理和算法角度介紹,而忽視了工程應用落地的具體案例。越來越多的人工智能落地產品(如谷歌推出的家庭機器人、傳統工業供應鏈優化以及OpenAI對話機器人ChatGPT)極其依賴強化學習算法,企業和個人開發者對強化學習技術和平臺的掌握與應用在今后的發展中變得越來越關鍵。

學習強化學習應從理論入手,以解決實際問題為目標,最終實現算法的應用。本書基于深度學習框架TensorFlow和分布式強化學習框架Ray實現一系列常用的深度強化學習算法。作者借助在第三部分中已經實現的算法解決第四部分的應用問題,比如,第14章使用第10章的兩種課程表學習方法訓練KUKA機器人完成物體抓取工作。

本書強調實際應用,提供一種現實示例以及對應的代碼教程,引導讀者一步一步實現算法并查看結果。另外,本書還針對新興的強化學習技術,提出現有的問題和未來的發展方向。

如果你有明確的學習目標,可以選擇性閱讀,這不影響整體的閱讀體驗。但正如本書最后所說:“只有通過實踐才能真正學到東西。”通過實踐來深入學習算法是學習任何人工智能技術的正確途徑,希望讀者朋友盡可能地動手實踐強化學習,相信你們一定能夠真正掌握這門具有長遠前景的技術。

主站蜘蛛池模板: 怀仁县| 泽州县| 精河县| 奉贤区| 汝城县| 南部县| 黄陵县| 化隆| 娄烦县| 日照市| 进贤县| 林州市| 金山区| 五寨县| 泸水县| 舞阳县| 沁水县| 芒康县| 宁远县| 通化县| 砚山县| 开鲁县| 舟曲县| 静宁县| 九龙县| 大安市| 弥渡县| 呼和浩特市| 和政县| 鄄城县| 日喀则市| 乌拉特中旗| 镇远县| 景宁| 南康市| 西峡县| 洪湖市| 小金县| 白河县| 盐亭县| 吴忠市|