THE TRANSLATOR'S WORDS
譯者序

眾所周知，強化學習在新一代人工智能的發展過程中發揮了關鍵作用，AlphaGo（會玩圍棋的智能體）、OpenAI Five（會玩《Dota 2》的智能體）、AlphaStar（會玩《星際爭霸》的智能體）等引起社會關注的技術和產品中都采用了強化學習核心算法，并結合深度學習，將此前不可能完成的任務以一種半“暴力”美學的方式完美解決。

本書是一本實用性很強的強化學習書籍。目前市面上講解強化學習的書籍大多從原理和算法角度介紹，而忽視了工程應用落地的具體案例。越來越多的人工智能落地產品（如谷歌推出的家庭機器人、傳統工業供應鏈優化以及OpenAI對話機器人ChatGPT）極其依賴強化學習算法，企業和個人開發者對強化學習技術和平臺的掌握與應用在今后的發展中變得越來越關鍵。

學習強化學習應從理論入手，以解決實際問題為目標，最終實現算法的應用。本書基于深度學習框架TensorFlow和分布式強化學習框架Ray實現一系列常用的深度強化學習算法。作者借助在第三部分中已經實現的算法解決第四部分的應用問題，比如，第14章使用第10章的兩種課程表學習方法訓練KUKA機器人完成物體抓取工作。

本書強調實際應用，提供一種現實示例以及對應的代碼教程，引導讀者一步一步實現算法并查看結果。另外，本書還針對新興的強化學習技術，提出現有的問題和未來的發展方向。

如果你有明確的學習目標，可以選擇性閱讀，這不影響整體的閱讀體驗。但正如本書最后所說：“只有通過實踐才能真正學到東西。”通過實踐來深入學習算法是學習任何人工智能技術的正確途徑，希望讀者朋友盡可能地動手實踐強化學習，相信你們一定能夠真正掌握這門具有長遠前景的技術。

官术网_书友最值得收藏!

Python強化學習：算法、核心技術與行業應用

THE TRANSLATOR'S WORDS 譯者序

THE TRANSLATOR'S WORDS
譯者序