官术网_书友最值得收藏!

CHAPTER 1
第1章 強(qiáng)化學(xué)習(xí)簡介

強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)旨在創(chuàng)建能夠在復(fù)雜和不確定的環(huán)境中做出決策的人工智能(Artificial Intelligence, AI)智能體,目標(biāo)是最大限度地提高其長期利益。這些智能體通過與環(huán)境交互來學(xué)習(xí)如何做到這一點(diǎn),這模仿了我們?nèi)祟悘慕?jīng)驗(yàn)中學(xué)習(xí)的方式。因此,強(qiáng)化學(xué)習(xí)擁有極其廣泛且適應(yīng)性強(qiáng)的應(yīng)用程序集,具有顛覆和徹底改變?nèi)蛐袠I(yè)的潛力。

本書將使你對(duì)該領(lǐng)域有一個(gè)更深層次的了解。我們將深入探討你可能已經(jīng)知道的一些算法背后的理論,并涵蓋最先進(jìn)的強(qiáng)化學(xué)習(xí)。而且,這是一本實(shí)用書籍。你將看到受現(xiàn)實(shí)行業(yè)問題啟發(fā)的示例,并在此過程中學(xué)習(xí)專家提示。根據(jù)其結(jié)論,你將能夠使用Python建模和解決你自己的序貫決策問題。

那么,我們將從刷新你對(duì)強(qiáng)化學(xué)習(xí)概念的思考來開始這段學(xué)習(xí)旅程,讓你為學(xué)習(xí)后續(xù)章節(jié)中出現(xiàn)的高級(jí)內(nèi)容做好準(zhǔn)備。

主站蜘蛛池模板: 丰县| 庄河市| 嘉峪关市| 法库县| 来安县| 大港区| 宾川县| 望谟县| 尉氏县| 汽车| 莒南县| 大宁县| 西昌市| 通州市| 兴海县| 麻栗坡县| 石城县| 达尔| 汉寿县| 高清| 鹰潭市| 平罗县| 新营市| 会昌县| 昌邑市| 乌兰察布市| 越西县| 普定县| 麻栗坡县| 米泉市| 丹东市| 阳曲县| 海宁市| 建阳市| 叙永县| 蒲城县| 安吉县| 五河县| 正阳县| 东阿县| 赫章县|