- Python強(qiáng)化學(xué)習(xí):算法、核心技術(shù)與行業(yè)應(yīng)用
- (美)埃內(nèi)斯·比爾金
- 334字
- 2024-04-15 11:57:25
CHAPTER 1
第1章 強(qiáng)化學(xué)習(xí)簡介
強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)旨在創(chuàng)建能夠在復(fù)雜和不確定的環(huán)境中做出決策的人工智能(Artificial Intelligence, AI)智能體,目標(biāo)是最大限度地提高其長期利益。這些智能體通過與環(huán)境交互來學(xué)習(xí)如何做到這一點(diǎn),這模仿了我們?nèi)祟悘慕?jīng)驗(yàn)中學(xué)習(xí)的方式。因此,強(qiáng)化學(xué)習(xí)擁有極其廣泛且適應(yīng)性強(qiáng)的應(yīng)用程序集,具有顛覆和徹底改變?nèi)蛐袠I(yè)的潛力。
本書將使你對(duì)該領(lǐng)域有一個(gè)更深層次的了解。我們將深入探討你可能已經(jīng)知道的一些算法背后的理論,并涵蓋最先進(jìn)的強(qiáng)化學(xué)習(xí)。而且,這是一本實(shí)用書籍。你將看到受現(xiàn)實(shí)行業(yè)問題啟發(fā)的示例,并在此過程中學(xué)習(xí)專家提示。根據(jù)其結(jié)論,你將能夠使用Python建模和解決你自己的序貫決策問題。
那么,我們將從刷新你對(duì)強(qiáng)化學(xué)習(xí)概念的思考來開始這段學(xué)習(xí)旅程,讓你為學(xué)習(xí)后續(xù)章節(jié)中出現(xiàn)的高級(jí)內(nèi)容做好準(zhǔn)備。
推薦閱讀
- DeepSeek算力革命簡史
- 空間智能原理與應(yīng)用
- 深度學(xué)習(xí)原理與應(yīng)用
- 基于信息增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法研究
- 機(jī)器人智能視覺感知與深度學(xué)習(xí)應(yīng)用
- 智能機(jī)器人(第二版)
- 智能控制
- 人類的終極命運(yùn)
- 深度學(xué)習(xí)視頻理解
- AI實(shí)操大全
- Linux人工智能開發(fā)實(shí)例
- 人工智能關(guān)我什么事
- 機(jī)器人傳感器及其信息融合技術(shù)
- 人工智能:理論基礎(chǔ)+商業(yè)落地+實(shí)戰(zhàn)場景+案例分析
- 人工智能導(dǎo)論