233乐园游戏

書名： Python強(qiáng)化學(xué)習(xí)：算法、核心技術(shù)與行業(yè)應(yīng)用
作者名： (美)埃內(nèi)斯·比爾金
本章字?jǐn)?shù)： 334字
更新時(shí)間： 2024-04-15 11:57:25

CHAPTER 1
第1章強(qiáng)化學(xué)習(xí)簡介

強(qiáng)化學(xué)習(xí)（Reinforcement Learning, RL）旨在創(chuàng)建能夠在復(fù)雜和不確定的環(huán)境中做出決策的人工智能（Artificial Intelligence, AI）智能體，目標(biāo)是最大限度地提高其長期利益。這些智能體通過與環(huán)境交互來學(xué)習(xí)如何做到這一點(diǎn)，這模仿了我們?nèi)祟悘慕?jīng)驗(yàn)中學(xué)習(xí)的方式。因此，強(qiáng)化學(xué)習(xí)擁有極其廣泛且適應(yīng)性強(qiáng)的應(yīng)用程序集，具有顛覆和徹底改變?nèi)蛐袠I(yè)的潛力。

本書將使你對(duì)該領(lǐng)域有一個(gè)更深層次的了解。我們將深入探討你可能已經(jīng)知道的一些算法背后的理論，并涵蓋最先進(jìn)的強(qiáng)化學(xué)習(xí)。而且，這是一本實(shí)用書籍。你將看到受現(xiàn)實(shí)行業(yè)問題啟發(fā)的示例，并在此過程中學(xué)習(xí)專家提示。根據(jù)其結(jié)論，你將能夠使用Python建模和解決你自己的序貫決策問題。

那么，我們將從刷新你對(duì)強(qiáng)化學(xué)習(xí)概念的思考來開始這段學(xué)習(xí)旅程，讓你為學(xué)習(xí)后續(xù)章節(jié)中出現(xiàn)的高級(jí)內(nèi)容做好準(zhǔn)備。

官术网_书友最值得收藏!

Python強(qiáng)化學(xué)習(xí)：算法、核心技術(shù)與行業(yè)應(yīng)用

CHAPTER 1 第1章 強(qiáng)化學(xué)習(xí)簡介

CHAPTER 1
第1章強(qiáng)化學(xué)習(xí)簡介