4.2 基于人類反饋的強(qiáng)化學(xué)習(xí)
書名: 大語言模型:原理、應(yīng)用與優(yōu)化作者名: 蘇之陽 王錦鵬 姜迪 宋元峰本章字?jǐn)?shù): 314字更新時間: 2024-12-18 17:06:36
上QQ閱讀APP看后續(xù)精彩內(nèi)容
登錄訂閱本章 >
推薦閱讀
- 人工智能安全
- 工業(yè)人工智能
- 機(jī)器學(xué)習(xí)算法評估實(shí)戰(zhàn)
- PyTorch神經(jīng)網(wǎng)絡(luò)實(shí)戰(zhàn):移動端圖像處理
- 洞見未來的“元宇宙”世界(套裝8冊)
- 智能體時代
- 基于NI Multisim 11的PLD/PIC/PLC的仿真設(shè)計
- 文心一言:人人都能上手的AI工具
- 機(jī)器學(xué)習(xí)基礎(chǔ):從入門到求職
- 人工智能數(shù)據(jù)處理
- 一本書搞定起名:AI起名指南
- 人工溝通與法:算法如何生產(chǎn)社會智能
- 腦機(jī)革命
- AIoT系統(tǒng)開發(fā):基于機(jī)器學(xué)習(xí)和Python深度學(xué)習(xí)
- ROS機(jī)器人高效編程(原書第3版)