- 大模型RAG實戰:RAG原理、應用與系統構建
- 汪鵬 谷清水 卞龍鵬
- 400字
- 2024-10-29 18:53:30
1.2 為什么需要RAG
1.2.1 大模型的知識更新問題
前文提到大模型的知識源于預訓練階段。通過大量的無監督數據,利用下一個詞預測任務來完成訓練。待訓練完成之后,模型便能將大量的知識壓縮到自身的參數中。然而,在互聯網時代,知識更新迅速,導致大模型難以實時更新所蘊含的知識。
由于存在知識更新問題,當詢問模型一些訓練語料截止日期之后的問題時,模型很可能會給出過時的答案。如圖1-3所示,當詢問GPT-3.5-turbo(0315)“拼多多的CEO是誰?”時,它回答:“拼多多的CEO是黃崢。”然而,實際上早在2020年7月,黃崢就已公開表示卸任拼多多的CEO。
同樣的問題,我們可以咨詢Bing Chat。Bing Chat是微軟發布的一個針對瀏覽器的CoPilot。整體上,這個CoPilot是一個典型的RAG落地應用。當瀏覽器獲取到用戶咨詢的問題之后,會借助自己的搜索引擎搜索出問題相關的網頁,最后結合網頁的內容以及用戶問題進行答案生成。如圖1-4所示,當向Bing Chat詢問“拼多多的CEO是誰?”時,我們得到了正確的答案。

圖1-3 GPT-3.5-turbo(0315)回答結果

圖1-4 Bing Chat回答結果
推薦閱讀
- Mastering OpenLayers 3
- 程序員修煉之道:程序設計入門30講
- DBA攻堅指南:左手Oracle,右手MySQL
- Django開發從入門到實踐
- 物聯網系統開發:從0到1構建IoT平臺(第2版)
- Mastering ServiceNow(Second Edition)
- QGIS By Example
- C語言程序設計教程
- Tableau 10 Bootcamp
- Statistical Application Development with R and Python(Second Edition)
- Android開發三劍客:UML、模式與測試
- Citrix XenServer企業運維實戰
- AV1視頻編解碼標準:原理與算法實現
- Python Programming for Arduino
- 安卓工程師教你玩轉Android