- 大模型RAG實(shí)戰(zhàn):RAG原理、應(yīng)用與系統(tǒng)構(gòu)建
- 汪鵬 谷清水 卞龍鵬
- 295字
- 2024-10-29 18:53:33
1.3.3 答案生成
一旦檢索到用戶問(wèn)題相關(guān)的數(shù)據(jù)片段,RAG系統(tǒng)就將其與用戶的問(wèn)題和相關(guān)數(shù)據(jù)一起傳遞給生成器(LLM)。LLM利用檢索到的數(shù)據(jù)和用戶的查詢或任務(wù)生成輸出。輸出的質(zhì)量取決于數(shù)據(jù)的質(zhì)量和檢索策略,同時(shí)生成輸出的指令也會(huì)極大地影響輸出的質(zhì)量。
在中文的開源大模型中,對(duì)于70億、140億規(guī)模的開源模型,Qwen-chat是一個(gè)不錯(cuò)的選擇。相較于ChatGLM、Baichuan等開源大模型,Qwen-chat具有更少的幻覺,更適用于大模型檢索增強(qiáng)生成的模式。在RAG場(chǎng)景下,幻覺主要體現(xiàn)在跳脫知識(shí)片段回答問(wèn)題上,即回答的答案并不出現(xiàn)在增強(qiáng)的知識(shí)片段中。模型對(duì)于未知答案的拒絕能力也屬于這個(gè)范疇。對(duì)于參數(shù)量不夠大的模型,可以考慮通過(guò)適量數(shù)據(jù)的微調(diào)來(lái)提升模型在問(wèn)答場(chǎng)景的效果。
推薦閱讀
- Spring Boot+Spring Cloud+Vue+Element項(xiàng)目實(shí)戰(zhàn):手把手教你開發(fā)權(quán)限管理系統(tǒng)
- Oracle數(shù)據(jù)庫(kù)從入門到運(yùn)維實(shí)戰(zhàn)
- PLC編程及應(yīng)用實(shí)戰(zhàn)
- TypeScript實(shí)戰(zhàn)指南
- 鋒利的SQL(第2版)
- Linux命令行與shell腳本編程大全(第4版)
- Expert Data Visualization
- Getting Started with Hazelcast(Second Edition)
- Visual Foxpro 9.0數(shù)據(jù)庫(kù)程序設(shè)計(jì)教程
- C語(yǔ)言程序設(shè)計(jì)實(shí)訓(xùn)教程與水平考試指導(dǎo)
- Clojure Web Development Essentials
- 深入大型數(shù)據(jù)集:并行與分布化Python代碼
- 軟技能2:軟件開發(fā)者職業(yè)生涯指南
- 走近SDN/NFV
- Mastering R for Quantitative Finance