官术网_书友最值得收藏!

PREFACE
前言

為什么要寫本書

2022年11月30日,ChatGPT模型問世后,立刻在全球范圍內(nèi)掀起了軒然大波。無論是AI從業(yè)者還是非AI從業(yè)者,都在熱議ChatGPT極具沖擊力的交互體驗和驚人的生成內(nèi)容。各大廠紛紛入局大型語言模型,“百模”甚至“千模”大戰(zhàn)的帷幕慢慢被拉開。很多企業(yè)和高校也隨之開源了一些表現(xiàn)優(yōu)異的大型語言模型,例如GLM系列模型、LLaMA系列模型、CPM系列模型、Yi系列模型、Baichuan系列模型、Qwen系列模型、Mistral系列模型、DeepSeek系列模型、Moss模型等。但是大型語言模型距離真正落地,還有一段艱難的路要走,例如:如何優(yōu)化通用大型語言模型在領域上的效果,如何在某些場景中合理運用大型語言模型,如何確保生成內(nèi)容的穩(wěn)定性和安全性,如何確保大型語言模型可以在生產(chǎn)環(huán)境下穩(wěn)定使用等。

2023年,很多人在做底座大型語言模型的搭建、領域大型語言模型的預訓練或微調(diào),我們也出版了《ChatGPT原理與實戰(zhàn):大型語言模型的算法、技術(shù)和私有化》一書,對大型語言模型的知識體系進行了細致的梳理,并且通過實戰(zhàn)幫助讀者從零開始搭建自己的ChatGPT模型。但很多讀者反饋這本書對大型語言模型應用部分的講解不夠細致,并且隨著技術(shù)和時代的發(fā)展,大型語言模型如何進行場景落地變得尤為重要。

因此,經(jīng)過一番思考和準備之后,我們決定從大型語言模型的應用落地角度出發(fā),進一步系統(tǒng)梳理大型語言模型的相關(guān)技術(shù),幫助讀者學習如何利用開源的大型語言模型優(yōu)化自身領域或場景中的使用效果。

技術(shù)的變化是飛速的,在撰寫本書初期,OpenAI的GPTs應用還沒有提出,不少應用還沒有以產(chǎn)品形態(tài)呈現(xiàn)。隨著新的應用的推出,我們修改了相關(guān)章節(jié),目的是希望本書介紹的大型語言模型相關(guān)技術(shù)更具前沿性。技術(shù)會持續(xù)更新?lián)Q代,書中提到的很多技術(shù)也許在不遠的將來會被更強大的技術(shù)所取代,但這并不影響我們學習這一系列技術(shù),因為學習這些技術(shù)本身會引發(fā)更深層次的思考。

AI已來,學無止境,那么請各位與我們一起來迎接AGI(人工通用智能)的到來吧。

讀者對象

●AIGC(生成式人工智能)相關(guān)領域的師生。

●初入AI行業(yè)的從業(yè)人員。

●對大型語言模型感興趣的讀者。

本書特色

本書是一本集理論、實戰(zhàn)、應用與落地于一體的大型語言模型力作,具備以下特點。

1)理論聯(lián)系實際。本書不僅全面講解了大型語言模型的核心理論,如Transformer架構(gòu)和各種主流模型等,還深入探討了領域特定模型的應用,如法律、醫(yī)療、金融和教育領域,有助于讀者從多個維度理解和實踐大型語言模型。

2)實戰(zhàn)應用落地。本書詳細介紹了如何構(gòu)建具有個性化特點的大型語言模型應用,包括大型語言模型的微調(diào)方法、人類偏好對齊技術(shù),以及構(gòu)建具體應用的步驟等。通過實戰(zhàn)案例和深入淺出的講解,確保讀者能夠理解模型的構(gòu)建和優(yōu)化過程。

3)多樣化應用場景。本書通過展示大型語言模型在多種場景下的應用潛力,如角色扮演、信息抽取、知識問答等,引導讀者探索大型語言模型在不同領域的應用可能性,以激發(fā)讀者的創(chuàng)新思維,最終實現(xiàn)大型語言模型的應用創(chuàng)新。

4)應用發(fā)展洞察。本書結(jié)合了我們在AI領域的豐富經(jīng)驗,從基礎理論到實戰(zhàn)應用,從簡單模型應用到復雜系統(tǒng)應用,提供了全面的技術(shù)和應用視角。通過分析大型語言模型的行業(yè)應用、挑戰(zhàn)、解決方案以及未來的發(fā)展趨勢,為讀者在迅速變化的技術(shù)領域中應用大型語言模型提供了寶貴的參考。

如何閱讀本書

本書從邏輯上分為三部分。

第一部分(第1~3章)為基礎知識,深入探討大型語言模型的核心概念。第1章詳細介紹大型語言模型的基礎理論,包括常見的模型架構(gòu)、領域大型語言模型以及如何評估模型的性能。第2章解析模型微調(diào)的關(guān)鍵步驟,即數(shù)據(jù)的收集、清洗到篩選,直至微調(diào)訓練。第3章介紹如何將大型語言模型與人類偏好進行對齊,詳細介紹了基于人工反饋的強化學習框架及當前主流的對齊方法,旨在提供一個全面的視角來幫助讀者理解大型語言模型的發(fā)展和優(yōu)化路徑。

第二部分(第4~7章)著眼于大型語言模型的實際應用,指導讀者構(gòu)建簡單但強大的應用程序。第4章展示如何利用GPTs來快速構(gòu)建一個個性化的專屬ChatGPT應用。第5章介紹Text2SQL應用的搭建,以及如何通過DeepSeek Coder模型進行定制化優(yōu)化。第6章探討角色扮演應用的構(gòu)建,并介紹了如何通過微調(diào)Baichuan模型來增強體驗。第7章聚焦于對話信息抽取應用的搭建,展示了如何通過微調(diào)Qwen模型來將大型語言模型有效地應用于實際場景中。

第三部分(第8~10章)帶領讀者挑戰(zhàn)更加復雜的應用的搭建。第8章介紹大型語言模型Agent以及常用框架。第9章深入RAG(檢索增強生成)模型的各個組件,展示了如何構(gòu)建一個基于知識庫的智能問答應用。第10章則基于LangChain框架,引導讀者構(gòu)建一個AutoGPT應用,展示了大型語言模型在自動化任務執(zhí)行中的潛力。

本書內(nèi)容豐富,旨在為讀者提供一個結(jié)構(gòu)清晰的學習路徑,無論是大型語言模型的新手還是有經(jīng)驗的開發(fā)者,都能從中獲得寶貴的知識和靈感。

勘誤和支持

由于水平有限,書中難免存在一些遺漏或者不夠準確的地方,懇請讀者批評指正。如果讀者發(fā)現(xiàn)了書中的錯誤,可以將其提交到https://github.com/liucongg/LLMsBook。同時,讀者遇到任何問題,歡迎發(fā)送郵件至郵箱logcongcong@gmail.com,我們將在線上提供解答。期待得到讀者的真摯反饋!

致謝

首先要感謝提出ChatGPT的每一位研究員,他們的堅持讓人工智能進入大型語言模型時代,讓我有機會體驗到人工智能的魅力,也讓我對人工智能有了新的認識。

感謝為大型語言模型開源社區(qū)貢獻力量的每一個人,他們的無私奉獻讓更多人體會到了大型語言模型的美好。

感謝我碩士期間的導師侯鳳貞以及本科期間的關(guān)媛、廖俊、胡建華、趙鴻萍、楊帆等老師,他們指引我走到今天。

感謝在“云問”共同奮斗的每一位充滿創(chuàng)意和活力的朋友:李平、楊萌、李辰剛、張雅冰、孟凡華、李蔓、付曉東、丁興華。由衷感謝云問公司創(chuàng)始人王清琛、茆傳羽、張洪磊對我工作的支持,十分榮幸可以與各位在一家創(chuàng)業(yè)公司一起為人工智能落地而努力奮斗。

感謝關(guān)注“NLP工作站”的社區(qū)成員以及所有粉絲,他們的支持才讓我有了不斷創(chuàng)作的動力。

最后感謝我的爸爸媽媽、爺爺奶奶,他們將我培養(yǎng)成人,并時時刻刻給予我信心和力量!

謹以此書獻給我親愛的妻子崔天宇!

劉聰

2024年2月

主站蜘蛛池模板: 大兴区| 大宁县| 龙江县| 湛江市| 东兰县| 台南市| 淳安县| 台南市| 常山县| 岳西县| 高要市| 大厂| 瑞金市| 丘北县| 定南县| 全椒县| 万宁市| 富平县| 临沧市| 图木舒克市| 罗江县| 宜川县| 龙里县| 兴国县| 翼城县| 隆尧县| 大名县| 贵定县| 平潭县| 斗六市| 图木舒克市| 平乐县| 丹棱县| 潜江市| 建平县| 阳山县| 磴口县| 米林县| 永仁县| 阳信县| 香港|