官术网_书友最值得收藏!

前言

為什么要寫本書

2022年11月30日,ChatGPT模型問世并立刻在全球范圍內引起了軒然大波。無論AI從業者還是非從業者,都在熱議ChatGPT極具沖擊力的交互體驗和驚人的生成內容。這使得人們對人工智能的潛力和價值有了更深入的認識。對于AI從業者來說,ChatGPT模型成為一種思路的擴充,大型語言模型不再是刷榜的玩具,所有人都認識到高質量數據的重要性,并堅信“有多少人工,就會有多少智能”。ChatGPT模型效果過于優秀,在許多任務上,即使是零樣本或少量樣本數據也可以達到SOTA(Stafe Of The Art,最高水準)效果,因而很多人轉向大型語言模型的研究。

不僅Google提出了對標ChatGPT的Bard模型,國內也涌現出了許多中文大型語言模型,如百度的“文心一言”、阿里巴巴的“通義千問”、昆侖萬維的“天工3.5”、商湯的“日日新”、知乎的“知海圖AI”、清華智譜的“ChatGLM”、復旦的“MOSS”等等。斯坦福大學的Alpaca模型問世之后,證明了70億參數量的模型雖然達不到ChatGPT的效果,但已經極大地降低了大型語言模型的算力成本,使得普通用戶和一般企業也可以使用大型語言模型。之前一直強調的數據獲取問題,可以通過GPT-3.5或GPT-4接口來解決,并且數據質量相當高。如果只需要基本的效果模型,數據是否再次精標已經不是那么重要了(當然,要獲得更好的效果,則需要更精準的數據)。

在此期間,涌現出了大量相關的博客、論文和開源項目。筆者的感覺是“每天都要學習太多東西,但所學的內容都太零散了”。經過一番思考和準備之后,筆者決定系統地梳理目前ChatGPT所涉及的相關技術,以幫助讀者進行深入的學習。本書主要強調知識的系統性和完整性,這是網絡學習所無法替代的。技術書可以彌補新媒體碎片化教育的短板,閱讀圖書更便于查漏補缺。正規的技術書在內容嚴謹性方面做得相對較好,對內容的正確性和規范性要求極高,更適合從業人員進行學習和日常檢索。當然,學習的道路并不是非此即彼,只有利用各種方式,多渠道學習,才能真正實現全方位高效學習。

技術的變化是飛速的,在撰寫本書初期,還沒有出現LLaMa、GPT-4、ChatGLM等模型,當它們出現之后我們隨之修改了相關內容,以期本書介紹ChatGPT相關技術時更具前沿性。技術會持續更新換代,書中提到的很多技術也許在不遠的將來便會被更為強大的技術所取代,但這并不影響我們學習這些技術的原理,因為學習這些技術本身會引發更深層次的思考。

讀者對象

本書適合以下讀者閱讀:

?AIGC(AI Generated Content,人工智能生成內容)相關領域的研究人員或技術人員。

?初入AI行業且基礎不深的從業人員。

?對ChatGPT感興趣的非從業人員。

本書特色

本書是一本集理論、實戰和落地于一體的ChatGPT力作,具備以下特點。

?理論聯系實際:本書不僅全面介紹了自然語言處理與強化學習的相關理論知識,還通過案例講解使這些理論更易于理解和掌握,幫助讀者在實踐過程中更深入地了解這些領域的基礎和前沿動態。

?實戰應用落地:本書詳細介紹了如何從零開始,逐步構建一個獨立且具有個性化特點的大型語言模型。通過分析代碼和實際案例,幫助讀者更好地理解和掌握相關技術,從而實現自己的創新應用。

?擴展AIGC視野:本書針對AIGC領域進行全方位的剖析,而非僅關注ChatGPT本身。這使得讀者能夠全面了解AIGC的發展歷程、技術原理、應用場景和未來趨勢,為自己的研究和實踐提供更廣闊的視野。

?洞悉行業發展:本書作者具有豐富的AI從業經驗,對AI領域的發展動態、技術挑戰和應用前景有深刻的認識。因此,本書不僅提供了嚴謹的技術分析,還融入了作者的專業洞察,幫助讀者在理論與實踐之間找到最佳的平衡點。

如何閱讀本書

本書從邏輯上分三部分。

第一部分(第1和2章)從宏觀角度帶領讀者了解ChatGPT。第1章介紹ChatGPT的由來、發展史以及用例。第2章對ChatGPT進行解構,基于AIGC相關背景知識逐步展開ChatGPT所應用的技術棧,讓讀者對ChatGPT有更加完整的認知。

第二部分(第3~9章)介紹ChatGPT的核心技術。本書強調理論與實戰并行,在介紹相關技術的同時,針對相應核心算法展開實戰,在真實中文數據集下驗證算法性能,讓讀者從更深層次了解相關算法。第3章介紹基于Transformer結構的預訓練語言模型。第4章介紹強化學習的基礎知識。第5章介紹從提示學習與大型語言模型涌現出來的上下文學習、思維鏈等能力。第6章介紹大型語言模型的訓練方法及常見的分布式訓練框架。第7章重點對GPT系列模型進行分析。第8章介紹PPO強化學習算法以及基于人工反饋的強化學習整體框架的設計。第9章進行類ChatGPT的實戰,通過文檔生成問題任務模擬完整的ChatGPT訓練過程。

第三部分(第10章)對ChatGPT的未來發展進行展望。從AIGC未來發展方向出發,探索云邊協同、工具應用、可控生成、輔助決策四方面內容,分別從C端場景和B端場景探索ChatGPT與實際應用場景的結合點,并給出從事AIGC行業的參考建議。

勘誤和支持

由于作者水平有限,書中難免存在一些遺漏或者不夠準確的地方,懇請讀者批評指正。如果你發現了書中的錯誤或遇到任何問題,可以將其提交到https://github.com/liucongg/ChatGPTBook,也可以發送郵件至郵箱logcongcong@gmail.com,我們將在線上提供解答。期待得到你的真摯反饋。

致謝

首先要感謝提出ChatGPT的每一位研究員,是他們的堅持讓我們有機會體驗到如此偉大的模型,也讓我們對人工智能有了新的認識。

感謝我的碩士導師侯鳳貞以及本科期間的關媛老師、廖俊老師、胡建華老師、趙鴻萍老師、楊帆老師等,是他們指引我走到今天。

感謝我的朋友杜振東、涂銘、沈盛宇與我一起編寫本書,他們的專業知識讓本書增色不少。

由衷感謝云問公司創始人王清琛、茆傳羽、張洪磊對我工作的支持,并感謝在云問共同奮斗的每一位充滿創意和活力的朋友:張蹲、李平、林思琦、楊萌、王杰、楊兆良、李辰剛、張榮松、徐健、張媛媛、張雅冰、孟凡華、李蔓,以及其他很多朋友。十分榮幸可以同各位在一家創業公司一起為人工智能落地而努力奮斗。

最后感謝我的爸爸媽媽、爺爺奶奶,感謝他們將我培養成人,并時時刻刻給予我信心和力量!謹以此書獻給我親愛的妻子崔天宇!

劉聰

主站蜘蛛池模板: 德惠市| 陆良县| 肃宁县| 石城县| 望江县| 定陶县| 汉川市| 云阳县| 瓮安县| 天全县| 通榆县| 泸水县| 奉新县| 吉水县| 白城市| 玛纳斯县| 贵阳市| 辰溪县| 邹平县| 武宣县| 昌都县| 常德市| 杭锦后旗| 绥江县| 修武县| 金华市| 西畴县| 昌黎县| 崇义县| 南郑县| 鸡泽县| 赣榆县| 珠海市| 湖南省| 灵璧县| 南丰县| 如东县| 镇江市| 依兰县| 扬中市| 普洱|