ChatGPT原理與實戰(zhàn):大型語言模型的算法、技術和私有化
這是一本系統(tǒng)梳理并深入解析ChatGPT核心技術、算法實現(xiàn)、工作原理、訓練方法的著作,也是一本能指導你搭建專屬ChatGPT和實現(xiàn)大模型遷移及私有化的著作。本書得到了MOSS系統(tǒng)負責人邱錫鵬等多位專家的高度評價和鼎力推薦。具體地,通過本書你能了解或掌握以下知識:ChatGPT的工作流程和技術棧;ChatGPT的工作原理和算法實現(xiàn);基于Transformer架構(gòu)的一系列預訓練語言模型的原理;強化學習的基礎知識;提示學習與大模型涌現(xiàn)出的上下文學習、思維鏈;大模型的訓練方法及常見的分布式訓練框架;基于人工反饋的強化學習整體框架;從零搭建類ChatGPT模型,模擬完整的ChatGPT訓練過程。本書集理論、實戰(zhàn)和產(chǎn)業(yè)應用于一體,提供大量經(jīng)詳細注釋的代碼,方便讀者理解和實操。總之,不管你是想深入研究ChatGPT本身,還是正在研發(fā)或使用其他大模型,本書都應該能給你頗具價值的技術啟發(fā)與思考,讓你在大模型的路上快速前行,少走彎路。
·13.2萬字