- 揭秘大模型:從原理到實(shí)戰(zhàn)
- 文亮 江維
- 687字
- 2025-04-17 18:46:09
前言
寫作背景
2022年11月,OpenAI發(fā)布了一款通用大模型ChatGPT。ChatGPT不僅能夠回答用戶問題、生成文本,還能夠完成文章摘要、多語言翻譯等任務(wù)。2023年3月,OpenAI的首席執(zhí)行官山姆·奧爾特曼(Sam Altman)宣布了他們的最新人工智能系統(tǒng)——GPT-4。GPT-4支持多模態(tài),在各方面的表現(xiàn)都有顯著的提升,GPT-4的發(fā)布讓大模型的熱度達(dá)到了新的高峰。在首屆開發(fā)者大會(huì)上,OpenAI首次公開了AI Agent相關(guān)功能,讓用戶可以自己構(gòu)建GPT。OpenAI還開放了許多新的API(包括視覺API、圖像DALL-E 3、語音API等),讓開發(fā)者可以更方便地構(gòu)建自己專屬的GPT。
2023年3月,百度發(fā)布了文心一言大模型,打響了國(guó)內(nèi)大模型市場(chǎng)的“第一槍”。2023年4月,阿里云發(fā)布了通義千問大模型。2023年7月,華為發(fā)布了盤古大模型3.0……國(guó)內(nèi)大模型呈現(xiàn)百花齊放的狀態(tài)。2023年10月,百度發(fā)布了文心一言4.0大模型,并開啟了付費(fèi)模式,成為國(guó)內(nèi)第一家面向C端的付費(fèi)大模型。
在這個(gè)大模型火爆全球、快速發(fā)展的今天,我們有必要系統(tǒng)地梳理大模型的知識(shí)結(jié)構(gòu),撥開大模型的層層面紗,幫助讀者構(gòu)建大模型的技術(shù)框架。本書將從模型結(jié)構(gòu)、訓(xùn)練優(yōu)化、推理優(yōu)化、應(yīng)用場(chǎng)景等方面,全方位解讀大模型。本書介紹的大模型主要基于GPT結(jié)構(gòu),如清華大學(xué)的GLM、Meta公司的Llama等。本書還將介紹業(yè)界提出的稀疏Transformer、混合精度訓(xùn)練、并行訓(xùn)練等各種優(yōu)化技術(shù),這些技術(shù)顯著提升了大模型的訓(xùn)練速度。
2022年7月,一款名為Midjourney的AI繪畫工具的公測(cè)將AIGC的熱度推向新高峰。AIGC和大模型的強(qiáng)強(qiáng)聯(lián)合,使得大模型的應(yīng)用越來越廣泛。GPT-4、文心一言、訊飛星火等大模型都選擇了和AIGC結(jié)合,不僅能生成文字,還能生成各種新奇的圖像。Stable Diffusion作為文生圖的主流模型,越來越受到業(yè)界的關(guān)注,基于Stable Diffusion的應(yīng)用也越來越廣泛。本書將對(duì)Stable Diffusion模型進(jìn)行介紹。
- 人工智能時(shí)代的超思考法
- 智能移動(dòng)機(jī)器人:技術(shù)與應(yīng)用(人工智能技術(shù)叢書)
- 智能化社會(huì):未來人們?nèi)绾紊睢⑾鄲酆退伎?/a>
- 從零開始:機(jī)器學(xué)習(xí)的數(shù)學(xué)原理和算法實(shí)踐
- 人工智能:從科幻中復(fù)活的機(jī)器人革命
- 強(qiáng)化學(xué)習(xí):原理與Python實(shí)現(xiàn)
- 開啟AI新紀(jì)元(全2冊(cè))
- 人工智能初學(xué)者指南
- Unity虛擬現(xiàn)實(shí)開發(fā)實(shí)戰(zhàn)
- 通用人工智能:初心與未來
- 人類的終極命運(yùn)
- 機(jī)器學(xué)習(xí)實(shí)戰(zhàn):基于Scikit-Learn、Keras和TensorFlow(原書第2版)
- 機(jī)器學(xué)習(xí)中的統(tǒng)計(jì)思維(Python實(shí)現(xiàn))
- 與機(jī)器人共舞
- 智能計(jì)算:原理與實(shí)踐