- ChatGPT原理與應(yīng)用開發(fā)
- 郝少春 黃玉琳 易華揮
- 2819字
- 2024-04-22 11:47:52
1.1 自然語言背景
1.1.1 語言是智能的標(biāo)志
很久以前,有一個神奇的星球,上面居住著各種各樣的生物。這些生物雖然各自擁有不同的能力,卻沒有辦法與其他種類的生物進(jìn)行有效溝通。因為在這個星球上,每個生物都有自己獨特的交流方式,無法理解其他生物的語言。
有一天,這個星球來了一個神秘的外星人。外星人告訴這些生物,他們可以通過學(xué)習(xí)一種全新的、獨特的溝通方式來實現(xiàn)相互之間的交流。這種溝通方式就是“語言”。外星人決定將這種神奇的溝通能力賦予其中一種生物,讓其成為這個星球上唯一掌握語言能力的生物。為公平起見,外星人決定舉辦一場比賽,看哪種生物能夠最先學(xué)會這種神奇的語言。最終,只有人類表現(xiàn)出驚人的潛力。人類不僅迅速掌握了語言的基本知識,還能夠不斷地創(chuàng)造新的詞匯和表達(dá)方式。神秘的外星人宣布人類獲得了這場比賽的勝利,并將語言能力賦予人類。自此,人類成為這個星球上唯一掌握語言能力的生物。他們開始利用語言建立起復(fù)雜的社會體系,發(fā)展科學(xué)技術(shù),創(chuàng)作美麗的藝術(shù)作品,使得人類在這個星球上獨樹一幟。
當(dāng)然,這個故事并非真實發(fā)生,但是客觀來說,語言的確是人類所獨有的。在大自然億萬年的進(jìn)化過程中,每個特定的物種都擁有一些獨特的、精妙的技能。有些蝙蝠能用聲吶來鎖定飛行的昆蟲,有些候鳥則能在星座的導(dǎo)航下飛行數(shù)千千米。在這場“選秀比賽”中,人類成為唯一可以對呼氣時發(fā)出的聲音進(jìn)行各種調(diào)控,以達(dá)到交流信息、描述事件目的的靈長類動物。正是因為掌握了語言這一強大的工具,人類得以在漫長的歷史進(jìn)程中不斷地發(fā)展和進(jìn)行創(chuàng)新。無論是社會交往、科學(xué)探索還是藝術(shù)創(chuàng)作,語言都發(fā)揮著至關(guān)重要的作用,成為人類獨特的精神象征。而語言也自然而然地成為了人類有別于其他物種的標(biāo)志性特征。換句話說,如果哪個物種掌握了語言,也就意味著這個物種誕生了智能。因此,從人工智能(artificial intelligence,AI)的概念建立伊始,機器能否具備使用自然語言同人類溝通交流的能力,就成了機器是否具有類人智能的一條重要標(biāo)準(zhǔn)。
1.1.2 從圖靈測試到ChatGPT
1950年,圖靈發(fā)表論文“Computing Machinery and Intelligence”,提出并嘗試回答“機器能否思考”這一關(guān)鍵問題。在這篇論文中,圖靈提出了“圖靈測試”(即模仿游戲)的概念,用來檢測機器智能水平。圖靈測試的核心思想是,如果一個人(代號C)使用測試對象都能理解的語言詢問兩個他不能看見的對象任意一串問題,其中一個是正常思維的人(代號B),另一個是機器(代號A)。如果經(jīng)過若干詢問以后,測試者C不能得出實質(zhì)的區(qū)別來分辨A與B的不同,則機器A通過圖靈測試(見圖1-1)。

圖1-1 圖靈測試
1956年,人工智能正式成為一個科學(xué)上的概念,隨后涌現(xiàn)了很多新的研究目標(biāo)與方向。雖然圖靈測試只是一個啟發(fā)性的思想實驗,而非可以具體執(zhí)行的判斷方法,但圖靈通過這個假設(shè),闡明了“智能”判斷的模糊性與主觀性。從此以后,圖靈測試成為NLP任務(wù)的一個重要評測標(biāo)準(zhǔn)。圖靈測試提供了一種客觀和直觀的方式來評估機器是否具有智能,即通過讓機器與人進(jìn)行對話來判斷機器的智能水平。這種方式可以避免對智能本質(zhì)的哲學(xué)爭論,也可以繞開智能具體表現(xiàn)形式的技術(shù)細(xì)節(jié)。因此,很多NLP任務(wù)都可以用圖靈測試來進(jìn)行評測,如聊天機器人、問答系統(tǒng)、文本生成等。
NLP是計算機科學(xué)、人工智能和語言學(xué)的交叉領(lǐng)域,關(guān)注的是計算機和人類語言之間的相互作用。常見的NLP任務(wù)和應(yīng)用包括信息抽取、文本分類、文本摘要、機器翻譯、問答系統(tǒng)、聊天機器人等。圖靈測試與NLP任務(wù)有著密切而復(fù)雜的關(guān)系,可以從以下兩個方面來概括。
● 圖靈測試是NLP任務(wù)的一個重要驅(qū)動力。圖靈測試提出了一個具有挑戰(zhàn)性和吸引力的目標(biāo),即讓機器能夠用自然語言與人類進(jìn)行流暢、智能、多樣化的對話。為了達(dá)到這個目標(biāo),NLP領(lǐng)域不斷地發(fā)展和創(chuàng)新各種技術(shù)和方法,以提高機器對自然語言的理解和生成能力。例如,為了讓機器能夠回答用戶提出的問題,就需要研究問答系統(tǒng)這一NLP任務(wù);為了讓機器能夠根據(jù)用戶提供的信息生成合適的文本,就需要研究文本生成這一NLP任務(wù);為了讓機器能夠適應(yīng)不同領(lǐng)域和場景的對話,就需要研究領(lǐng)域適應(yīng)和情境感知這一NLP任務(wù);等等。
● 圖靈測試是NLP任務(wù)的一個重要目標(biāo)。圖靈測試提出了一個具有前瞻性和理想性的愿景,即讓機器能夠達(dá)到與人類相同甚至超越人類的智能水平。這個愿景激發(fā)了很多NLP領(lǐng)域的研究者和開發(fā)者,使他們不斷地探索和創(chuàng)新,以期實現(xiàn)真正意義上的自然語言的理解和生成。例如,為了讓機器能夠理解用戶提出的問題,就需要研究語義分析、知識表示、邏輯推理;為了讓機器能夠生成符合用戶需求的文本,就需要研究文本規(guī)劃、文本風(fēng)格、文本評價;為了讓機器能夠與用戶建立信任和情感的聯(lián)系,就需要研究情感分析、情感生成、情感對話;等等。
NLP與人工智能發(fā)展史有著密切而復(fù)雜的關(guān)系。它們相互促進(jìn)、相互影響、相互依存、互為目標(biāo)。NLP在人工智能發(fā)展史上有很多有著里程碑意義的成果。
● 1954年,IBM實現(xiàn)了世界上第一個機器翻譯系統(tǒng)——將俄語翻譯成英語。
● 1966年,Joseph Weizenbaum開發(fā)了ELIZA——一種模擬心理治療師的聊天機器人。
● 1972年,Terry Winograd開發(fā)了SHRDLU——一種能夠理解和生成自然語言的程序,用于控制一個虛擬的機器人在一個虛擬的世界中進(jìn)行操作。
● 2011年,蘋果公司推出了Siri——一種基于NLP技術(shù)的智能語音助手。同年,IBM的Watson戰(zhàn)勝了《危險邊緣》節(jié)目的冠軍選手,展示了NLP技術(shù)在問答領(lǐng)域的強大能力。
● 2013年,谷歌公司推出了Word2Vec——一種基于神經(jīng)網(wǎng)絡(luò)的詞向量表示方法,開啟了NLP領(lǐng)域的深度學(xué)習(xí)時代。
● 2016年,F(xiàn)acebook(如今的Meta)發(fā)布了fastText——一種文本分類工具,它可以在處理大規(guī)模文本分類任務(wù)時取得很好的效果。
● 2017年,谷歌公司發(fā)布了一篇很可能是人工智能發(fā)展史上最重要的一篇論文“Attention is All You Need”,這篇論文的作者在其中提出了Transformer——一個具有多頭注意力機制的模型,它在文本特征提取方面取得了優(yōu)異的效果。
● 2018年,谷歌公司發(fā)布了BERT(bidirectional encoder representations from transformers,基于Transformer的雙向編碼器表示)預(yù)訓(xùn)練模型,它在多項NLP任務(wù)上取得了最佳效果。
● 2020年,OpenAI發(fā)布的GPT-3模型有多達(dá)1750億個參數(shù),它可以在提供少量樣本或不提供樣本的前提下完成大多數(shù)NLP任務(wù)。
以上這些成果依賴于NLP技術(shù)的不斷發(fā)展。時間來到2022年,終于輪到我們的主角隆重登場。2022年11月30日,OpenAI發(fā)布了一款智能聊天機器人——ChatGPT(見圖1-2)。ChatGPT一經(jīng)發(fā)布就立刻點燃了人工智能圈,僅僅5天用戶量就達(dá)到了100萬。OpenAI不得不緊急擴容,用戶發(fā)現(xiàn)ChatGPT不僅能很自然流暢地和人聊天,還能寫論文、講笑話、編段子、生成演講稿、寫請假條、模仿導(dǎo)師寫推薦信,甚至幫你寫代碼、寫營銷策劃案等。擁有了ChatGPT,就像你的身邊有了一個功能強大的秘書。到了2023年1月,ChatGPT就成為史上用戶量最快達(dá)到1億的應(yīng)用。

圖1-2 ChatGPT官方網(wǎng)站(圖片源自O(shè)penAI)
無論是ChatGPT,還是其他后來的追隨者,它們其實都是語言模型,準(zhǔn)確來說是大語言模型。在使用它們時,無論是調(diào)用接口還是開源項目,總有一些參數(shù)可能需要調(diào)整。對大部分業(yè)內(nèi)人員來說,這應(yīng)該都不成問題;但對非業(yè)內(nèi)人員來說,這就有點稍顯專業(yè)了。本章接下來主要介紹ChatGPT相關(guān)技術(shù)的基本原理,我們盡量以淺顯的語言來表述,雖不能深入細(xì)節(jié),但知曉原理足以讓讀者很好地使用ChatGPT。
- 人工智能
- DeepSeek實操指南:引爆AI時代個人效率核聚變
- 機器學(xué)習(xí)的算法分析和實踐
- 機器學(xué)習(xí)公式詳解(第2版)
- 決策智能:鏈接數(shù)據(jù)、行為和結(jié)果的新智能
- 人工智能:現(xiàn)代方法(第4版)
- 深度學(xué)習(xí)在醫(yī)學(xué)圖像中的應(yīng)用
- 腦機穿越:腦機接口改變?nèi)祟愇磥?/a>
- DeepSeek高效提問指南:提出好問題,才有好答案
- 人工智能:從科幻中復(fù)活的機器人革命
- 碼農(nóng)的零門檻AI課:基于fastai與PyTorch的深度學(xué)習(xí)
- 里武林的沉淪囈語:AI人工智能游戲概念設(shè)定集
- 顛覆:AI時代的企業(yè)管理方式大變革
- 未來制造:人工智能與工業(yè)互聯(lián)網(wǎng)驅(qū)動的制造范式革命
- Manus應(yīng)用與AI Agent設(shè)計指南:從入門到精通