官术网_书友最值得收藏!

前言

為何寫作本書

自人類在20世紀(jì)40年代發(fā)明第一臺(tái)計(jì)算機(jī)以來,計(jì)算機(jī)科學(xué)一直在高速發(fā)展。在過去的幾十年里,計(jì)算機(jī)的計(jì)算速度和存儲(chǔ)容量都大幅提高,促進(jìn)了人工智能(Artificial Intelligence,AI)技術(shù)的發(fā)展和應(yīng)用。隨著深度學(xué)習(xí)技術(shù)的蓬勃發(fā)展,自然語言處理迅速崛起為人工智能領(lǐng)域的核心研究方向。在這個(gè)過程中,大語言模型(Large Language Model,LLM,本書簡稱為“大模型”)應(yīng)運(yùn)而生,成為自然語言處理領(lǐng)域近年來的一個(gè)重要成果。2022年11月30日,OpenAI推出新一代大模型ChatGPT,它表現(xiàn)出了令人驚艷的對(duì)話效果,回復(fù)有條理、有邏輯且多輪對(duì)話效果出色,引起了人們的廣泛關(guān)注。

ChatGPT的出圈引發(fā)了許多人對(duì)它和大模型工作原理的好奇。有人誤以為ChatGPT的工作方式類似于搜索引擎,背后有一個(gè)存儲(chǔ)海量文本的“數(shù)據(jù)庫”,ChatGPT通過在庫中檢索相關(guān)內(nèi)容與用戶進(jìn)行交互。事實(shí)上并非如此,ChatGPT更像是一個(gè)讀過海量書籍的智者,在讀懂了所有內(nèi)容之后,再將這些內(nèi)容按照人們期望的方式進(jìn)行回復(fù)。鑒于大家認(rèn)識(shí)上的誤區(qū),為了幫助大家深入了解ChatGPT是什么,它是如何工作的,又將如何改變我們的生活,筆者萌生了寫作本書的想法。

本書主要內(nèi)容

本書共10章,從邏輯上分為四部分:

第一部分(第1~4章)由語言模型的基本概念入手,介紹了大模型的基礎(chǔ)構(gòu)件、技術(shù)發(fā)展的脈絡(luò)及范式,以及模型對(duì)齊的方法。ChatGPT是一個(gè)大模型,而大模型首先是一個(gè)語言模型,語言模型是一種基于機(jī)器學(xué)習(xí)技術(shù)的自然語言處理模型,它可以學(xué)習(xí)語言的概率分布,從而實(shí)現(xiàn)對(duì)語言的理解和生成。大模型是一種新的技術(shù)范式,相較于傳統(tǒng)語言模型,它不僅 “大”,而且可以理解人類的意圖,并完成相應(yīng)的指令與任務(wù),也就是所謂的“對(duì)齊”與“指令跟隨”。經(jīng)過精心的訓(xùn)練,大模型甚至可以完成推理、規(guī)劃和具有創(chuàng)造性的復(fù)雜任務(wù)。

第二部分(第5章和第6章)詳細(xì)介紹了大模型的評(píng)測(cè)與分布式訓(xùn)練的基本原理。大模型的訓(xùn)練離不開算法、數(shù)據(jù)和算力的支撐,是一項(xiàng)需要大量投入的系統(tǒng)性工程。首先,研究者需要設(shè)計(jì)精巧的算法使得模型可以有效處理海量的數(shù)據(jù),從而解決語言的復(fù)雜性和上下文相關(guān)性等挑戰(zhàn)。其次,數(shù)據(jù)也是訓(xùn)練大模型的關(guān)鍵因素,這意味著我們需要收集、清洗和標(biāo)注大規(guī)模語料庫,以獲得足夠的高質(zhì)量訓(xùn)練數(shù)據(jù)。最后,隨著數(shù)據(jù)和模型規(guī)模的擴(kuò)大,訓(xùn)練模型所需要的算力和硬件資源也隨之不斷增加。得益于分布式訓(xùn)練和并行計(jì)算優(yōu)化,大模型的訓(xùn)練變得可行。

第三部分(第7~9章)著重介紹了大模型在垂直場(chǎng)景的應(yīng)用、知識(shí)融合與工具使用的方法及大模型優(yōu)化的高級(jí)話題。大模型具有廣泛的應(yīng)用前景,相較于傳統(tǒng)語言模型,大模型的適用場(chǎng)景更多,性能也更出色。它既可以作為客服助手,扮演各種角色與用戶進(jìn)行交互并完成任務(wù),又可以用于人工智能生成,協(xié)助用戶撰寫文章或報(bào)告,還可以用于翻譯任務(wù),理解源語言的內(nèi)容并生成目標(biāo)語言翻譯結(jié)果。此外,它還可以作為生產(chǎn)力工具編寫代碼,大幅提升程序員的編碼效率。隨著大模型技術(shù)的發(fā)展,這些應(yīng)用的上限也在不斷取得突破,同時(shí)有更多創(chuàng)新型應(yīng)用不斷涌現(xiàn)。

第四部分(第10章)展望了大模型未來的發(fā)展方向和挑戰(zhàn)。盡管大模型在眾多領(lǐng)域展現(xiàn)出卓越的性能,但也存在一些局限性。例如,大模型在生成輸出時(shí)常常會(huì)編造一些事實(shí),即使這類錯(cuò)誤屬于罕見情況,也對(duì)回答的可信度和可靠性造成了嚴(yán)重影響。此外,安全性問題也備受關(guān)注。若大模型被不當(dāng)使用,可能成為虛假新聞或釣魚郵件的源頭,甚至成為不法分子進(jìn)行違法犯罪活動(dòng)的“幫兇”。

全書力求系統(tǒng)和完備,在使各章內(nèi)容逐步遞進(jìn)的同時(shí),也兼顧了各章內(nèi)容的獨(dú)立性。讀者可根據(jù)需求按章順序?qū)W習(xí)或選擇特定內(nèi)容深入研究。希望本書能夠幫助讀者深入了解大模型相關(guān)知識(shí),同時(shí)能夠促進(jìn)大模型技術(shù)的發(fā)展和應(yīng)用。

本書讀者對(duì)象

·計(jì)算機(jī)科學(xué)、人工智能、自然語言處理等領(lǐng)域的專業(yè)人士和學(xué)者。

·對(duì)大模型感興趣的普通讀者。

資源和勘誤

限于作者水平,書中難免存在疏漏或不足之處,歡迎讀者批評(píng)指正。讀者可通過電子郵件llmbookfeedback@gmail.com聯(lián)系我們,期待收到讀者的寶貴意見和建議。

蘇之陽  

2024年5月  

主站蜘蛛池模板: 承德县| 兰州市| 田东县| 永昌县| 芒康县| 岐山县| 会宁县| 耿马| 崇文区| 禄丰县| 兴宁市| 镇沅| 新邵县| 禹城市| 报价| 钟祥市| 成安县| 江口县| 建湖县| 泾源县| 虹口区| 什邡市| 沁源县| 日照市| 隆昌县| 宣化县| 玛沁县| 新巴尔虎左旗| 荃湾区| 太原市| 杨浦区| 遂昌县| 宁远县| 炉霍县| 年辖:市辖区| 清涧县| 宁强县| 康马县| 靖西县| 饶平县| 云霄县|