官术网_书友最值得收藏!

1.3 ChatGPT簡述

用戶與對話機(jī)器人之間的交互感知智能與否,主要涉及對“聽得懂、答得好”這兩部分的評估。前面所提到的Siri、小度、小愛等對話機(jī)器人雖然在“答得好”部分已經(jīng)做得非常不錯,但并不理解用戶說的話,尤其在多輪對話和復(fù)雜對話中。ChatGPT的驚艷表現(xiàn)主要來自“聽得懂”。它憑借大語言模型強(qiáng)大的功能很好地理解用戶意圖,在用戶交互感知智能方面有了突飛猛進(jìn)的進(jìn)展。

“聽得懂”是漫長的技術(shù)迭代及成功工程化、產(chǎn)品化的結(jié)果。AI三要素——數(shù)據(jù)、算法和算力是AI飛速發(fā)展的基石,如圖1.11所示。

數(shù)據(jù)是AI能力的源泉,AI模型只有在高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù)基礎(chǔ)之上訓(xùn)練才能得到高水平智能。結(jié)構(gòu)化數(shù)據(jù)是經(jīng)過人工大量的清洗和標(biāo)注所得到的符合模型訓(xùn)練要求的數(shù)據(jù)。模型對結(jié)構(gòu)化數(shù)據(jù)的學(xué)習(xí)即有監(jiān)督學(xué)習(xí)(Supervised Learning)。

以ChatGPT為代表的大語言模型主要通過無監(jiān)督學(xué)習(xí)(Unsupervised Learning)進(jìn)行訓(xùn)練,即不需要人工標(biāo)注直接學(xué)習(xí)原始數(shù)據(jù),從而使學(xué)習(xí)的數(shù)據(jù)量和效率大大提升。

只有用算法對數(shù)據(jù)進(jìn)行訓(xùn)練,才可能得到可用的模型。圖1.11中間的算法圖片橫軸是數(shù)據(jù)量,縱軸是模型的參數(shù)量(參數(shù)可控制模型的行為,由模型自動學(xué)習(xí)得到),可以看出,隨著AI模型可應(yīng)用的數(shù)據(jù)量越來越大,對應(yīng)模型參數(shù)越來越多。當(dāng)模型參數(shù)規(guī)模達(dá)到數(shù)十億甚至上百億的級別時,就會出現(xiàn)模型能力大幅度提升、智能涌現(xiàn)的情況,也就產(chǎn)生了如今類似ChatGPT的大語言模型的驚艷表現(xiàn)。當(dāng)然,大語言模型處理大數(shù)據(jù)的基礎(chǔ)是算力,即GPU等AI模型訓(xùn)練用的硬件設(shè)備所具備的性能,如圖1.11右圖所示。

圖1.11 AI三要素:數(shù)據(jù)、算法、算力

只有在數(shù)據(jù)、算法、算力三方面達(dá)到相對協(xié)調(diào)的高水平,才能產(chǎn)生“聽得懂、答得好”的ChatGPT。

主站蜘蛛池模板: 五河县| 建宁县| 万年县| 扎赉特旗| 林西县| 溧水县| 拉孜县| 漳州市| 瑞丽市| 丹凤县| 丹棱县| 奉节县| 康乐县| 灵台县| 神农架林区| 巩留县| 绥江县| 梁平县| 阿拉善盟| 策勒县| 石泉县| 乐都县| 土默特右旗| 耿马| 云梦县| 丰城市| 枞阳县| 台北县| 沙洋县| 桓台县| 三河市| 准格尔旗| 凤城市| 通辽市| 宁夏| 崇礼县| 海南省| 凯里市| 邢台县| 泰顺县| 杭锦后旗|