官术网_书友最值得收藏!

第1章 語言模型簡(jiǎn)介

語言模型(Language Model)是使用統(tǒng)計(jì)方法或者神經(jīng)網(wǎng)絡(luò)來計(jì)算單詞或單詞序列出現(xiàn)的概率的模型。通過語言模型,我們可以計(jì)算某個(gè)單詞或單詞序列在自然語言中出現(xiàn)的概率。例如,單詞序列w1w2,…,wm的概率可以通過如下公式計(jì)算:

通過語言模型,我們還可以方便地估算在某個(gè)自然語言的上下文中下一個(gè)詞出現(xiàn)的概率。例如,我們把w1w2,…,wi-1看作上下文,則某個(gè)單詞w出現(xiàn)在第i個(gè)位置上的概率為

由上面的公式可以看到,如果想使用語言模型,首先需要獲得每個(gè)單詞在多種上下文中的條件概率,而獲得這些條件概率的過程稱為訓(xùn)練語言模型。訓(xùn)練語言模型的邏輯比較簡(jiǎn)單,首先需要準(zhǔn)備一些文本語料并在這些文本中的某些位置選取一些單詞,然后讓語言模型根據(jù)上下文去預(yù)測(cè)這些位置上的單詞,并根據(jù)預(yù)測(cè)結(jié)果正確與否更新語言模型的參數(shù),用大量的文本數(shù)據(jù)不斷重復(fù)這個(gè)過程之后,我們最終會(huì)得到語言模型中各個(gè)單詞在不同上下文中的條件概率。

雖然不同語言模型的訓(xùn)練目標(biāo)基本一致,但是它們的技術(shù)特點(diǎn)和實(shí)際用途卻有很大的區(qū)別,我們將其歸類為傳統(tǒng)語言模型和大語言模型(Large Language Model,LLM)。本章將介紹這兩類模型的發(fā)展歷程和技術(shù)特點(diǎn),并對(duì)它們的應(yīng)用方式進(jìn)行比較和討論。

主站蜘蛛池模板: 苏尼特右旗| 旬邑县| 三门县| 张家港市| 顺义区| 紫金县| 句容市| 开阳县| 阿荣旗| 巫溪县| 洞头县| 蒲城县| 平陆县| 宜君县| 满洲里市| 建湖县| 滨州市| 天祝| 东港市| 高州市| 泸西县| 江达县| 甘德县| 泸定县| 若尔盖县| 通海县| 阳春市| 樟树市| 时尚| 集贤县| 涪陵区| 大方县| 册亨县| 竹溪县| 忻州市| 方正县| 亚东县| 洪湖市| 福鼎市| 贺州市| 行唐县|