- 大語言模型:原理、應用與優化
- 蘇之陽 王錦鵬 姜迪 宋元峰
- 411字
- 2024-12-18 17:06:22
1.1.3 傳統語言模型的應用
傳統語言模型輸出的概率通常作為一個標識單詞序列“合法性”的先驗打分,在語音識別、拼寫檢查、機器翻譯、光學字符識別、手寫識別中都會發揮關鍵作用。如果用X表示應用中的輸入,Y表示應用中的輸出,這些問題可以建模為如下數學問題:

其中,P(X|Y)是與具體應用相關的模型,P(Y)為針對Y的語言模型。
例如,在語音識別中,X表示輸入的音頻信號,Y表示識別出來的文本。P(X|Y)一般被稱為聲學模型(Acoustic Model),主要用于衡量識別出來的文本的發音和音頻的相似程度。P(Y)則為語言模型,用于衡量識別出來的文本是否符合語言的使用慣例,聲學模型和語言模型一起發揮作用,產生質量較好的識別結果。在機器翻譯中,X表示源語言書寫的文本,Y表示目標語言書寫的文本。P(X|Y)一般被稱為翻譯模型(Translation Model),主要用來衡量兩種語言書寫的文本是否具有相似的含義。語言模型P(Y)的作用與在語音識別中的作用相同,衡量目標語言的文本是否符合該語言的使用慣例。