第八章 語(yǔ)言的輸入A
一、正轉(zhuǎn)錄流程描述
在前面較為寬泛的討論之后,我們已經(jīng)熟悉了應(yīng)該熟悉的概念,做好了精確討論的準(zhǔn)備,本章我們開(kāi)始描述和正轉(zhuǎn)錄相關(guān)的工程上的設(shè)計(jì)。
人類(lèi)處理輸入的語(yǔ)言,無(wú)論是一句話(huà)表達(dá),還是成段的表達(dá),還是一本書(shū)的信息,都是以每個(gè)單句作為信息單元逐句處理的。處理的過(guò)程會(huì)維護(hù)一個(gè)語(yǔ)境記憶,以應(yīng)對(duì)表達(dá)中的省略,形成對(duì)表達(dá)信息的主要邏輯,以及各種信息之間關(guān)系的提取。因?yàn)檎Z(yǔ)境記憶的存在,雖然是單句逐句處理,但最終攝取的信息卻不是零碎的。
對(duì)于單句信息。第一步,需要先識(shí)別當(dāng)中的詞匯,詞匯是構(gòu)建句子的積木。詞匯有三種類(lèi)型,第一種是背后有概念對(duì)應(yīng)的詞匯,比如“蘋(píng)果”“文化”;第二種是結(jié)構(gòu)信息的位格名稱(chēng),比如二元關(guān)系中的“爸爸”“仇人”;還有一類(lèi)是為了賦予句子足夠的結(jié)構(gòu)特征,方便聽(tīng)者識(shí)別的“結(jié)構(gòu)性詞匯”,比如中文中的“的”“是”“但是”“所以”等,英文中“is”“however”“because”等。
第二步,識(shí)別完詞匯后,會(huì)把第一類(lèi)對(duì)應(yīng)概念的詞匯用概念I(lǐng)D替換,第二類(lèi)對(duì)應(yīng)結(jié)構(gòu)信息位格名稱(chēng)的詞匯用結(jié)構(gòu)信息位格ID替換,結(jié)構(gòu)性詞匯保留原有形態(tài)。
第三步,如果第二步輸出的信息是合法的表達(dá),已經(jīng)能夠找到統(tǒng)轄它的句子結(jié)構(gòu)母類(lèi),接著我們要完成:
A.進(jìn)行統(tǒng)轄搜索。
B.找到統(tǒng)轄這個(gè)概念替換詞匯后的句子的句子結(jié)構(gòu)信息,并建立具體概念到句子結(jié)構(gòu)中對(duì)應(yīng)的較為抽象的概念的約束映射。
C.找到句子結(jié)構(gòu)信息對(duì)應(yīng)的表達(dá)單元信息。
D.用約束映射進(jìn)行表達(dá)單元信息中對(duì)應(yīng)抽象層概念的替換,演繹出具體的表達(dá)單元信息。
如果句子中包含嵌套結(jié)構(gòu),那么我們無(wú)法直接識(shí)別到最外層語(yǔ)法結(jié)構(gòu)(這里也就是指語(yǔ)法映射兩部分信息中的句子結(jié)構(gòu)信息),需要句子中包含的小語(yǔ)法結(jié)構(gòu),轉(zhuǎn)為所描述或指向的概念I(lǐng)D后,更大的語(yǔ)法結(jié)構(gòu)才會(huì)顯現(xiàn)出來(lái)。
以上是對(duì)正轉(zhuǎn)錄流程的簡(jiǎn)要描述,具體每步都會(huì)包含更多細(xì)節(jié)的內(nèi)容,需處理各種非理想化的情況,主要就是我們兩章前描述的所有自然語(yǔ)言都會(huì)遇到的4個(gè)問(wèn)題:(1)如何應(yīng)付嵌套,尤其是多重嵌套;(2)如何維護(hù)語(yǔ)境信息;(3)如何應(yīng)付語(yǔ)境省略和常識(shí)省略;(4)如何應(yīng)付意向表達(dá)。接下來(lái)我們就帶著這些問(wèn)題來(lái)具體討論每個(gè)環(huán)節(jié)的信息處理邏輯。
- 城堡里學(xué)無(wú)人機(jī):原理、系統(tǒng)與實(shí)現(xiàn)
- 機(jī)器學(xué)習(xí)公式詳解(第2版)
- 機(jī)器學(xué)習(xí)算法競(jìng)賽實(shí)戰(zhàn)
- 秒懂AI設(shè)計(jì):人人都能成為設(shè)計(jì)高手
- 生成式AI:人工智能的未來(lái)
- 智能浪潮:增強(qiáng)時(shí)代來(lái)臨
- 人工智能時(shí)代生存指南
- 深度學(xué)習(xí)在醫(yī)學(xué)圖像中的應(yīng)用
- 虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)技術(shù)
- 深度強(qiáng)化學(xué)習(xí)實(shí)踐(原書(shū)第2版)
- 破解深度學(xué)習(xí)(基礎(chǔ)篇):模型算法與實(shí)現(xiàn)
- 人工智能技術(shù)與大數(shù)據(jù)
- 深度學(xué)習(xí)實(shí)戰(zhàn):基于TensorFlow 2和Keras(原書(shū)第2版)
- 圖靈的大教堂:數(shù)字宇宙開(kāi)啟智能時(shí)代
- TensorFlow神經(jīng)網(wǎng)絡(luò)到深度學(xué)習(xí)