- 思維工程
- 錢小一
- 661字
- 2021-09-07 17:16:48
十、本章總結(jié)
這一章我們討論人類自然語言共有的特征。因為自然語言的演化遵循著一些基本邏輯,所以根據(jù)這些基本邏輯,不同類型的自然語言會演化出共有特征,這些特征導(dǎo)致了AI自然語言處理的難度。
1.如果一個概念沒有名稱,就需要用其他方式去指向;如果概念本身是一個結(jié)構(gòu)信息,我們就可以通過組成結(jié)構(gòu)信息的元素去指向這個概念,比如對事件概念的陳述;如果概念存在于一個結(jié)構(gòu)信息中,我們就能用結(jié)構(gòu)信息去指向這個概念,這就是從句的來源;如果用以指向一個概念的元素自己也沒有名稱,我們就需要先設(shè)法指向這個元素,于是就形成了多重嵌套的表達。
2.人類在聽一個人的講話、讀一本書,或是自己在講話,或是對話狀態(tài),都會在語言處理過程中保存特定的信息,最短期的記憶比如最近談及的對象、屬性、事件、事件規(guī)律等,這些信息讓我們創(chuàng)造表達的省略,讀懂對方表達中的省略。較為長期的記憶,比如一大段表達中每個信息被重復(fù)的次數(shù),這讓我們知曉邏輯不那么清晰的表達的重點;表達的信息之間的相互關(guān)系,能讓AI聽到的不再是局部的碎片化的信息,讓AI能夠帶有整體感地復(fù)述一大段表達。
3.表達省略分為兩種類型——語境省略和常識省略。語境省略也就是因為語境保持了信息,所以可以省略;常識省略也就是因為常識中包含了信息,所以可以省略。省略機制讓語言在不會導(dǎo)致誤解的前提下變得簡潔。
4.人類的表達很少是精確的,無論是語法上,還是邏輯上;人類也極少會通過精確的定義去掌握某一詞匯。事實上造物主給予人類的自然語言就是建立在不精確和模糊之上的藝術(shù)品。從詞匯的掌握到詞匯的使用,很多都是在意向?qū)用娴墓ぷ鳌?/p>