推薦序二 具身模擬,自然語言實現(xiàn)飛躍的關鍵
李航
字節(jié)跳動人工智能實驗室負責人
認知科學家本杰明·伯根所著的Louder than Words,由人工智能專家宋睿華和作家兼記者王爾山翻譯成中文,譯名為《我們賴以生存的意義》,并由湛廬隆重出版。在此,謹向兩位老師表示祝賀!
具身認知是近20年來興起的認知科學學說,它認為人的身體是感知和認知的基礎,身體的體驗對感知和認知起著決定性作用。具身模擬假說(embodied simulation hypothesis)是其中關于語言學的部分,認為語言理解是人在心智中基于自己過去的視覺、聽覺、運動等體驗進行的模擬。具身模擬假說擁有大量認知科學、腦科學、語言學等學科的實驗結(jié)果作為支持,已經(jīng)成為解釋人類語言理解機制最具說服力的科學理論,并逐漸對人工智能、語言學、腦科學、心理學、社會學等領域產(chǎn)生了巨大的影響。
伯根教授是具身模擬理論研究的領軍人物之一。他面向一般讀者總結(jié)了具身模擬理論的研究成果,讓讀者能對整個領域有一個全面深入的了解。本書通過大量的心理學、腦科學、語言學實驗結(jié)果,論證了人是如何使用視覺、聽覺、運動等方面的心智功能進行想象和模擬來理解語言的,并分析了個人體驗、文化背景對語言理解的影響,人類理解語言的過程,語法在語言理解過程中的作用,抽象概念理解的特點等重要問題。行文立論嚴謹,講解清晰,描述生動。書中講述的北極熊、會飛的豬、黃色的卡車司機帽等例子都會給讀者留下深刻印象。
宋睿華老師在機器人對話和寫作方面做出了業(yè)界領先的研究成果,王爾山老師是有廣泛影響的資深記者,也是多部暢銷著作的譯者,兩位老師可以說是珠聯(lián)璧合,是本書翻譯工作的絕佳人選。本書譯文通順流暢,準確貼切,是一部難得的上乘佳作。
我從事自然語言處理等領域的研究多年,一直關注以喬治·萊考夫為代表的具身認知學派的發(fā)展,受其影響頗深。約翰·泰勒(John Taylor)的《語言的范疇化》(Linguistic Categorization)、萊考夫的《女人、火與危險事物》(Women,F(xiàn)ire,and Dangerous Things)、萊考夫與馬克·約翰遜(Mark Johnson)合著的《我們賴以生存的隱喻》(Metaphors We Live by)等書都曾使我產(chǎn)生頓開茅塞之感,對我都產(chǎn)生了重大影響。閱讀本書,又讓我對人的語言和認知的本質(zhì)產(chǎn)生了更為深刻的認識。書中介紹的很多理論及其解釋都耐人尋味,發(fā)人深思。相信也會為我今后的工作提供參考依據(jù),加深知識,增強見解,帶來靈感。
自然語言處理是研究和開發(fā)在計算機上實現(xiàn)人的語言理解能力和生成能力的人工智能領域。具身模擬理論給我們的最大啟示是:自然語言處理需要結(jié)合視覺、聽覺、運動處理機制才能實現(xiàn)更好的機器翻譯、知識問答、語言對話、寫作支持等應用。目前為止,人工智能的研究都是在視覺、聽覺、運動、語言等不同的子領域中相對獨立地進行的。現(xiàn)在人工智能的各個領域都在使用深度學習技術,方法都是相通的,這同人的認知處理機制的基本原理相似而處理信息不同有異曲同工之處。可以預見,基于視覺、聽覺、運動、語言等多模態(tài)的深度學習將是未來自然語言處理的核心技術。
具身模擬理論的一個假設是:人對語言的理解離不開身體與外界環(huán)境的互動,只有通過身體的視覺、聽覺、運動等方面的經(jīng)驗積累才能實現(xiàn)對語言的理解,因此,有人認為脫離身體的語言理解是不可能實現(xiàn)的。在我看來:人工智能或自然語言處理的終極目標不應該是模仿人類,而應該是為人類提供有用的工具。從這個意義上來說,我們沒有必要完全復制人類的語言理解過程,實際上,參考人類的處理機制,實現(xiàn)接近人類的語言處理能力應該就已足矣。
總之,這是一本值得閱讀的好書。我特別向在人工智能、語言學、腦科學、心理學、社會學等領域工作的人們強烈推薦,相信這本書會給大家?guī)砗芏鄦l(fā)和幫助。