- 現代人工智能技術
- 李遠征 曾志剛等編著
- 1161字
- 2024-06-26 16:50:31
1.4.5 自然語言理解
計算機是人類偉大的發明之一,但是人們使用計算機時,往往需要通過高級語言(如C、C++、Java等)編寫程序來告訴計算機“做什么”和“怎么做”。這種方式不僅不便捷,而且限制了計算機應用的廣泛性和普及性。如果計算機能夠“聽懂”和“看懂”人類語言(如漢語、英語等),那么計算機就能擁有更多的用途,尤其是在機器人技術方面取得更大的進步。自然語言理解(Natural Language Understanding)就是研究如何讓計算機理解人類自然語言的一個重要領域,它屬于人工智能的范疇。它旨在實現人與計算機之間用自然語言進行通信的理論與方法。具體地說,它要達到以下三個目標:
1)計算機能正確理解人們用自然語言輸入的信息,并能正確回答輸入信息中的有關問題。
2)計算機能根據輸入的自然語言信息生成相應的摘要,并能用不同詞語復述輸入信息的內容。
3)計算機能將用某一種自然語言表示的信息自動翻譯為用另一種自然語言表示的相同信息。
自然語言理解的研究起源于20世紀50年代初期。那時,隨著通用計算機的誕生,人們開始探索用計算機實現一種語言到另一種語言的翻譯的可能性。在接下來的十多年里,機器翻譯成為自然語言理解中最主要的研究課題。最初,人們主要采用“詞對詞”的翻譯方法,認為只要通過“查詞典”和簡單的“語法分析”,就能完成翻譯任務。也就是說,對于一篇需要翻譯的文章,先通過查詞典找出兩種語言之間的對應詞,然后經過簡單的語法分析調整詞序,就能得到翻譯結果。基于這種認識,人們把主要精力投入在計算機內建立不同語言對應關系的詞典上。但是這種方法并沒有達到預期的效果,反而造成了一些令人啼笑皆非、顛倒黑白的笑話。
從20世紀70年代開始,自然語言理解領域出現了一些新的突破。這些系統采用了語法-語義分析技術,能夠對語言進行更深入和更難度的分析。其中比較有名的系統有三個:SHRDLU、LUNAR和MARGIE。SHRDLU是一個模擬機器人手臂在“積木世界”中操作玩具積木的系統。用戶可以用英語和它對話,讓它做一些簡單的動作,比如拿起或放下某個積木。LUNAR是一個幫助地質學家查詢月球巖石和土壤樣本數據的系統。它是第一個能夠用普通英語和計算機交流的人機接口系統。MARGIE是一個基于概念依賴理論的心理學模型,旨在研究自然語言理解的過程。
20世紀80年代以后,人們開始更加重視知識在自然語言理解中的作用。1990年8月,在赫爾辛基舉行的第13屆國際計算機語言學大會上,首次提出了處理大規模真實文本的戰略目標,并舉辦了一系列專題講座。這些講座涉及“大型語料庫在建造自然語言系統中的作用”“詞典知識的獲取與表示”等方面,標志著語言信息處理進入了一個新時期。
語料庫語言學是近10年來自然語言理解研究中的一個顯著現象。它主張從大規模語料庫中獲取語言學知識,認為這是實現對語言真正理解的必要條件。目前,基于語料庫的自然語言理解方法還在探索階段,尚不成熟,但無疑它是一個目前值得關注的研究方向。