官术网_书友最值得收藏!

第1章 緒論

1.1 語言智能處理簡介

語言智能處理是人工智能領域的重要研究方向,涉及計算機科學、語言學、邏輯學、數理統計、認知科學等諸多學科,具有顯著的跨學科特色。目前在計算機科學與人工智能領域,語言智能處理主要體現為自然語言處理(Natural Language Processing,NLP),是指利用計算機等工具分析和生成自然語言(包括文本、語音等),從而讓計算機“理解”和“運用”自然語言。通過自然語言處理的一系列方法與技術,可以讓人類通過自然語言的形式與計算機系統進行智能交互。

自然語言處理一般可以分為兩個部分:自然語言理解(Natural Language Understanding,NLU)和自然語言生成(Natural Language Generation,NLG)。自然語言理解的目的是讓計算機通過各種分析與處理,理解人類的自然語言(包括其內在含義)。自然語言生成更關注如何讓計算機自動生成人類可以理解的自然語言形式或系統。自然語言處理的部分任務和應用場景如圖1-1所示。

圖1-1示意了自然語言處理過程所涵蓋的詞語、句子、篇章等多個語言層次。這些語言層次對應形態學、句法學、語義學和語用學等多個語言學分支,每個層次都具有很多典型的應用場景。事實上,自然語言處理早期也被稱為計算語言學(Computational Linguistics),其研究對象幾乎涉及語言學研究的所有對象:語音、形態、語法(句法)、語義、語用,研究內容包括針對這些對象的自動分析方法與技術,如詞法分析、句法分析、語義分析等。自然語言生成也是計算機與人類通過自然語言進行交互的一種方式。其研究內容包括對于一個既定的形式化(語句意義)表達計算機如何產生自然語言語句這樣的簡單問題,也包括如何從人類大腦的意義映像出自然語言表達的復雜處理過程。近年來,隨著深度學習技術的快速發展和海量數據的激增,語言智能處理又進一步細化為針對文本到文本、數據到文本、圖像到文本等多種模態形式的具體研究方向,其具體任務場景的實現往往是一個復雜的系統工程。

img

圖1-1 自然語言處理的部分任務和應用場景

主站蜘蛛池模板: 清原| 雅江县| 磐石市| 华阴市| 盐池县| 扎鲁特旗| 东乡县| 大兴区| 丰都县| 上蔡县| 遂川县| 温宿县| 峨边| 进贤县| 卢龙县| 临湘市| 大关县| 蓬溪县| 巨野县| 兴和县| 台中市| 财经| 松潘县| 厦门市| 香格里拉县| 温宿县| 西乌珠穆沁旗| 蛟河市| 大兴区| 涞水县| 宝兴县| 盐山县| 库车县| 广元市| 大邑县| 惠水县| 北流市| 兴山县| 漯河市| 重庆市| 吉隆县|