- 人工智能:語言智能處理
- 黃河燕 史樹敏等編著
- 5字
- 2021-02-22 11:12:58
第1章 緒論
1.1 語言智能處理簡介
語言智能處理是人工智能領域的重要研究方向,涉及計算機科學、語言學、邏輯學、數理統計、認知科學等諸多學科,具有顯著的跨學科特色。目前在計算機科學與人工智能領域,語言智能處理主要體現為自然語言處理(Natural Language Processing,NLP),是指利用計算機等工具分析和生成自然語言(包括文本、語音等),從而讓計算機“理解”和“運用”自然語言。通過自然語言處理的一系列方法與技術,可以讓人類通過自然語言的形式與計算機系統進行智能交互。
自然語言處理一般可以分為兩個部分:自然語言理解(Natural Language Understanding,NLU)和自然語言生成(Natural Language Generation,NLG)。自然語言理解的目的是讓計算機通過各種分析與處理,理解人類的自然語言(包括其內在含義)。自然語言生成更關注如何讓計算機自動生成人類可以理解的自然語言形式或系統。自然語言處理的部分任務和應用場景如圖1-1所示。
圖1-1示意了自然語言處理過程所涵蓋的詞語、句子、篇章等多個語言層次。這些語言層次對應形態學、句法學、語義學和語用學等多個語言學分支,每個層次都具有很多典型的應用場景。事實上,自然語言處理早期也被稱為計算語言學(Computational Linguistics),其研究對象幾乎涉及語言學研究的所有對象:語音、形態、語法(句法)、語義、語用,研究內容包括針對這些對象的自動分析方法與技術,如詞法分析、句法分析、語義分析等。自然語言生成也是計算機與人類通過自然語言進行交互的一種方式。其研究內容包括對于一個既定的形式化(語句意義)表達計算機如何產生自然語言語句這樣的簡單問題,也包括如何從人類大腦的意義映像出自然語言表達的復雜處理過程。近年來,隨著深度學習技術的快速發展和海量數據的激增,語言智能處理又進一步細化為針對文本到文本、數據到文本、圖像到文本等多種模態形式的具體研究方向,其具體任務場景的實現往往是一個復雜的系統工程。

圖1-1 自然語言處理的部分任務和應用場景
- Hands-On Data Science with SQL Server 2017
- MCSA Windows Server 2016 Certification Guide:Exam 70-741
- 流處理器研究與設計
- 工業機器人現場編程(FANUC)
- 工業機器人維護與保養
- 多媒體制作與應用
- Applied Data Visualization with R and ggplot2
- R Machine Learning Projects
- 統計挖掘與機器學習:大數據預測建模和分析技術(原書第3版)
- 寒江獨釣:Windows內核安全編程
- Hands-On Microservices with C#
- 從祖先到算法:加速進化的人類文化
- 大數據:從基礎理論到最佳實踐
- 中小型網站建設與管理
- 深度剖析:硬盤固件級數據恢復