- 自然語(yǔ)言處理導(dǎo)論
- 張奇等
- 1203字
- 2023-11-17 16:47:06
1.3 本書(shū)內(nèi)容安排
本書(shū)共分為14章,主要包含三個(gè)部分:第1部分主要介紹自然語(yǔ)言處理的基礎(chǔ)技術(shù),包括緒論、詞匯分析、句法分析、語(yǔ)義分析、篇章分析和語(yǔ)言模型;第2部分主要介紹自然語(yǔ)言處理的一系列核心技術(shù),包括信息抽取、機(jī)器翻譯、情感分析、智能問(wèn)答、文本摘要、知識(shí)圖譜;第3部分主要介紹基于機(jī)器學(xué)習(xí)的自然語(yǔ)言處理模型的穩(wěn)健性和可解釋性問(wèn)題。本書(shū)章節(jié)安排如圖1.7所示。

圖1.7 本書(shū)章節(jié)安排
第2~6章從詞匯、句法、篇章三個(gè)不同粒度的語(yǔ)言單位,從形態(tài)、結(jié)構(gòu)、語(yǔ)義三個(gè)不同的語(yǔ)言層面,對(duì)自然語(yǔ)言處理的基礎(chǔ)技術(shù)進(jìn)行介紹。第2章主要介紹語(yǔ)言學(xué)中與詞匯相關(guān)的基本概念,以及詞語(yǔ)規(guī)范化、中文分詞、詞性標(biāo)注等詞匯分析的主要任務(wù)和相關(guān)算法。第3章主要介紹語(yǔ)言學(xué)中句法的基本概念,以及成分句法分析算法、依存句法分析算法。第4章主要介紹語(yǔ)義學(xué)和語(yǔ)義表示的基本概念、語(yǔ)義知識(shí)的表示方法,以及詞義消歧、語(yǔ)義角色標(biāo)注等語(yǔ)義分析的主要任務(wù)和相關(guān)算法。第5章主要介紹篇章結(jié)構(gòu)的基礎(chǔ)理論和基本概念,以及話語(yǔ)分割、篇章結(jié)構(gòu)分析、指代消解等篇章分析的主要任務(wù)和相關(guān)算法。第6章主要介紹語(yǔ)言模型的基本概念,以及n元語(yǔ)言模型、神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型、預(yù)訓(xùn)練語(yǔ)言模型和大規(guī)模語(yǔ)言模型的常見(jiàn)算法。
第7~12章主要介紹自然語(yǔ)言處理支撐各種應(yīng)用的核心技術(shù)。第7章主要介紹信息抽取的基本任務(wù)和相關(guān)算法,包括命名實(shí)體識(shí)別、關(guān)系抽取和事件抽取。第8章主要介紹機(jī)器翻譯的基本概念和常見(jiàn)方法,包括基于統(tǒng)計(jì)和基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯方法。第9章主要介紹情感傾向分析的基本概念和主要任務(wù),包括篇章、句子、屬性三個(gè)不同粒度的分析算法。第10章主要介紹智能問(wèn)答的基本任務(wù)和分析算法,包括閱讀理解、表格問(wèn)答、社區(qū)問(wèn)答、開(kāi)放領(lǐng)域問(wèn)答等。第11章主要介紹文本摘要的相關(guān)任務(wù)和基本算法,包括抽取式文本摘要、生成式文本摘要等。第12章主要介紹知識(shí)圖譜的相關(guān)概念和基本任務(wù),包括知識(shí)圖譜表示、知識(shí)圖譜構(gòu)建、知識(shí)圖譜應(yīng)用等。
第13章和第14章針對(duì)基于機(jī)器學(xué)習(xí)模型的自然語(yǔ)言處理算法所面臨的模型穩(wěn)健性和模型可解釋性問(wèn)題進(jìn)行討論。第13章主要介紹自然語(yǔ)言處理模型穩(wěn)健性的基本概念,以及數(shù)據(jù)偏差消除、文本對(duì)抗攻擊方法、文本對(duì)抗防御方法和模型穩(wěn)健性評(píng)測(cè)基準(zhǔn)。第14章主要介紹自然語(yǔ)言處理模型的可解釋性問(wèn)題,主要包括解釋性分析工具和自然語(yǔ)言處理算法的解釋性分析方法。
此外,還需要特別強(qiáng)調(diào)的是,自然語(yǔ)言處理中的很多任務(wù)都被轉(zhuǎn)換為機(jī)器學(xué)習(xí)問(wèn)題,因此很多機(jī)器學(xué)習(xí)算法都可以被應(yīng)用于多個(gè)自然語(yǔ)言處理任務(wù)中。例如,條件隨機(jī)場(chǎng)(Conditional Random Field,CRF)模型可以用于中文分詞,也可以用于詞性標(biāo)注,還可以用于命名實(shí)體識(shí)別。為了避免重復(fù),我們僅在2.3.3節(jié)中詳細(xì)介紹了如何使用線性鏈條件隨機(jī)場(chǎng)模型進(jìn)行中文分詞,而在詞性標(biāo)注、命名實(shí)體識(shí)別等章節(jié)中選擇了不同的算法進(jìn)行介紹。這需要讀者朋友能夠融會(huì)貫通,在本書(shū)學(xué)習(xí)結(jié)束時(shí),對(duì)特定機(jī)器學(xué)習(xí)模型可以適用于哪些自然語(yǔ)言處理任務(wù)有清晰的了解。
- 巧用ChatGPT進(jìn)行數(shù)據(jù)分析與挖掘
- 智能控制與強(qiáng)化學(xué)習(xí):先進(jìn)值迭代評(píng)判設(shè)計(jì)
- 人工智能算法基礎(chǔ)
- 移動(dòng)機(jī)器人技術(shù)及其應(yīng)用
- 大模型工程化:AI驅(qū)動(dòng)下的數(shù)據(jù)體系
- 智能控制:理論基礎(chǔ)、算法設(shè)計(jì)與應(yīng)用
- 人工智能原理與應(yīng)用教程
- 深入淺出圖神經(jīng)網(wǎng)絡(luò):GNN原理解析
- 深度學(xué)習(xí)高手筆記(卷2):經(jīng)典應(yīng)用
- 自動(dòng)調(diào)節(jié)系統(tǒng)解析與PID整定
- 可穿戴電子產(chǎn)品設(shè)計(jì)與開(kāi)發(fā)
- 未來(lái)之地
- 工業(yè)控制計(jì)算機(jī)典型應(yīng)用系統(tǒng)編程實(shí)踐
- 人,倫理,機(jī)器人:一本孩子寫(xiě)給孩子的書(shū)
- 華為MindSpore深度學(xué)習(xí)框架應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn)