官术网_书友最值得收藏!

1.3 本書(shū)內(nèi)容安排

本書(shū)共分為14章,主要包含三個(gè)部分:第1部分主要介紹自然語(yǔ)言處理的基礎(chǔ)技術(shù),包括緒論、詞匯分析、句法分析、語(yǔ)義分析、篇章分析和語(yǔ)言模型;第2部分主要介紹自然語(yǔ)言處理的一系列核心技術(shù),包括信息抽取、機(jī)器翻譯、情感分析、智能問(wèn)答、文本摘要、知識(shí)圖譜;第3部分主要介紹基于機(jī)器學(xué)習(xí)的自然語(yǔ)言處理模型的穩(wěn)健性和可解釋性問(wèn)題。本書(shū)章節(jié)安排如圖1.7所示。

圖1.7 本書(shū)章節(jié)安排

第2~6章從詞匯、句法、篇章三個(gè)不同粒度的語(yǔ)言單位,從形態(tài)、結(jié)構(gòu)、語(yǔ)義三個(gè)不同的語(yǔ)言層面,對(duì)自然語(yǔ)言處理的基礎(chǔ)技術(shù)進(jìn)行介紹。第2章主要介紹語(yǔ)言學(xué)中與詞匯相關(guān)的基本概念,以及詞語(yǔ)規(guī)范化、中文分詞、詞性標(biāo)注等詞匯分析的主要任務(wù)和相關(guān)算法。第3章主要介紹語(yǔ)言學(xué)中句法的基本概念,以及成分句法分析算法、依存句法分析算法。第4章主要介紹語(yǔ)義學(xué)和語(yǔ)義表示的基本概念、語(yǔ)義知識(shí)的表示方法,以及詞義消歧、語(yǔ)義角色標(biāo)注等語(yǔ)義分析的主要任務(wù)和相關(guān)算法。第5章主要介紹篇章結(jié)構(gòu)的基礎(chǔ)理論和基本概念,以及話語(yǔ)分割、篇章結(jié)構(gòu)分析、指代消解等篇章分析的主要任務(wù)和相關(guān)算法。第6章主要介紹語(yǔ)言模型的基本概念,以及n元語(yǔ)言模型、神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型、預(yù)訓(xùn)練語(yǔ)言模型和大規(guī)模語(yǔ)言模型的常見(jiàn)算法。

第7~12章主要介紹自然語(yǔ)言處理支撐各種應(yīng)用的核心技術(shù)。第7章主要介紹信息抽取的基本任務(wù)和相關(guān)算法,包括命名實(shí)體識(shí)別、關(guān)系抽取和事件抽取。第8章主要介紹機(jī)器翻譯的基本概念和常見(jiàn)方法,包括基于統(tǒng)計(jì)和基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯方法。第9章主要介紹情感傾向分析的基本概念和主要任務(wù),包括篇章、句子、屬性三個(gè)不同粒度的分析算法。第10章主要介紹智能問(wèn)答的基本任務(wù)和分析算法,包括閱讀理解、表格問(wèn)答、社區(qū)問(wèn)答、開(kāi)放領(lǐng)域問(wèn)答等。第11章主要介紹文本摘要的相關(guān)任務(wù)和基本算法,包括抽取式文本摘要、生成式文本摘要等。第12章主要介紹知識(shí)圖譜的相關(guān)概念和基本任務(wù),包括知識(shí)圖譜表示、知識(shí)圖譜構(gòu)建、知識(shí)圖譜應(yīng)用等。

第13章和第14章針對(duì)基于機(jī)器學(xué)習(xí)模型的自然語(yǔ)言處理算法所面臨的模型穩(wěn)健性和模型可解釋性問(wèn)題進(jìn)行討論。第13章主要介紹自然語(yǔ)言處理模型穩(wěn)健性的基本概念,以及數(shù)據(jù)偏差消除、文本對(duì)抗攻擊方法、文本對(duì)抗防御方法和模型穩(wěn)健性評(píng)測(cè)基準(zhǔn)。第14章主要介紹自然語(yǔ)言處理模型的可解釋性問(wèn)題,主要包括解釋性分析工具和自然語(yǔ)言處理算法的解釋性分析方法。

此外,還需要特別強(qiáng)調(diào)的是,自然語(yǔ)言處理中的很多任務(wù)都被轉(zhuǎn)換為機(jī)器學(xué)習(xí)問(wèn)題,因此很多機(jī)器學(xué)習(xí)算法都可以被應(yīng)用于多個(gè)自然語(yǔ)言處理任務(wù)中。例如,條件隨機(jī)場(chǎng)(Conditional Random Field,CRF)模型可以用于中文分詞,也可以用于詞性標(biāo)注,還可以用于命名實(shí)體識(shí)別。為了避免重復(fù),我們僅在2.3.3節(jié)中詳細(xì)介紹了如何使用線性鏈條件隨機(jī)場(chǎng)模型進(jìn)行中文分詞,而在詞性標(biāo)注、命名實(shí)體識(shí)別等章節(jié)中選擇了不同的算法進(jìn)行介紹。這需要讀者朋友能夠融會(huì)貫通,在本書(shū)學(xué)習(xí)結(jié)束時(shí),對(duì)特定機(jī)器學(xué)習(xí)模型可以適用于哪些自然語(yǔ)言處理任務(wù)有清晰的了解。

主站蜘蛛池模板: 双城市| 红安县| 融水| 右玉县| 辽阳市| 长海县| 读书| 珠海市| 玉环县| 葫芦岛市| 左权县| 琼结县| 威海市| 宽城| 达州市| 永新县| 朝阳市| 宜阳县| 策勒县| 来凤县| 子长县| 内乡县| 同德县| 上杭县| 桃江县| 桑日县| 张家川| 大安市| 沅江市| 滨州市| 平顶山市| 清河县| 岱山县| 巩义市| 调兵山市| 南汇区| 通化县| 昆山市| 深州市| 梨树县| 南投市|