舉報

會員
基于NLP的內容理解
最新章節:
文后
這是一本講述如何用NLP技術進行文本內容理解的著作,也是一本系統講解NLP算法的著作,是作者在NLP和內容理解領域多年經驗的總結。本書結合內容理解的實際業務場景,系統全面、循序漸進地講解了各種NLP算法以及如何用這些算法高效地解決內容理解方面的難題,主要包括如下幾個方面的內容:文本特征表示:文本特征表示是NLP的基石,也是內容理解的基礎環節,本書詳細講解了離散型表示方法和分布型表示方法等特征表示方法及其應用場景,還講解了詞向量的評判標準。內容重復理解:詳細講解了標題重復、段落重復、文章重復的識別方法和去重算法。內容通順度識別及糾正:詳細講解了內容通順度的識別方法以及糾正不通順內容的方法。內容質量:詳細講解了多種內容質量相關的算法,以及如何搭建高質量的知識問答體系的流程。標簽體系構建:詳細講解了針對內容理解的標簽體系的建設流程和方法,以及多種相關算法。文本摘要生成:詳細講解了抽取式文本摘要和生成式文本摘要兩種流行的文本摘要生成方法,以及文本摘要的常用數據集和文本摘要評價方法。文本糾錯:詳細講解了文本糾錯的傳統方法、深度學習方法、工業界解決方案,以及常用的文本糾錯工具的安裝和使用。
目錄(50章)
倒序
- 封面
- 版權信息
- 內容簡介
- 前言
- 第1章 文本特征表示
- 1.1 語料與語料預處理
- 1.2 文本特征表示方法
- 1.3 詞向量的評判標準
- 1.4 本章小結
- 第2章 內容重復理解
- 2.1 標題重復
- 2.2 段落重復識別實例
- 2.3 基于相似度計算的文章判重
- 2.4 本章小結
- 第3章 內容通順度識別及糾正
- 3.1 數據增強
- 3.2 基于FastText算法的句子通順度識別
- 3.3 基于TextCNN算法的分類任務實現
- 3.4 基于TextRNN算法的分類任務實現
- 3.5 基于Seq2Seq模型的糾正策略
- 3.6 本章小結
- 第4章 內容質量
- 4.1 GBDT算法
- 4.2 XGBoost算法
- 4.3 知識問答質量體系的搭建
- 4.4 本章小結
- 第5章 標簽體系構建
- 5.1 標簽體系
- 5.2 TF-IDF算法
- 5.3 PageRank算法
- 5.4 TextRank算法
- 5.5 本章小結
- 第6章 文本摘要生成
- 6.1 文本摘要相關介紹
- 6.2 基于無監督的抽取式文本摘要
- 6.3 基于有監督的抽取式文本摘要
- 6.4 基于深度神經網絡的生成式文本摘要
- 6.5 文本摘要常用數據集
- 6.6 文本摘要評價方法
- 6.7 本章小結
- 第7章 文本糾錯
- 7.1 錯誤來源及類型
- 7.2 文本糾錯的3種傳統方法
- 7.3 文本糾錯深度學習方法
- 7.4 工業界解決方法
- 7.5 文本糾錯工具
- 7.6 本章小結
- 推薦閱讀
- 作者簡介
- 文后 更新時間:2024-05-14 11:05:49
推薦閱讀
- GitLab CI/CD 從入門到實戰
- CAE分析大系:ANSYS?Workbench結構分析與實例詳解
- PhoneGap開發指南
- SQL Server應用與開發范例寶典
- 大模型入門:技術原理與實戰應用
- 邊緣云部署與運營:系統性實現方法
- 實時分析實戰:構建實時流處理應用和分析系統
- 軟件自動化測試成功之道:典型工具、腳本開發、測試框架和項目實戰
- 領域驅動設計工作坊
- 軟件平臺架構設計與技術管理之道
- 獵豹行動:硝煙中的敏捷轉型之旅
- 微信小程序實戰入門(內含完整實例解析)
- 微信小程序開發詳解
- 騰訊Android自動化測試實戰
- OpenGL ES 2.0游戲開發(下卷)
- Windows API開發詳解:函數、接口、編程實例
- 云原生應用構建:基于OpenShift
- Java從入門到精通(第2版)
- 軟件性能測試、分析與調優實踐之路
- JSP應用開發與實踐
- ANSYS有限元分析與工程應用
- 面向對象開發參考手冊
- 站點可靠性工程(SRE)實戰
- 面向用戶的設計:移動應用產品設計之道
- MATLAB權威指南
- MySQL DBA 精英實戰課
- Visual Basic從入門到精通(第2版)
- .NET Core 2.0 By Example
- 跨平臺移動APP設計及應用
- 軟計算原理與實現