- 中國包裝大數據知識圖譜
- 王志兵等
- 1306字
- 2019-09-20 14:54:01
1.3 研究思路及結構安排
1.3.1 研究思路
本書的研究思路為從知識圖譜的構建技術出發,并結合中國包裝產業的特點開展研究。具體說明如下:針對目前中國包裝行業知識圖譜的市場空白和包裝領域知識不全面的問題,結合包裝學科、計算機學科、圖書情報學、統計學和現今發展迅速的數據科學,構建出包含包裝學科、包裝教育、包裝產業等信息的綜合性大數據知識圖譜,以填補目前包裝行業知識圖譜的空白。由于構建知識圖譜需要大量真實可靠、精確度極高的結構化數據,而針對行業的結構化數據又相對匱乏,本書在行業知識數據缺乏的情況下,綜合多種學科門類,實施多學科交叉融合研究,以中國包裝本體模型為核心元素,以知識抽取模型為實現手段,以知識庫為底層數據基礎構建了由知識抽取層、數據存儲層、數據控制層、查詢處理層、應用接口層和展示層組成的中國包裝知識圖譜集成平臺。通過命名實體識別、自動標注、語義分析、實體鏈接、機器學習等方法從行業統計數據庫、圖書情報庫、網絡信息等多源數據中抽取出實體、屬性、關系等參數,構建出準確的模式層,進而構建出準確、可信的包裝產業大數據知識圖譜。
1.3.2 結構安排
第1章 緒論。對知識圖譜的研究現狀及其面臨的研究問題進行論述,確定本書的研究目的及意義,并進一步闡述本書的基本思路和研究框架。
第2章 包裝大數據知識圖譜平臺架構。本章首先對知識圖譜技術的基本概念、發展現狀、體系結構、關鍵技術以及應用領域等進行闡述,并詳細介紹了其在包裝行業的應用和大數據知識圖譜的構建。
第3章 包裝大數據分類體系。本章主要對包裝大數據的概念及相關含義做了說明,并針對性地提出了中國包裝大數據分類體系。同時,結合分類體系的特點、包裝大數據知識圖譜平臺與實際企業信息的相關度,做了進一步的屬性(多重屬性)說明。
第4章 包裝大數據知識圖譜模式構建。本章介紹了知識圖譜的一般構建過程,包括知識圖譜數據模式層和實體層的學習。同時,對行業知識圖譜的構建進行了說明,主要針對行業知識圖譜的兩類特殊數據源的學習方法進行了詳述,并結合包裝大數據行業知識圖譜構建實例進行了舉例說明。
第5章 包裝大數據來源及獲取方法。本章首先對數據采集技術的基本概念、發展現狀、數據類型、關鍵技術以及應用領域等進行闡述,并詳細介紹了多源數據獲取和圖數據庫,并展示了包裝大數據數據采集技術。
第6章 結構化、半結構化和非結構化包裝大數據的抽取。本章首先對數據抽取的基本概念、類型、關鍵技術以及應用領域等進行闡述,并詳細介紹了ETL和包裝大數據的數據抽取實施過程。
第7章 包裝大數據的實體及其屬性抽取。本章首先對實體抽取技術的基本概念、發展現狀、關鍵算法以及應用領域等進行闡述,并詳細介紹了實體命名、關系抽取、事件抽取以及模板元素抽取,最后介紹了包裝大數據中實現的實體抽取相關功能。
第8章 包裝大數據知識庫實體對齊與沖突檢測。本章首先對實體對齊的基本概念、算法、關鍵技術以及學習沖突等進行闡述,并介紹了中國包裝大數據知識庫實體對齊的語義自動標注模型。
第9章 包裝大數據知識推理及規則定義。本章首先介紹了基于符號邏輯的推理、基于圖的推理和基于統計的推理三種常見的知識推理方法,并詳細介紹了包裝大數據知識圖譜中知識推理和智能查詢的實現機制。