官术网_书友最值得收藏!

前言

臨淵羨魚,不如退而結網。

知識圖譜就是一張網,一張基于現實世界的概念、實體、關系、屬性構建起來的結構化知識網絡。知識圖譜作為人工智能的底層支撐和核心技術,能夠“幫助”人工智能對現實世界中復雜、相互聯結的數據進行理解與處理,使機器具備理解、分析和決策的能力,并且更加接近人類認知世界的水平,從而成功應用于智能搜索、推薦系統、知識問答、推理決策等領域。

本書從諸多中國古典著作中精選名句,并結合知識圖譜技術精髓進行關聯講解,引導讀者以哲學的思考方式來理解知識圖譜的內涵,并使用知識圖譜解決應用過程中出現的各種問題。

為什么要寫這本書

2019年春天,隨著大數據賦能業務逐漸興起,科大訊飛大數據研究院大數據分析與算法團隊開始響應公司號召,扎根于此業務,希望能夠基于大數據分析與算法從海量數據中學習并自動決策,有效解決數據分析和挖掘瓶頸。而扎根業務以后,我們發現業務需求更多的是數據治理以及知識圖譜等,需要通過構建行業知識圖譜來支撐業務發展,以解決實際業務場景的問題。

2019年秋天,在機械工業出版社策劃編輯的建議下,筆者決定和小伙伴們一起朝著新的目標努力——編寫一本知識圖譜構建與應用的書籍。

在本書的寫作過程中,知識圖譜技術也在不斷變化。秉承大道至簡的原則,我們一方面盡可能在知識圖譜構建章節統籌各種概念,另一方面盡可能在實踐章節跳出概念給出應用案例。筆者希望能拋磚引玉,以個人的一些想法和見解,為讀者拓展出更深入、更全面的思路。

本書只是一個開始,如何基于海量數據使用知識圖譜技術解決更多業務問題,還需要無數的知識圖譜從業人員前赴后繼,越過漫漫雄關,共同創造美好的知識圖譜新時代。

本書特色

本書結合知識圖譜的抽取、表示、融合、存儲、建模、推理、評估等構建技術進行講解,并在構建基礎上基于實際業務進行抽象,最后給出知識圖譜技術的應用案例。本書希望幫助讀者完成知識圖譜技術棧的學習和實踐,以便讀者厘清知識圖譜相關內容,降低學習成本。

本書以通俗易懂的方式講解知識圖譜相關的知識,尤其對從零開始構建知識圖譜過程中需要經歷的步驟以及每個步驟需要考慮的問題,給出了比較詳細的解釋。

讀者對象

(1)對知識圖譜感興趣的讀者

伴隨著人工智能時代的到來,很多工作都需要使用知識圖譜分析與挖掘數據深層關系并有效推理知識。對這部分讀者來說,本書的內容能夠幫助他們加深對知識圖譜的構建、應用場景和存在價值的理解。

(2)從事知識圖譜構建、開發的人員

通過學習知識圖譜實踐案例,這部分讀者可以掌握知識圖譜構建、開發的方法,快速地構建知識圖譜。可以說,本書提供了一條捷徑,同時能夠縮小知識圖譜構建開發人員與算法研究人員之間的鴻溝,幫助他們掌握知識圖譜相關知識。

(3)從事知識圖譜算法、研究的人員

對從事知識圖譜算法、研究的人員來說,通過本書他們能夠身臨其境地“體驗”各種場景,了解各種知識圖譜在不同場景下的優缺點,本書對他們解決生產環境中遇到的知識圖譜、數據挖掘等問題有很好的借鑒作用。

(4)設計知識圖譜架構及技術方案的人員

對設計知識圖譜架構及技術方案的人員來說,本書能夠幫助他們構建知識圖譜的應用并進行效果閉環驗證。讀者只有對知識圖譜的功能、效率、優缺點等有了全面的了解,才能在架構設計中綜合考慮各種因素,設計出高效、穩定的知識圖譜架構。

如何閱讀本書

在結構安排上,本書分為“基礎篇”“構建篇”“實踐篇”,共16章內容,從知識圖譜概念引出知識圖譜構建技術,再到多個行業實踐方案的設計思路與代碼實現,層層推進,便于讀者系統學習與落地應用。

基礎篇(第1章),介紹知識圖譜的定義、分類、發展階段,以及構建方式、邏輯/技術架構、現狀與應用場景等。

構建篇(第2~8章),詳細介紹知識抽取、知識表示、知識融合、知識存儲、知識建模、知識推理、知識評估與運維等,并結合實例講解應用方法。

實踐篇(第9~16章),詳細講解知識圖譜的綜合應用,涵蓋知識問答評測、知識圖譜平臺,以及智能搜索、圖書推薦系統、開放領域知識問答、交通領域知識問答、汽車領域知識問答、金融領域推理決策實踐。

勘誤和支持

由于筆者水平有限,撰寫時間倉促,書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正。本書代碼和數據目錄:https://github.com/datadance/book3-kg.git。如果你有更多的寶貴意見,可以通過知識圖譜技術交流QQ群435263033或者郵箱datadance@163.com聯系我們,期待得到大家的反饋,讓我們在知識圖譜與人工智能征程中互勉共進。

致謝

感謝合作者李雅潔、彭加琪、程知遠;感謝程禮磊、丁輝、丁可、鄭英帥、李衛東、林發可、曹偉燦等技術專家,在本書寫作遇到困難的時候,他們一直鼓勵、支持我,并提供了寶貴的建議,使本書的質量更上一層樓。

感謝機械工業出版社的編輯,在我面臨讀博壓力、二寶出生、團隊解散的情況下,在我多少次徘徊在放棄邊緣的時刻,他們始終鼓勵與引導我,使得我最終完成全部書稿。

本書使用了部分互聯網公開數據,包括IBDM電影數據、NLPCC開放數據、圖書模擬數據、國泰安數據庫上市公司數據等,在這里致以特別感謝。

最后,感謝我的愛人,她的激勵給了我奮斗的信心和力量;祝愿我的大寶能夠戰勝自己,克服注意力缺陷;祝福本書寫作期間出生的二寶于宜楊,她的微笑融化了我所有的辛苦,也讓我的努力變得更有意義。

謹以此書獻給努力奮斗的小伙伴,以及眾多熱愛知識圖譜技術的朋友!

于俊

主站蜘蛛池模板: 松潘县| 土默特左旗| 慈溪市| 时尚| 苏尼特左旗| 湖南省| 淮阳县| 黄浦区| 富宁县| 宽甸| 马关县| 民权县| 洪湖市| 遂川县| 长岭县| 北宁市| 天津市| 黄龙县| 天台县| 伊通| 会昌县| 台中县| 贵州省| 繁昌县| 墨玉县| 胶南市| 合阳县| 察隅县| 建水县| 临泽县| 东山县| 兰州市| 盖州市| 封丘县| 甘洛县| 乌拉特前旗| 北安市| 丰县| 甘孜县| 沂水县| 康马县|