- 從零構(gòu)建知識圖譜:技術(shù)、方法與案例
- 邵浩 張凱 李方圓 張云柯 戴錫強(qiáng)
- 724字
- 2021-08-06 17:17:17
1.6 知識圖譜的技術(shù)架構(gòu)
本節(jié)將簡要介紹知識圖譜的技術(shù)架構(gòu),更多知識圖譜的技術(shù)和工程實踐細(xì)節(jié)將在后文詳細(xì)闡述。構(gòu)建知識圖譜是一個系統(tǒng)性工程。圖1-14給出了一個典型的知識圖譜構(gòu)建與計算的架構(gòu)。

圖1-14 知識圖譜的構(gòu)建與計算
知識圖譜的構(gòu)建與計算,不僅需要考慮如何結(jié)合文本、多媒體、半結(jié)構(gòu)化、結(jié)構(gòu)化知識、服務(wù)或API,以及時態(tài)知識等的統(tǒng)一知識表示,還需要進(jìn)一步考慮如何結(jié)合結(jié)構(gòu)化(如關(guān)系型數(shù)據(jù)庫)、半結(jié)構(gòu)化(HTML或XML)和非結(jié)構(gòu)化(文本、圖像等)多源異質(zhì)數(shù)據(jù)源來分別構(gòu)建通用事實類(各種領(lǐng)域相關(guān)實體知識)、常識類、用戶個人記憶類和服務(wù)任務(wù)類知識庫等。針對不同類型的數(shù)據(jù)和知識,有不同的構(gòu)建技術(shù),如針對結(jié)構(gòu)化數(shù)據(jù)的知識映射、針對半結(jié)構(gòu)化知識的包裝器(Wrapper),以及針對非結(jié)構(gòu)化知識的文本挖掘和自然語言處理。文本挖掘充分利用Web和大規(guī)模語料庫的冗余信息來發(fā)現(xiàn)隱含的模式;而自然語言處理更多是在開放或者確定的Schema下做各種知識抽取。為了得到融合的圖譜,我們除了需要考慮離線的多源異構(gòu)的知識融合,還需要額外考慮服務(wù)任務(wù)類動態(tài)知識的對象綁定。這項工作往往是在線完成的,相當(dāng)于根據(jù)不同的交互,在線動態(tài)擴(kuò)充知識圖譜并實例化的過程。
最后還需要考慮知識圖譜的存儲。既然有了知識,就必須用一定的手段去存儲。但這里談到的存儲,不僅僅是建立一個知識庫,還包括存儲之后的應(yīng)用效率等。傳統(tǒng)型關(guān)系數(shù)據(jù)庫,例如MySQL,以及一些NoSQL數(shù)據(jù)庫,例如MongoDB,能不能存儲KG呢?答案是肯定的,但從直觀上說,考慮到知識是互聯(lián)、龐大的,且聯(lián)系是數(shù)據(jù)的本質(zhì)所在,而傳統(tǒng)型數(shù)據(jù)庫對于數(shù)據(jù)聯(lián)系的表現(xiàn)比較差,所以在知識圖譜的存儲上,關(guān)系型數(shù)據(jù)庫沒有圖數(shù)據(jù)庫靈活。尤其是涉及多跳關(guān)聯(lián)查詢時(例如姚明的妻子的國籍是什么),圖數(shù)據(jù)庫的效率會遠(yuǎn)比關(guān)系型數(shù)據(jù)庫高。
- Vue 3移動Web開發(fā)與性能調(diào)優(yōu)實戰(zhàn)
- 劍指JVM:虛擬機(jī)實踐與性能調(diào)優(yōu)
- 樂高機(jī)器人設(shè)計技巧:EV3結(jié)構(gòu)設(shè)計與編程指導(dǎo)
- Mastering Predictive Analytics with Python
- Big Data Analytics
- Python時間序列預(yù)測
- Linux:Embedded Development
- 零基礎(chǔ)學(xué)Python網(wǎng)絡(luò)爬蟲案例實戰(zhàn)全流程詳解(入門與提高篇)
- Go語言精進(jìn)之路:從新手到高手的編程思想、方法和技巧(1)
- Learning Apache Karaf
- Natural Language Processing with Java and LingPipe Cookbook
- JavaScript動態(tài)網(wǎng)頁編程
- OpenCV 3 Blueprints
- IDA Pro權(quán)威指南(第2版)
- C++從入門到精通(第6版)