官术网_书友最值得收藏!

1.6 知識圖譜的技術(shù)架構(gòu)

本節(jié)將簡要介紹知識圖譜的技術(shù)架構(gòu),更多知識圖譜的技術(shù)和工程實踐細(xì)節(jié)將在后文詳細(xì)闡述。構(gòu)建知識圖譜是一個系統(tǒng)性工程。圖1-14給出了一個典型的知識圖譜構(gòu)建與計算的架構(gòu)。

000

圖1-14 知識圖譜的構(gòu)建與計算

知識圖譜的構(gòu)建與計算,不僅需要考慮如何結(jié)合文本、多媒體、半結(jié)構(gòu)化、結(jié)構(gòu)化知識、服務(wù)或API,以及時態(tài)知識等的統(tǒng)一知識表示,還需要進(jìn)一步考慮如何結(jié)合結(jié)構(gòu)化(如關(guān)系型數(shù)據(jù)庫)、半結(jié)構(gòu)化(HTML或XML)和非結(jié)構(gòu)化(文本、圖像等)多源異質(zhì)數(shù)據(jù)源來分別構(gòu)建通用事實類(各種領(lǐng)域相關(guān)實體知識)、常識類、用戶個人記憶類和服務(wù)任務(wù)類知識庫等。針對不同類型的數(shù)據(jù)和知識,有不同的構(gòu)建技術(shù),如針對結(jié)構(gòu)化數(shù)據(jù)的知識映射、針對半結(jié)構(gòu)化知識的包裝器(Wrapper),以及針對非結(jié)構(gòu)化知識的文本挖掘和自然語言處理。文本挖掘充分利用Web和大規(guī)模語料庫的冗余信息來發(fā)現(xiàn)隱含的模式;而自然語言處理更多是在開放或者確定的Schema下做各種知識抽取。為了得到融合的圖譜,我們除了需要考慮離線的多源異構(gòu)的知識融合,還需要額外考慮服務(wù)任務(wù)類動態(tài)知識的對象綁定。這項工作往往是在線完成的,相當(dāng)于根據(jù)不同的交互,在線動態(tài)擴(kuò)充知識圖譜并實例化的過程。

最后還需要考慮知識圖譜的存儲。既然有了知識,就必須用一定的手段去存儲。但這里談到的存儲,不僅僅是建立一個知識庫,還包括存儲之后的應(yīng)用效率等。傳統(tǒng)型關(guān)系數(shù)據(jù)庫,例如MySQL,以及一些NoSQL數(shù)據(jù)庫,例如MongoDB,能不能存儲KG呢?答案是肯定的,但從直觀上說,考慮到知識是互聯(lián)、龐大的,且聯(lián)系是數(shù)據(jù)的本質(zhì)所在,而傳統(tǒng)型數(shù)據(jù)庫對于數(shù)據(jù)聯(lián)系的表現(xiàn)比較差,所以在知識圖譜的存儲上,關(guān)系型數(shù)據(jù)庫沒有圖數(shù)據(jù)庫靈活。尤其是涉及多跳關(guān)聯(lián)查詢時(例如姚明的妻子的國籍是什么),圖數(shù)據(jù)庫的效率會遠(yuǎn)比關(guān)系型數(shù)據(jù)庫高。

主站蜘蛛池模板: 即墨市| 乃东县| 洪雅县| 梁河县| 南康市| 永州市| 大英县| 合山市| 玉屏| 井陉县| 锡林浩特市| 大洼县| 措勤县| 清新县| 杭锦旗| 三穗县| 乌拉特后旗| 商城县| 长兴县| 青铜峡市| 新蔡县| 同心县| 开化县| 花垣县| 泗水县| 韶关市| 姜堰市| 合水县| 桂平市| 高雄市| 孟津县| 红安县| 郧西县| 论坛| 广饶县| 虎林市| 金寨县| 汝州市| 龙南县| 巴林左旗| 唐山市|