- 知識(shí)圖譜導(dǎo)論
- 陳華鈞
- 2315字
- 2021-06-10 20:09:33
2.3 知識(shí)圖譜的符號(hào)表示方法
接下來(lái)重點(diǎn)介紹知識(shí)圖譜的常用知識(shí)表示方法,并首先介紹知識(shí)圖譜的符號(hào)表示方法。
2.3.1 基于圖的知識(shí)表示方法
在前面的章節(jié)中已經(jīng)多次提到,知識(shí)圖譜采用圖的方式描述和表達(dá)知識(shí),相比于簡(jiǎn)單圖,能建模更加復(fù)雜的事物關(guān)系,但比起形式化邏輯,又免于復(fù)雜的邏輯約束,使得知識(shí)的獲取過(guò)程變得更加容易。
但在知識(shí)圖譜的實(shí)際實(shí)踐中,不同的應(yīng)用場(chǎng)景會(huì)對(duì)知識(shí)的建模采用不同表達(dá)能力的圖表示方法。例如有些應(yīng)用場(chǎng)景僅采用最簡(jiǎn)單的無(wú)向圖,通常適合于對(duì)建模要求不高,偏于數(shù)據(jù)挖掘類的應(yīng)用場(chǎng)景。知識(shí)圖譜表示應(yīng)用最多的是有向標(biāo)記圖(Directed Labelled Graph)。最常用的兩種有向標(biāo)記圖模型,一種叫屬性圖(Property Graph),另外一種是RDF圖模型,如圖2-5所示。

圖2-5 基于圖的知識(shí)表示方法
但有向標(biāo)記圖的表達(dá)能力依然是有限的,在很多專業(yè)領(lǐng)域,如醫(yī)學(xué)本體構(gòu)建等,需要更為復(fù)雜的關(guān)系語(yǔ)義的表示,例如描述對(duì)稱關(guān)系、自反關(guān)系、傳遞關(guān)系等,這就需要用到OWL等本體描述語(yǔ)言。本節(jié)重點(diǎn)介紹知識(shí)圖譜領(lǐng)域三種最常用的知識(shí)表示方法——屬性圖、RDF圖模型和OWL本體語(yǔ)言。
2.3.2 屬性圖
屬性圖是圖數(shù)據(jù)庫(kù)Neo4J實(shí)現(xiàn)的圖結(jié)構(gòu)表示模型,在工業(yè)界有廣泛應(yīng)用。屬性圖的優(yōu)點(diǎn)是表達(dá)方式非常靈活,例如,它允許為邊增加屬性,非常便于表示多元關(guān)系。屬性圖的存儲(chǔ)充分利用圖的結(jié)構(gòu)進(jìn)行優(yōu)化,因而在查詢計(jì)算方面具有較大優(yōu)勢(shì),關(guān)于這一點(diǎn)將在知識(shí)圖譜的存儲(chǔ)章節(jié)做更加具體的介紹。屬性圖的缺點(diǎn)是缺乏工業(yè)標(biāo)準(zhǔn)規(guī)范的支持,由于不關(guān)注更深層的語(yǔ)義表達(dá),也不支持符號(hào)邏輯推理。
在屬性圖的術(shù)語(yǔ)中,屬性圖是由頂點(diǎn)(Vertex)、邊(Edge)、標(biāo)簽(Label)、關(guān)系類型和屬性(Property)組成的有向圖。頂點(diǎn)也稱為節(jié)點(diǎn)(Node),邊也稱為關(guān)系(Relationship)。在屬性圖中,節(jié)點(diǎn)和關(guān)系邊是最重要的表達(dá)要素。節(jié)點(diǎn)上包含屬性,屬性可以以任何鍵值形式存在。
關(guān)系邊連接節(jié)點(diǎn),每條關(guān)系邊都有擁有一個(gè)方向、一個(gè)標(biāo)簽、一個(gè)開始節(jié)點(diǎn)和一個(gè)結(jié)束節(jié)點(diǎn)。關(guān)系邊的方向的標(biāo)簽使得屬性圖具有語(yǔ)義化特征。和節(jié)點(diǎn)一樣,關(guān)系邊也可以有屬性,即邊屬性,可以通過(guò)在關(guān)系邊上增加屬性給圖算法提供有關(guān)邊的元信息,如創(chuàng)建時(shí)間等。此外還可以通過(guò)邊屬性為邊增加權(quán)重和特性等其他額外語(yǔ)義,如圖2-6所示。

圖2-6 屬性圖示例
2.3.3 RDF圖模型
RDF是國(guó)際萬(wàn)維網(wǎng)聯(lián)盟W3C推動(dòng)的面向Web的語(yǔ)義數(shù)據(jù)標(biāo)準(zhǔn),所以RDF本身的定位首先是數(shù)據(jù)交換標(biāo)準(zhǔn)規(guī)范,而非存儲(chǔ)模型。RDF的基本組成單元是三元組,即(s,p,o),例如,可以用一條三元組來(lái)描述<浙江大學(xué), 位于, 杭州>。一條三元組代表關(guān)于客觀世界的邏輯描述或客觀事實(shí)。多個(gè)三元組頭尾相互連接,就形成了一個(gè)RDF圖。本質(zhì)上,RDF圖也是一個(gè)有向標(biāo)記圖。
RDF還提供了基礎(chǔ)的表達(dá)構(gòu)件用于定義類、屬性等Schema層的術(shù)語(yǔ)。例如,domain、range用于定義某個(gè)關(guān)系的頭尾節(jié)點(diǎn)類型,subClassOf和subPropertyOf用于定義類及屬性之間的層次關(guān)系等。有了RDFS,已經(jīng)可以實(shí)現(xiàn)最簡(jiǎn)單的符號(hào)推理。如圖2-7所示,如果將谷歌定義為一家人工智能公司,同時(shí)也知道人工智能公司是高科技公司,就可以推理得出谷歌也是一家高科技公司。這類簡(jiǎn)單的推理已經(jīng)可以減輕數(shù)據(jù)維護(hù)的負(fù)擔(dān),因?yàn)楹芏嗖樵兘Y(jié)果可以通過(guò)推理間接得出,而不用對(duì)所有結(jié)果進(jìn)行全量存儲(chǔ)。

圖2-7 基于RDFS實(shí)現(xiàn)簡(jiǎn)單的推理
2.3.4 OWL本體語(yǔ)言
RDF+RDFS的表達(dá)能力是非常有限的。在實(shí)際應(yīng)用中,需要定義更為復(fù)雜的概念,刻畫更為復(fù)雜的概念關(guān)系。這就需要用到OWL等本體表達(dá)語(yǔ)言。本體(Ontology)原來(lái)是一個(gè)哲學(xué)術(shù)語(yǔ),后來(lái)被人工智能的研究人員作為知識(shí)表示研究的對(duì)象引入計(jì)算機(jī)領(lǐng)域。本體最常用的邏輯表達(dá)語(yǔ)言即描述邏輯(Description Logic)。系統(tǒng)性介紹描述邏輯的內(nèi)容超出了本書的范圍,接下來(lái)主要結(jié)合國(guó)際萬(wàn)維網(wǎng)聯(lián)盟推動(dòng)的OWL本體語(yǔ)言標(biāo)準(zhǔn)來(lái)介紹相關(guān)的基本知識(shí)。
OWL首先可以被看作RDF Schema的擴(kuò)展。OWL在RDF的基礎(chǔ)上增加了更多的語(yǔ)義表達(dá)構(gòu)件。例如,通過(guò)多個(gè)類組合定義更加復(fù)雜的類;刻畫關(guān)系的一對(duì)多、多對(duì)一、多對(duì)多等關(guān)系基數(shù)(Cardinality)約束;定義常用的全稱量詞和存在量詞;定義互反關(guān)系、傳遞關(guān)系、自反關(guān)系、函數(shù)關(guān)系等更加復(fù)雜的關(guān)系語(yǔ)義等。
在這里舉例介紹幾種典型的OWL表達(dá)構(gòu)件。例如可以使用等價(jià)性聲明表達(dá)構(gòu)件owl:equivalentClass、owl:equivalentProperty和owl:sameIndividualAs來(lái)分別聲明兩個(gè)類、兩個(gè)屬性或兩個(gè)個(gè)體的等價(jià)關(guān)系。再比如可以聲明傳遞關(guān)系,如<exp:ancestor rdf:type owl:TransitiveProperty>聲明了ancestor是一個(gè)傳遞關(guān)系,當(dāng)知識(shí)庫(kù)中存在<exp:小明exp:ancestor exp:小林>;<exp:小林exp:ancestor exp:小志>兩條知識(shí)時(shí),就可以推理得出<exp:小明exp:ancestor exp:小志>。類似地,也可以聲明互反關(guān)系,如<exp:ancestor owl:inverseOf exp:descendant>聲明ancestor和descendant是互反的,當(dāng)知道<exp:小明exp:ancestor exp:小林>,就可以馬上在知識(shí)庫(kù)中新增一條<exp:小林exp:descendant exp:小明>的新知識(shí)。
還可以聲明某個(gè)關(guān)系必須滿足函數(shù)約束,例如聲明<exp:hasMother rdf:type owl:FunctionalProperty>,這樣exp:hasMother就是一個(gè)具有函數(shù)性的屬性,因?yàn)槊總€(gè)人只有一個(gè)母親。這將作為約束作用到整個(gè)知識(shí)庫(kù),不允許知識(shí)庫(kù)中出現(xiàn)一個(gè)人同時(shí)有兩個(gè)母親。
還可以聲明屬性的全稱限定,例如,owl:allValuesFrom聲明exp:hasMother在主語(yǔ)屬于exp:Person類的時(shí)候,賓語(yǔ)的取值只能來(lái)自exp:Women類。同樣地,可以聲明屬性的存在限定,通過(guò)owl:someValuesFrom聲明exp:publishedIn在主語(yǔ)屬于exp:SemanticWebPaper類的時(shí)候,賓語(yǔ)的取值部分來(lái)自exp:AAAI類。
OWL擁有眾多的表達(dá)構(gòu)件,本書不對(duì)它們做完整的介紹。OWL實(shí)際上有很多語(yǔ)言家族,不同的語(yǔ)言家族代表不同的表達(dá)構(gòu)件的組合。不同的組合對(duì)應(yīng)不同的推理計(jì)算復(fù)雜度以及它們所適用的場(chǎng)景。如圖2-8所示,OWL-QL表示查詢語(yǔ)言的意思,專為基于大規(guī)模的查詢?cè)O(shè)計(jì)的子語(yǔ)言;OWL 2 RL在擴(kuò)展RDFS表達(dá)能力的同時(shí),保持了較低的復(fù)雜度;OWL 2 EL專為概念術(shù)語(yǔ)描述、推理而設(shè)計(jì),在生物醫(yī)療領(lǐng)域廣泛應(yīng)用,如臨床醫(yī)療術(shù)語(yǔ)本體SNOMED CT等。在第5章還將結(jié)合推理能力對(duì)表達(dá)語(yǔ)言進(jìn)行介紹。

圖2-8 OWL語(yǔ)言家族
綜上,屬性圖是工業(yè)界最常見的圖譜建模方法,屬性圖數(shù)據(jù)庫(kù)充分利用圖結(jié)構(gòu)特點(diǎn)做了性能優(yōu)化,實(shí)用度高,但不支持符號(hào)推理。RDF是W3C推動(dòng)的語(yǔ)義數(shù)據(jù)交換標(biāo)準(zhǔn)與規(guī)范,有更嚴(yán)格的語(yǔ)義邏輯基礎(chǔ),支持推理,并兼容更復(fù)雜的本體表示語(yǔ)言O(shè)WL。在三元組無(wú)法滿足語(yǔ)義表示需要時(shí),OWL作為一種完備的本體語(yǔ)言,提供了更多可供選用的語(yǔ)義表達(dá)構(gòu)件。描述邏輯可以為知識(shí)圖譜的表示與建模提供理論基礎(chǔ)。描述邏輯之于知識(shí)圖譜,好比關(guān)系代數(shù)之于關(guān)系數(shù)據(jù)庫(kù)。
- 知識(shí)圖譜從0到1:原理與Python實(shí)戰(zhàn)
- 深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)實(shí)戰(zhàn)
- 硅基物語(yǔ)·AI寫作高手:從零開始用ChatGPT學(xué)會(huì)寫作
- 一本書讀懂ChatGPT、AIGC和元宇宙
- 深度思考:人工智能的終點(diǎn)與人類創(chuàng)造力的起點(diǎn)
- 人機(jī)共生
- 虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)技術(shù)
- 人工智能及其應(yīng)用
- 人人都是設(shè)計(jì)師:設(shè)計(jì)基礎(chǔ)+Midjourney+ChatGPT
- 第五范式
- 機(jī)器學(xué)習(xí)與學(xué)習(xí)資源適配
- 中國(guó)人工智能創(chuàng)新鏈產(chǎn)業(yè)鏈技術(shù)專利發(fā)展研究
- 終極智能:感知機(jī)器與人工智能的未來(lái)
- 如何創(chuàng)造可信的AI
- 智能計(jì)算系統(tǒng)實(shí)驗(yàn)教程