- 知識圖譜:認知智能理論與實戰
- 王文廣
- 1436字
- 2024-01-25 17:32:15
1.4 從DIKW模型到知識圖譜
DIKW 模型可以幫助我們進一步理解什么是知識圖譜。把1.3節中的DIKW 模型和1.2節中的知識圖譜進行比較,很容易找出它們的相似之處。
信息是實體,是孤立存在的有一定層次結構的數據。知識是關系三元組,以及由無數關系三元組組成的知識圖譜本身或其子圖,是互相關聯交織的有明確語義和關聯關系的信息。也就是說,知識圖譜相當于 DIKW模型中的知識(K)。從圖1-2描述的兩個關鍵維度——語義和連接來說,現實存在的抽象的或具體的事物會產生混沌的、雜亂無章的、原始孤立的數據。對數據進行清洗、分析和治理,根據領域實踐經驗理解數據,并建立知識點內部數據的連接,就形成了信息,其結果體現為實體。進一步運用領域實踐經驗理解實體(知識點/信息)之間的關聯關系,并在實體之間建立合適的、符合實際情況的、語義化表示的關系,其結果體現為知識圖譜。在知識圖譜領域,這個過程被稱為知識圖譜構建,即從原始數據到已處理的信息,再到互相關聯的知識的過程。
也就是說,在DIKW模型中,從數據到信息,進而到知識的過程,就是從混沌到有序、從雜亂無章到結構清晰、從原始孤立到交織互聯的過程,也就是知識圖譜的構建過程。DIKW 模型中的智慧(W)是指對知識的應用,核心在于聯想機制的激活。在知識圖譜中,智慧體現為對知識圖譜的應用。具體來說,就是基于知識圖譜的各種模型、算法,以及針對具體應用場景的業務規則、邏輯推理等,比如知識計算、知識推理、知識問答和輔助決策等。直覺系統對應于簡單應用,在知識圖譜領域,體現為對知識的直接利用,比如知識檢索、知識探索等;理性系統對應于復雜運算,在知識圖譜領域,對應于需要經過復雜運算過程的知識應用,比如知識計算、知識推理等。
在DIKW 模型中,如果把原始的雜亂無章的數據稱為非結構化數據,把已經治理過的、有層次結構的、規則有序的信息稱為結構化數據,那么知識圖譜的構建就是把非結構化數據和結構化數據轉化成知識圖譜的過程,知識存儲是以圖的形式將知識點及其關聯關系保存起來的過程,基于知識圖譜開發出的應用則是形成智慧的過程。這就是知識圖譜領域常用的表述方式。知識圖譜的構建、存儲和應用的全流程如圖1-3所示。

圖1-3 知識圖譜的構建、存儲和應用的全流程
從圖1-3 來看,知識圖譜的含義有所變化,其關注點不僅僅包括知識本身,還包括與知識的生產、表示、存儲和應用有關的方法、技術、應用程序和流程等。在實踐中,人們在提及“知識圖譜”時,有時指的是用圖來表示的知識,即1.2節中對知識圖譜的定義;有時指的是生產、表示、存儲和應用知識的技術,即圖1-3虛線框所包含的部分。這里借用邏輯學的兩個名詞——“內涵”和“外延”——來厘清“知識圖譜”的定義。
● 知識圖譜的內涵:由實體及實體間的關系所組成的網狀的圖,表示的是知識本身。包括所有由實體及其屬性組成的知識點,以及由關系及其屬性組成的知識點之間的關聯關系的總和。
● 知識圖譜的外延:即生產知識(知識圖譜構建)、表示知識(知識圖譜存儲)和應用知識(知識圖譜應用)有關的方法、技術、模型、算法、應用程序、流程等的總和。
正如同人們在使用“水果”一詞時,想表達的既可能是水果的內涵——即水果的固有屬性,也可能是水果的外延——具備水果特征的一個或多個個體。在本書及絕大多數使用知識圖譜的場景中,“知識圖譜”這4個字既可能表達知識圖譜的內涵,即知識本身;也可能表達知識圖譜的外延,即知識及與知識圖譜的構建、表示存儲和應用有關的技術。在遇到“知識圖譜”一詞時,讀者根據上下文情景進行判斷即可,并且這種判斷是容易的,一般不會混淆。