推薦序
知識圖譜向何處去?
陸汝鈐
很高興得知陳華鈞教授要出知識圖譜的新書了。與2019年出版的《知識圖譜:方法、實踐與應用》相比,本書在內容上有很多更新,尤其是第8、第9兩章中的新內容最為集中。這些內容反映了近年來知識圖譜理論和技術的迅速進步,同時展現了作者團隊的辛勤工作所取得的豐碩成果。我初步翻閱本書,就覺得很有收獲。這里就其中的兩個話題—知識圖譜推理和知識圖譜融合,談一點個人想法。
知識圖譜的推理是知識圖譜服務功能中一個極其重要的問題。基于知識圖譜的許多重要問題的解決都離不開推理。陳華鈞教授曾經一語中的:知識獲取的途徑是“大樣本靠機器學習,小樣本靠知識推理”。這是知識圖譜顯身手的主戰場。本書的“知識圖譜推理”一章介紹了基于知識圖譜的多種推理方式,包括基于規則的、基于本體的、基于圖結構的、基于表示學習的、基于神經網絡的,等等,這是非常有道理的。知識本身的多種多樣,加上人的思維方式的多種多樣,決定了推理方式的多種多樣,也決定了推理邏輯的多種多樣。本書已經介紹了足夠多的知識推理機制,雖然受篇幅所限,難以窮盡開放語義下各種可能的知識圖譜推理方式,但是最基本的“三大件”—規則推理、神經網絡推理和圖推理,都已經具備了。我有一個遐想:這“三大件”就像“海、陸、空”。圖推理是“海”,億萬級“當量”的知識圖譜是知識元素的“大海”。而一層又一層、高入云霄的深度神經網絡可謂是“空”中樓閣。至于那強調一步一個腳印的規則推理,則是“陸”地上的老黃牛,看上去不那么“摩登”,但實際推理中卻始終離不開它。我深信這“三大件”像最基本的化學元素,知識圖譜的耕耘者們會不斷地把這些基本元素“合成”為最新穎、最有效的嶄新推理機制。
本書有一章是獻給“知識圖譜融合”的。如果把某個領域的知識圖譜比作該領域的人類專家,則完全可以想象:有許多復雜問題單靠一位專家是解決不了或解決不好的,而一個優秀的專家團隊將會大大提升解決問題的能力。對于知識圖譜也是如此。在我們看來,這不僅是大數據的融合,更應該是大知識的融合,在一定程度上體現了知識圖譜學習人類專家的合作精神。但是我還想做一點補充,除了知識圖譜融合,知識圖譜配合(只差一個字)也是可以考慮的。就是反其道而行之,不是融合成一個巨型圖譜,而是保持各自的獨立性,建成一個團隊,開展多圖譜合作。它們各有所長,遇到任務可以分工負責,遇到跨領域問題或不同意見可以切磋討論,甚至辯論,從而引進多維度的靈活性。實際上,作者在第9章引入了基于區塊鏈和知識價值觀的聯邦知識圖譜的概念,雖然已接近本書的最后,卻非常重要。其中提到的“去中心化”的思想更是“知識圖譜配合”的核心概念。聯邦知識圖譜可以廣義化、一般化,如果再配上楊強教授倡導的聯邦學習,那就是如虎添翼,知識圖譜的威力更大大提高了。它們不僅利用各自的知識以合作解決問題,而且保護了各自的知識產權,成為一種知識區塊鏈的基礎(我在不久前的一次國際會議上提出過這個建議)。我個人認為,在一定意義上,知識圖譜配合將會顯示出比知識圖譜融合更加深遠的理論意義和研究價值。我甚至期待著復雜度可能遠超一般的“知識圖譜聯邦”(關鍵詞:合作、保護)的“知識圖譜共同體”(關鍵詞:合作、保護和競爭)的出現。
多圖譜合作和多圖譜融合有一個共同的問題,就是各方圖譜的結構、語法、語義和表示可能有較大差別,導致出現民間所謂的“雞同鴨講話”的困境。在這種情況下,如何才能合作好呢?別擔心!世事畢竟“分久必合,合久必分。”一個學問出來了,研究的人多了,慢慢就形成了不同的流派。再過一段時間,出來了高人,又把不同的流派在更高的層面上統一了。目前正處于知識圖譜大發展時期,還在“分”的階段。各種新技術百花齊放,層出不窮。只是相比之下,“百家爭鳴”稍嫌不足。以上面提到的知識推理為例,各種推理方法的提出和介紹在文獻中比比皆是,但是對它們作對比和分析的文獻相對缺失。本書在這一章的最后一節有對幾種推理策略的簡要分析和比較,那幾句話很關鍵,可供知識圖譜開發者參考。不過我們并不滿足于此,而是期待著更加深入的理論剖析和應用指導的出現。至于當今一些知識圖譜在知識表示上的各行其是,包括一些在國際上極負盛名的特大型知識圖譜,則尤為明顯。我們相信,在適當的時機會有某個權威的國際學術機構出面制定各種標準,收拾紛雜,形成一統。就像秦滅六國,什么語言文字,什么道寬路距,全部統一了。
本書對知識圖譜技術的介紹是非常全面的。從知識的獲取、表示和存儲、圖譜的構建和融合,直到圖譜的查詢、問答和推理等,還介紹了多種特殊類型的知識圖譜,內容洋洋大觀。這些技術應該都已經有相應的算法,并且體現為程序,掌握在不同的開發者手中,而且針對同一問題的算法和程序可能還不是唯一的。這里我想到了相應軟件工具的(有償或無償)共享問題。不僅是個別的、特定的共享,而且是成套的、系統的共享。這對于知識圖譜開發者非常重要。省去了耗時耗力的重復開發,可以把精力集中到研發新技術方面。我借此機會向同行們呼吁一下:請關注知識圖譜通用平臺的研發。它們集成了知識圖譜從開發、管理到應用的許多功能,是知識圖譜工程的一個重要組成部分。同時我還要強調本書作者陳教授說過的一句話:“我們希望見到國產的、開源的、允許批量下載(dump)的大型海量知識圖譜。”陳教授認為只有這樣的知識圖譜才能夠體現我國知識圖譜技術在世界上的地位和影響。我完全支持這個倡議。
回到本書的宗旨。我注意到作者在本書中談及的內容,基本上是根據他自己的授課教材編寫而成的,并且今后還要根據知識圖譜學科的進展,不斷調整和豐富其內容。這是一條教研相長的光明大道。我們預祝陳教授成功!