官术网_书友最值得收藏!

1.2 知識(shí)圖譜的發(fā)展歷史

知識(shí)圖譜并非突然出現(xiàn)的新技術(shù),而是歷史上很多相關(guān)技術(shù)相互影響和繼承發(fā)展的結(jié)果,包括語義網(wǎng)絡(luò)、知識(shí)表示、本體論、Semantic Web、自然語言處理等,有著來自Web、人工智能和自然語言處理等多方面的技術(shù)基因。從早期的人工智能發(fā)展歷史來看, Semantic Web是傳統(tǒng)人工智能與Web融合發(fā)展的結(jié)果,是知識(shí)表示與推理在Web中的應(yīng)用;RDF(Resource Description Framework,資源描述框架)、OWL(Web Ontology Language,網(wǎng)絡(luò)本體語言)都是面向Web設(shè)計(jì)實(shí)現(xiàn)的標(biāo)準(zhǔn)化的知識(shí)表示語言;而知識(shí)圖譜則可以看作是Semantic Web的一種簡化后的商業(yè)實(shí)現(xiàn),如圖1-2所示。

圖1-2 從語義網(wǎng)絡(luò)到知識(shí)圖譜

在人工智能的早期發(fā)展流派中,符號(hào)派(Symbolism)側(cè)重于模擬人的心智,研究怎樣用計(jì)算機(jī)符號(hào)表示人腦中的知識(shí)并模擬心智的推理過程;連接派(Connectionism)側(cè)重于模擬人腦的生理結(jié)構(gòu),即人工神經(jīng)網(wǎng)絡(luò)。符號(hào)派一直以來都處于人工智能研究的核心位置。近年來,隨著數(shù)據(jù)的大量積累和計(jì)算能力的大幅提升,深度學(xué)習(xí)在視覺、聽覺等感知處理中取得突破性進(jìn)展,進(jìn)而又在圍棋等博弈類游戲、機(jī)器翻譯等領(lǐng)域獲得成功,使得人工神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)獲得了人工智能研究的核心地位。深度學(xué)習(xí)在處理感知、識(shí)別和判斷等方面表現(xiàn)突出,能幫助構(gòu)建聰明的人工智能,但在模擬人的思考過程、處理常識(shí)知識(shí)和推理,以及理解人的語言方面仍然舉步維艱。

哲學(xué)家柏拉圖把知識(shí)(Knowledge)定義為“Justified True Belief”,即知識(shí)需要滿足三個(gè)核心要素:合理性(Justified)、真實(shí)性(True)和被相信(Believed)。簡而言之,知識(shí)是人類通過觀察、學(xué)習(xí)和思考有關(guān)客觀世界的各種現(xiàn)象而獲得并總結(jié)出的所有事實(shí)(Fact)、概念(Concept)、規(guī)則(Rule)或原則(Principle)的集合。人類發(fā)明了各種手段來描述、表示和傳承知識(shí),如自然語言、繪畫、音樂、數(shù)學(xué)語言、物理模型、化學(xué)公式等。具有獲取、表示和處理知識(shí)的能力是人類心智區(qū)別于其他物種心智的重要特征。人工智能的核心也是研究怎樣用計(jì)算機(jī)易于處理的方式表示、學(xué)習(xí)和處理各種各樣的知識(shí)。知識(shí)表示是現(xiàn)實(shí)世界的可計(jì)算模型(Computable Model of Reality)。從廣義上講,神經(jīng)網(wǎng)絡(luò)也是一種知識(shí)表示形式,如圖1-3所示。

圖1-3 知識(shí)圖譜幫助構(gòu)建有學(xué)識(shí)的人工智能

符號(hào)派關(guān)注的核心正是知識(shí)的表示和推理(KRR,Knowledge Representation and Reasoning)。早在1960年,認(rèn)知科學(xué)家Allan M.Collins提出用語義網(wǎng)絡(luò)(Semantic Network)研究人腦的語義記憶。例如,WordNet[23]是典型的語義網(wǎng)絡(luò),它定義了名詞、動(dòng)詞、形容詞和副詞之間的語義關(guān)系。WordNet被廣泛應(yīng)用于語義消歧等自然語言處理領(lǐng)域。

1970年,隨著專家系統(tǒng)的提出和商業(yè)化發(fā)展,知識(shí)庫(Knowledge Base)構(gòu)建和知識(shí)表示更加得到重視。專家系統(tǒng)的基本想法是:專家是基于大腦中的知識(shí)來進(jìn)行決策的,因此人工智能的核心應(yīng)該是用計(jì)算機(jī)符號(hào)表示這些知識(shí),并通過推理機(jī)模仿人腦對(duì)知識(shí)進(jìn)行處理。依據(jù)專家系統(tǒng)的觀點(diǎn),計(jì)算機(jī)系統(tǒng)應(yīng)該由知識(shí)庫和推理機(jī)兩部分組成,而不是由函數(shù)等過程性代碼組成。早期的專家系統(tǒng)最常用的知識(shí)表示方法包括基于框架的語言(Frame-based Languages)和產(chǎn)生式規(guī)則(Production Rules)等。框架語言主要用于描述客觀世界的類別、個(gè)體、屬性及關(guān)系等,較多地被應(yīng)用于輔助自然語言理解。產(chǎn)生式規(guī)則主要用于描述類似于IF-THEN的邏輯結(jié)構(gòu),適合于刻畫過程性知識(shí)。

知識(shí)圖譜與傳統(tǒng)專家系統(tǒng)時(shí)代的知識(shí)工程有著顯著的不同。與傳統(tǒng)專家系統(tǒng)時(shí)代主要依靠專家手工獲取知識(shí)不同,現(xiàn)代知識(shí)圖譜的顯著特點(diǎn)是規(guī)模巨大,無法單一依靠人工和專家構(gòu)建。如圖1-4所示,傳統(tǒng)的知識(shí)庫,如Douglas Lenat從1984年開始創(chuàng)建的常識(shí)知識(shí)庫Cyc,僅包含700萬條下文有關(guān)知識(shí)圖譜規(guī)模的描述都以三元組(Triple)為計(jì)算單元,一個(gè)元組對(duì)應(yīng)一條事實(shí)描述(Fact or Assertion)。的事實(shí)描述(Assertion)。Wordnet主要依靠語言學(xué)專家定義名詞、動(dòng)詞、形容詞和副詞之間的語義關(guān)系,目前包含大約20萬條的語義關(guān)系。由著名人工智能專家Marvin Minsky于1999年起開始構(gòu)建的ConceptNet[24]常識(shí)知識(shí)庫依靠了互聯(lián)網(wǎng)眾包、專家創(chuàng)建和游戲三種方法,但早期的ConceptNet規(guī)模在百萬級(jí)別,最新的ConceptNet 5.0也僅包含2800萬個(gè)RDF三元組關(guān)系描述。谷歌和百度等現(xiàn)代知識(shí)圖譜都已經(jīng)包含超過千億級(jí)別的三元組,阿里巴巴于2017年8月發(fā)布的僅包含核心商品數(shù)據(jù)的知識(shí)圖譜也已經(jīng)達(dá)到百億級(jí)別。DBpedia已經(jīng)包含約30億個(gè)RDF三元組,多語種的大百科語義網(wǎng)絡(luò)BabelNet包含19億個(gè)RDF三元組[25],Yago3.0包含1.3億個(gè)元組,Wikidata已經(jīng)包含4265萬條數(shù)據(jù)條目,元組數(shù)目也已經(jīng)達(dá)到數(shù)十億級(jí)別。截至目前,開放鏈接數(shù)據(jù)項(xiàng)目Linked Open Datahttp://lod-cloud.net。統(tǒng)計(jì)了其中有效的2973個(gè)數(shù)據(jù)集,總計(jì)包含大約1494億個(gè)三元組。

圖1-4 現(xiàn)代知識(shí)圖譜的規(guī)模化發(fā)展

現(xiàn)代知識(shí)圖譜對(duì)知識(shí)規(guī)模的要求源于“知識(shí)完備性”難題。馮·諾依曼曾估計(jì)單個(gè)個(gè)體大腦的全量知識(shí)需要2.4×1020個(gè)bits存儲(chǔ)[26]。客觀世界擁有不計(jì)其數(shù)的實(shí)體,人的主觀世界還包含無法統(tǒng)計(jì)的概念,這些實(shí)體和概念之間又具有更多數(shù)量的復(fù)雜關(guān)系,導(dǎo)致大多數(shù)知識(shí)圖譜都面臨知識(shí)不完全的困境。在實(shí)際的領(lǐng)域應(yīng)用場(chǎng)景中,知識(shí)不完全也是困擾大多數(shù)語義搜索、智能問答、知識(shí)輔助的決策分析系統(tǒng)的首要難題。

主站蜘蛛池模板: 屏山县| 铜梁县| 澄城县| 石嘴山市| 利津县| 洛南县| 磐石市| 奉新县| 顺平县| 惠来县| 福海县| 庆元县| 婺源县| 客服| 邳州市| 乃东县| 温宿县| 罗山县| 洪泽县| 元谋县| 麻阳| 威信县| 通许县| 新和县| 河池市| 彰武县| 津市市| 伊宁县| 瓦房店市| 涟源市| 黑河市| 龙川县| 大田县| 新化县| 天气| 西华县| 武鸣县| 凌云县| 嘉峪关市| 正蓝旗| 扎鲁特旗|