官术网_书友最值得收藏!

1.1 語言與知識

1.1.1 構建有學識的人工智能

首先將從“語言與知識”兩個視角出發(fā),引出本書的主角——知識圖譜。這里的故事從人工智能的起源開始。早期的人工智能有很多持不同觀點的流派,其中兩個歷史比較悠久的流派通常被稱為連接主義和符號主義。連接主義主張智能的實現(xiàn)應該模擬人腦的生理結構,即用計算機模擬人腦的神經網絡連接。這個流派發(fā)展至今,即所謂廣泛發(fā)展的深度神經網絡。另外一個流派稱為符號主義,主張智能的實現(xiàn)應該模擬人類的心智,即用計算機符號記錄人腦的記憶,表示人腦中的知識,即所謂知識工程與專家系統(tǒng)等。

深度學習首先在視覺、聽覺等感知任務中獲得成功,本質上解決的是模式識別的問題,可以比喻為實現(xiàn)的是一種聰明的AI。但感知還是低級的智能,人的大腦依賴所學的知識進行思考、推理和理解語言等。因此,還有另外一種AI可以稱為是有學識、有知識的AI。這和知識圖譜有密切關系,如圖1-1所示。事實上,這兩種AI對于實現(xiàn)真正的人工智能都很重要,缺一不可。

圖1-1 構建有學識的人工智能

什么叫認知智能?認知智能有兩個核心的研究命題,一個是語言理解,另外一個是知識的表示與處理。人類通過認識世界來積累關于世界的知識,通過學習到的知識來解決碰到的問題。比如,一位醫(yī)生利用他的醫(yī)學知識給病人看病。而語言則是知識最直接的載體,到目前為止,人類的絕大部分知識都是通過自然語言來描述、記錄和傳承的。

與此同時,正確理解語言又需要知識的幫助。如圖1-2所示,這里舉一個有趣的例子:“G20上午開會休息,馬云對他的秘書說:‘中午幫我買肯德基。’30分鐘后,秘書回來說:‘買好了,一共4.6億美元,咱是支付寶還是現(xiàn)金?’”。這當然只是個玩笑,當時的新聞是春華資本及螞蟻金服共同向肯德基的母公司百勝餐飲投資了4.6億美元。這里關注的是背景知識對于正確理解語言的重要性。假如馬云的秘書是一個人工智能,它在第一個語境中,應該把肯德基識別為一種食品,而在第二個語境中,應該把肯德基識別為一家公司,而且它還需要知道肯德基的母公司是百勝餐飲,螞蟻金服投資了百勝餐飲,而馬云是阿里巴巴的創(chuàng)始人,阿里巴巴與螞蟻金服存在關聯(lián)關系,才能正確地建立馬云和肯德基的關系。這個背后的事物關系網絡其實就是知識圖譜。事實上,每個人的大腦里面都有大量這種類型的關于萬事萬物之間關聯(lián)關系的知識圖譜,我們極大地依賴這些背景知識來準確理解語言并正確地做出判斷。

圖1-2 語言與知識是實現(xiàn)認知智能的兩翼

1.1.2 知識的承載與表示方式

那到底什么是知識?柏拉圖說知識是“Justified True Belief”。實際上,人類的自然語言,以及創(chuàng)作的繪畫和音樂、數(shù)學語言、物理模型和化學公式等都是人類知識的表示形式和傳承方式。具有獲取、表示和處理知識的能力是人類心智區(qū)別于其他物種心智的最本質特征之一。傳統(tǒng)的人工智能領域有一個經典的研究方向——知識工程和專家系統(tǒng)。這種經常被稱為是GOFAI(Good Old Fashioned AI)的基本思想是建立一個系統(tǒng),能夠從專家大腦里獲取知識,再通過一個推理引擎為非專家用戶提供服務,如輔助診斷、判案等。而這個從人腦獲取知識的過程就叫作知識工程。

知識有很多種表達載體和存在形式,例如自然語言是人類知識最主要的表達載體。既然人腦能夠通過閱讀從文本獲取和學習知識,機器腦也應該具備從文本中抽取知識的能力。但文本字符串似乎對機器不太友好,機器在理解人類語言方面仍然步履維艱。比如類似于微軟小冰、蘋果Siri、小米小愛音箱等產品在人機對話方面的體驗仍然面臨巨大的挑戰(zhàn)。

當前,通過機器來理解文本中的知識有兩大主要的技術路線。如圖1-3所示,第一種是抽取技術,例如從文本中識別實體、關系和邏輯結構等;第二種是語言預訓練,即通過大量的文本語料訓練一個神經網絡大模型,文本中的知識被隱含在參數(shù)化的向量模型中,而向量化的表示和神經網絡是對機器友好的。所以,文本本身也可以作為一種知識庫(Knowledge Base)。

圖1-3 文本知識庫

知識圖譜的本質是一種結構化的知識表示形式,也是本書的主角。簡單地說,知識圖譜旨在利用圖結構建模、識別和推斷事物之間的復雜關聯(lián)關系和沉淀領域知識,已經被廣泛地應用于語義搜索、智能問答、語言理解、媒體理解、推理引擎和決策引擎等眾多領域,如圖1-4所示。相比文本而言,結構化數(shù)據更易于被機器處理,比如查詢和問答。同時圖結構比起字符串序列能夠表達更加豐富的語義和知識。

圖1-4 知識圖譜:結構化的知識庫

對于機器而言,圖結構比文本當然更加友好。深度學習或者更為準確地說是表示學習的興起,表明參數(shù)化的向量和神經網絡是更適合機器完成快速計算的信息載體。比如,在自然語言中,可以為每個詞學習一個向量表示;在圖像處理中,也可以為視覺場景中的每一個對象學習一個向量表示;在知識圖譜中,可以為每一個實體和關系學習一個向量表示。我們通常把這些向量化表示稱為Embedding或“Distributed Vector Representation。”

如圖1-5所示,如果將所有數(shù)字對象的向量表示投影到向量空間,我們會發(fā)現(xiàn),同一個數(shù)字對象的不同圖像的向量在空間距離更近。進一步地,通過將詞語、實體、對象和關系等都投影到向量空間,就可以更加方便地在向量空間對這些語言、視覺和實體對象進行操作,甚至可以利用神經網絡實現(xiàn)邏輯推理。

圖1-5 向量知識庫

1.1.3 知識圖譜是一種世界模型

知識圖譜本質上可以看作一種世界模型——World Model。縱觀人工智能相關方向的發(fā)展歷史,一直有一個核心的命題是尋找合適的萬物機器表示,用于記錄有關世界的知識。在傳統(tǒng)的專家系統(tǒng)時代,人們發(fā)明了描述邏輯等符號化的知識表示方法來描述萬物。人類的自然語言也是符號化的描述客觀世界的表示方法。到了互聯(lián)網時代,人們又設想用本體和語義鏈接有關互聯(lián)網上發(fā)布的各種數(shù)據和知識,這也是知識圖譜的起源之一,如圖1-6所示。

圖1-6 尋找合適的萬物機器表示

隨著表示學習和神經網絡的興起,人們發(fā)現(xiàn)數(shù)值化的向量表示更易于捕獲那些隱藏的、不易于明確表示的知識,并且比符號表示更易于機器處理。知識圖譜同時擁抱機器的符號表示和向量表示,并能將兩者有機地結合起來,解決搜索、問答、推理和分析等多方面的問題。關于這一點的介紹也將貫穿本書的始終。

結合知識圖譜、神經網絡等新的人工智能技術手段,可以對專家系統(tǒng)進行重構。原有的知識庫可以采用知識圖譜的方式,讓知識獲取的手段更容易。除了傳統(tǒng)的符號表示,也要考慮如何用向量表示實體、關系等知識。在知識獲取方面,專家層面的經驗為現(xiàn)代知識的構建提供了重要的輸入,此外,現(xiàn)在還有設備傳感數(shù)據、自動采集的日志數(shù)據、多種模態(tài)的數(shù)據等大量的機器數(shù)據。知識圖譜在一定程度上可以起到橋梁的作用,將專家經驗性的知識與機器數(shù)據通過比較有效的表示結合起來,如圖1-7所示。

圖1-7 利用知識圖譜與神經網絡重構專家系統(tǒng)

在推理引擎方面,傳統(tǒng)的符號推理引擎有很多,由于有諸多瓶頸,例如對知識質量要求非常高,均未能實現(xiàn)大規(guī)模商業(yè)化應用。而現(xiàn)在的推理引擎可以在神經網絡、表示學習等深度學習技術加持下實現(xiàn)更好的推理。在面向用戶的交互方面,不再僅僅是簡單查詢,還可以實現(xiàn)搜索、智能問答和基于圖分析的決策分析。并通過一些可視化的手段支撐對所有數(shù)據在各個維度的整體性分析,同時對所有推斷結果提供可解釋性。

主站蜘蛛池模板: 和静县| 新龙县| 田阳县| 安西县| 奉贤区| 谷城县| 山东| 灵丘县| 济南市| 夏津县| 平南县| 蓬溪县| 邛崃市| 吉林省| 保德县| 临颍县| 东平县| 赤峰市| 太谷县| 奉新县| 平顺县| 南岸区| 蓬安县| 龙门县| 徐汇区| 宕昌县| 招远市| 永济市| 荔浦县| 土默特左旗| 江西省| 共和县| 河曲县| 龙门县| 乌鲁木齐县| 仁怀市| 闽侯县| 瑞丽市| 睢宁县| 叙永县| 深泽县|