- 從零構(gòu)建知識圖譜:技術(shù)、方法與案例
- 邵浩 張凱 李方圓 張云柯 戴錫強
- 1631字
- 2021-08-06 17:17:16
1.4 為什么需要知識圖譜
上文中我們介紹了知識圖譜的基礎(chǔ)知識,尤其可以看到知識圖譜在搜索方面的重要作用。可能有讀者會問,和傳統(tǒng)數(shù)據(jù)庫相比,知識圖譜有哪些獨特優(yōu)勢?要回答這個問題,我們先來聊一聊人工智能目前的發(fā)展情況。
隨著硬軟件的發(fā)展,自2012年以來,深度學習在各領(lǐng)域,尤其是感知層面,都掀起了技術(shù)革命。
在計算機視覺領(lǐng)域,微軟在2015年提出的深度學習算法[9],已經(jīng)在ImageNet2012[1]分類數(shù)據(jù)集中將錯誤率降低到4.94%,首次低于人眼識別的錯誤率(約5.1%)。在語音合成技術(shù)領(lǐng)域,DeepMind公司在2017年6月發(fā)布了最新的WaveNet語音合成系統(tǒng)[2],是當時世界上文本到語音環(huán)節(jié)最好的生成模型。在語音識別領(lǐng)域,通過引入深度學習,大大提到了語音識別的準確性。2017年8月,微軟語音識別系統(tǒng)錯誤率由之前的5.9%進一步降低到5.1%,大幅刷新原先記錄,可與專業(yè)速記員比肩[8]。
而在預(yù)訓(xùn)練語言模型方面,OpenAI的語言模型GPT-2[3]在多項任務(wù)上均超越了BERT,成為當時新的標桿。2020年,GPT-3[4]橫空出世,其參數(shù)比GPT-2多100倍。該模型經(jīng)過了將近0.5萬億個單詞的預(yù)訓(xùn)練,可以在不進行微調(diào)的情況下,在多個NLP基準上達到最優(yōu)質(zhì)的性能。
在應(yīng)用領(lǐng)域,有很多人們所熟知的具有代表性的案例。2011年,IBM Waston在綜藝節(jié)目《危險邊緣》(Jeopardy!)中擊敗了人類最優(yōu)秀的選手。在2016年,Google的AlphaGo打敗了人類最頂尖的圍棋選手李世石。在星際爭霸2中,Google的AlphaStar打敗了人類的專業(yè)選手,而在Dota2比賽與人類的對戰(zhàn)中,OpenAI也取得了不俗的戰(zhàn)績。同時,IBM的Project Debater,在與人類的辯論賽中也開始嶄露頭角。甚至在人類最后的堡壘藝術(shù)方面,人工智能也取得了令人矚目的突破。2018年10月,一幅名為《愛德蒙·貝拉米的肖像》的畫作(如圖1-11所示)拍出了43.25萬美金的高價,遠超7000到1萬美元的預(yù)期。而這幅畫作,是用了1.5萬張圖片,結(jié)合生成對抗模型得到的結(jié)果。

圖1-11 人工智能畫作《愛德蒙·貝拉米的肖像》
人工智能在感知層面的應(yīng)用突飛猛進,伴隨著深度學習的發(fā)展,在各個領(lǐng)域都取得了超越人類的成績。但迄今為止,這些突破都是基于海量的訓(xùn)練數(shù)據(jù),通過強大的計算能力得到的。例如,基于Transformer的GPT-2,擁有15億參數(shù)和40GB網(wǎng)絡(luò)數(shù)據(jù)的測試集,在算法發(fā)布時的訓(xùn)練價格是每小時2048美元,使用了256塊Google TPU v3。GPT3的參數(shù)量更是達到了驚人的1750億,并使用了45GB的數(shù)據(jù)進行訓(xùn)練。
眾所周知,人工智能一共有三個代表性學派,如圖1-12所示。其中,符號學派強調(diào)模擬人的心智,連接學派強調(diào)模擬腦的結(jié)構(gòu),行為學派強調(diào)模擬人的行為。

圖1-12 人工智能代表性的三個學派
以深度學習為代表的連接學派,主要解決了感知問題,也引領(lǐng)了這一輪人工智能的發(fā)展熱潮。但是在更高層次的認知領(lǐng)域,例如自然語言理解、推理和聯(lián)想等方面,還需要符號學派的幫助。知識圖譜是符號學派的代表,可以幫助我們構(gòu)建更有學識的人工智能,從而提升機器人推理、理解、聯(lián)想等功能。而這一點,僅通過大數(shù)據(jù)和深度學習是無法做到的。多倫多大學的Geoffrey Hinton教授也提出,人工智能未來的發(fā)展方向之一就是深度神經(jīng)網(wǎng)絡(luò)與符號人工智能的深入結(jié)合。
近兩年,市場上出現(xiàn)了大量聊天機器人產(chǎn)品,提供各種各樣的功能,比如情感陪伴、個人助理、兒童教育、生活購物等。但從實際的效果來看,絕大部分產(chǎn)品只能完成簡單的問答和對話,遠未達到媒體上宣傳的效果,更不要說進行真正的思考和推理,就好像是綠野仙蹤里的鐵皮人,缺少了具有“生命感”的那顆心。同時,在對常識的理解上,人工智能系統(tǒng)的理解能力還非常稚嫩,對于人類而言非常容易的問題,如“雞蛋放到籃子里,是雞蛋大還是籃子大”以及“啤酒杯掉到地毯上會不會碎”等問題,則很難判斷。究其原因,大數(shù)據(jù)并不等于知識,人類在長期生活實踐中所積累的經(jīng)驗和知識,也無法快速傳遞給人工智能系統(tǒng)。
綜上所述,知識圖譜是實現(xiàn)通用人工智能(Artificial General Intelligence,AGI)的重要基石。在從感知到認知的跨越過程中,構(gòu)建大規(guī)模高質(zhì)量知識圖譜是一個重要環(huán)節(jié)。當人工智能可以通過更結(jié)構(gòu)化的表示理解人類知識,并進行互聯(lián)時,才有可能讓機器真正實現(xiàn)推理、聯(lián)想等認知功能。不過,對于AI擁有了全部人類知識后是否能夠形成獨立思考的能力,則需要專家學者進一步研究。
[1] http://image-net.org/challenges/LSVRC/2012/。
[2] https://deepmind.com/blog/article/wavenet-generative-model-raw-audio。
[3] https://github.com/openai/gpt-2。
[4] https://github.com/openai/gpt-3。
- Practical Internet of Things Security
- 微信公眾平臺開發(fā):從零基礎(chǔ)到ThinkPHP5高性能框架實踐
- Unity 2017 Mobile Game Development
- Java網(wǎng)絡(luò)編程核心技術(shù)詳解(視頻微課版)
- IBM Cognos Business Intelligence 10.1 Dashboarding cookbook
- Spring Boot+Vue全棧開發(fā)實戰(zhàn)
- INSTANT Yii 1.1 Application Development Starter
- Learning Splunk Web Framework
- Data Manipulation with R(Second Edition)
- HTML并不簡單:Web前端開發(fā)精進秘籍
- 基于JavaScript的WebGIS開發(fā)
- The Applied Data Science Workshop
- Python Django Web從入門到項目實戰(zhàn)(視頻版)
- C++從零開始學(視頻教學版)(第2版)
- The Java Workshop