- 人機(jī)博弈:人工智能大辯論
- 郝英好編著
- 7090字
- 2021-07-23 18:53:40
第二章 人工智能發(fā)展之路上的那些人與事
一、艾倫·麥席森·圖靈
艾倫·麥席森·圖靈是英國數(shù)學(xué)家、邏輯學(xué)家,被視為計(jì)算機(jī)科學(xué)之父、人工智能之父。圖靈1912年生于倫敦,1931年進(jìn)入劍橋大學(xué)國王學(xué)院,畢業(yè)后到美國普林斯頓大學(xué)攻讀博士學(xué)位。圖靈于1954年逝于曼徹斯特。在40多年的短暫生命里,圖靈為人類做出了重大貢獻(xiàn)。

艾倫·麥席森·圖靈
1936年,圖靈向倫敦權(quán)威的數(shù)學(xué)雜志投了一篇論文,題為“論數(shù)字計(jì)算在決斷難題中的應(yīng)用”。在這篇開創(chuàng)性的論文中,圖靈給“可計(jì)算性”下了一個嚴(yán)格的數(shù)學(xué)定義,并提出著名的“圖靈機(jī)”(Turing Machine)設(shè)想。“圖靈機(jī)”不是一種具體的機(jī)器,而是一種思想模型,可制造一種十分簡單但運(yùn)算能力極強(qiáng)的計(jì)算裝置,用來計(jì)算所有能想象得到的可計(jì)算函數(shù)。“圖靈機(jī)”與“馮·諾依曼機(jī)”齊名,被永遠(yuǎn)載入計(jì)算機(jī)的發(fā)展史中。
1950年10月,圖靈在哲學(xué)雜志Mind上發(fā)表論文《計(jì)算機(jī)與智能》,提出了著名的圖靈測試,成為劃時代之作。也正是因?yàn)檫@篇論文,圖靈被稱為“人工智能之父”。
二、馮·諾依曼
作為20世紀(jì)偉大的數(shù)學(xué)家,馮·諾依曼是以“神童”的身份為人所知的。他8歲就已經(jīng)掌握微積分,高中畢業(yè)就能熟練運(yùn)用7門語言。在學(xué)術(shù)生涯的黃金時期,馮·諾依曼是美國軍方著名智庫蘭德公司的顧問,當(dāng)時蘭德公司內(nèi)部最流行的三項(xiàng)挑戰(zhàn):第一是在“兵棋推演”游戲中擊敗馮·諾依曼,這是一項(xiàng)從沒有人實(shí)現(xiàn)的目標(biāo);第二是出一道連馮·諾依曼都回答不了的問題,這項(xiàng)挑戰(zhàn)有人做到了,就是博弈論上著名的“囚徒困境”問題;第三是觀察并學(xué)習(xí)馮·諾依曼思考問題的方式,這個幾乎全蘭德公司的研究員都做得很好。

馮·諾依曼
馮·諾依曼是曼哈頓工程的中堅(jiān)力量,他為美國軍方貢獻(xiàn)的智慧難以估量,對全人類的貢獻(xiàn)也是堪稱傳奇。我們今天使用的所有計(jì)算機(jī),幾乎都是沿用“馮·諾依曼機(jī)”的基本架構(gòu)。
作為最早宣稱機(jī)器的計(jì)算能力必定超越人類的科學(xué)家之一,馮·諾依曼力促美國軍方使用機(jī)器計(jì)算來解決“曼哈頓工程”中的海量計(jì)算問題。這篇長達(dá)101頁的科學(xué)報(bào)告就是史上著名的“101頁報(bào)告”(也稱“EDVAC方案”),刻畫出現(xiàn)代計(jì)算機(jī)的體系結(jié)構(gòu):“計(jì)算機(jī)的基礎(chǔ)組成是:存儲器、控制器、運(yùn)算器和輸入輸出設(shè)備。”
和圖靈發(fā)明的“炸彈”計(jì)算機(jī)剛誕生就遠(yuǎn)超人類一樣,馮·諾依曼研制的史上首臺存儲式計(jì)算機(jī)“MANIAC”問世不久,就在一場專門為計(jì)算機(jī)和馮·諾依曼本人量身定做的“人機(jī)對抗”中,實(shí)現(xiàn)了機(jī)器對人類的智力碾壓。“這在國防科技史上具有劃時代的意義:機(jī)器戰(zhàn)勝了五角大樓最為依賴的世界上最偉大的大腦之一。”
在馮·諾依曼未完成的遺作《計(jì)算機(jī)與人腦》中,充分展現(xiàn)出他20世紀(jì)最偉大數(shù)學(xué)家的深邃,書中的很多思想仍將在很長一段時間內(nèi)閃耀著不朽的光輝。
知識鏈接:《計(jì)算機(jī)與人腦》名言摘錄
◆ 這些系數(shù)還說明,天然元件(人腦)比自動機(jī)器優(yōu)越,是它具有更多的、卻是速度更慢的器官。而人造元件的情況卻相反,它比天然元件具有較少的、但速度更快的器官。
◆ 這就是說,大型的、有效的天然自動機(jī),以高度“并行”的線路為優(yōu)勢;大型、有效的人造自動機(jī),則并行的程度要小,以采取“串行”線路為優(yōu)勢。
◆ 神經(jīng)系統(tǒng)是這樣一臺“計(jì)算機(jī)”,它在一個相當(dāng)?shù)偷臏?zhǔn)確度水平上,進(jìn)行著非常復(fù)雜的工作。
所以,神經(jīng)系統(tǒng)所運(yùn)用的記數(shù)系統(tǒng)和我們熟知的一般的算術(shù)和數(shù)學(xué)系統(tǒng)根本不同。它不是一種準(zhǔn)確的符號系統(tǒng)……它是另外一種記數(shù)系統(tǒng),消息的意義由消息的統(tǒng)計(jì)性質(zhì)傳遞,這種方法帶來了較低的算術(shù)準(zhǔn)確度,卻得到了較高的邏輯準(zhǔn)確度。也就是說,算術(shù)上的惡化換來了邏輯上的改進(jìn)。
三、杰弗里·辛頓與反向傳播算法
20世紀(jì)70年代,BP算法的思想就已被提出,但未引起重視。1985—1986年,大衛(wèi)·魯梅爾哈特(杰弗里·辛頓的老師,1986年和詹姆斯·麥克萊倫德共同出版了《并行分布處理:認(rèn)知微結(jié)構(gòu)的探索》一書)、杰弗里·辛頓、威廉姆斯等重新推廣了BP算法,并成功用于訓(xùn)練多層感知器(MLP),解決了人工神經(jīng)元異或邏輯實(shí)現(xiàn)問題,對人工智能的發(fā)展產(chǎn)生重大影響,并成為深度學(xué)習(xí)的奠基石之一。通過推導(dǎo)人工神經(jīng)網(wǎng)絡(luò)的計(jì)算方式,反向傳播可以糾正很多深度學(xué)習(xí)模型在訓(xùn)練時產(chǎn)生的計(jì)算錯誤。曾有人舉例:幾個人站成一排,每個人依次將看到的圖像描述給下一個人,最后一個人得到的信息往往完全走樣。反向傳播的原理就是,將圖像給最后一個人看,讓他對比圖像和他得到的信息之間有多少誤差,再將誤差依次傳給前面的人,讓每個隊(duì)友分析誤差中有多少是自己的,下次描述時哪里需要改進(jìn)。由此一來,準(zhǔn)確度就能提高。這種機(jī)制極大地提高了人工神經(jīng)網(wǎng)絡(luò)的性能。因此,反向傳播算法對現(xiàn)有人工智能影響很大,以至于《麻省科技評論》在報(bào)道中直接稱:“今天的AI就是深度學(xué)習(xí),而深度學(xué)習(xí)就是建立在反向傳播機(jī)制之上的。”
然而提出反向傳播算法之后,辛頓并沒有迎來事業(yè)上的蓬勃發(fā)展。20世紀(jì)80年代末期,第二波人工神經(jīng)網(wǎng)絡(luò)熱潮帶來大量投資,然而因?yàn)?987年全球金融危機(jī)和個人計(jì)算機(jī)的發(fā)展,人工智能不再是資本關(guān)注的焦點(diǎn)。同時,當(dāng)時的計(jì)算機(jī)硬件無法滿足神經(jīng)網(wǎng)絡(luò)需要的計(jì)算量,也沒有那么多可供分析的數(shù)據(jù),辛頓的理論無法得到充分實(shí)踐。20世紀(jì)90年代中期,神經(jīng)網(wǎng)絡(luò)研究被打入冷宮,辛頓的團(tuán)隊(duì)在難以獲得贊助的情況下掙扎,辛頓被美國國防高等研究計(jì)劃署(DARPA)拒絕。幸好這時,加拿大高級研究所(CIFAR)向他拋出橄欖枝,資助了辛頓的團(tuán)隊(duì)。
辛頓事業(yè)的再次起飛是在2012年。計(jì)算機(jī)硬件的性能大幅提高,計(jì)算資源也越來越多,他的理論終于能在實(shí)踐中充分發(fā)展。他帶領(lǐng)兩個學(xué)生利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)參加了名為“ImageNet大規(guī)模視覺識別挑戰(zhàn)”的比賽,這是當(dāng)時規(guī)模最大的圖片分類識別比賽。截至2016年,ImageNet數(shù)據(jù)集中有上千萬張手工標(biāo)注的圖片,是圖像識別領(lǐng)域最重要的數(shù)據(jù)庫。比賽的其中一個內(nèi)容是,讓機(jī)器辨認(rèn)每張圖像中的狗是什么類型的,從而對100多只狗進(jìn)行分類。
在比賽中,辛頓帶著他的學(xué)生以16%的錯誤率獲勝——這個錯誤率低,甚至低于人眼識別的錯誤率18%,并且遠(yuǎn)低于前一年25%的獲勝成績。這讓人們見識了深度學(xué)習(xí)的威力。從此,深度學(xué)習(xí)一炮而紅。辛頓的一些學(xué)生也逐漸在行業(yè)內(nèi)站穩(wěn)腳步。和辛頓一起參加比賽的伊利亞·莎士科爾后來成為OpenAI的研究主管。OpenAI由埃隆·馬斯克參與創(chuàng)辦,研究如何讓人工智能改善人類生活。辛頓的另一名學(xué)生曾任Facebook AI Research的第一任主管,還有的則擔(dān)任了Uber的首席科學(xué)家。
四、維納與反饋機(jī)制
被稱為“控制論之父”的諾伯特·維納是一名神童,20歲前即取得博士學(xué)位。他于1894年11月26日生于美國密蘇里州哥倫比亞,于1964年3月18日病逝于瑞典斯德哥爾摩。他于1913年在哈佛大學(xué)獲哲學(xué)博士學(xué)位;隨后赴歐洲,在英國劍橋大學(xué)和德國哥丁根大學(xué)研究數(shù)理邏輯;于1915年返回美國,在緬因大學(xué)執(zhí)教;于1919年到馬薩諸塞州理工學(xué)院任教,于1932年升為教授,直至退休。他曾于1934—1935年到中國任清華大學(xué)客座教授。
維納在大學(xué)時期學(xué)習(xí)過生物學(xué)與哲學(xué),早年研究數(shù)理邏輯,后來轉(zhuǎn)入應(yīng)用數(shù)學(xué)領(lǐng)域,研究與隨機(jī)過程有關(guān)的勒貝格積分、廣義調(diào)和分析、復(fù)域傅里葉變換和濾波與預(yù)測理論。在第二次世界大戰(zhàn)期間,他承擔(dān)火炮自控裝置的設(shè)計(jì)工作,揭示了神經(jīng)系統(tǒng)與自控裝置的共同工作機(jī)制,把飛行軌跡的信息作為隨機(jī)過程加以處理,以進(jìn)行預(yù)測,并應(yīng)用反饋機(jī)制消除偶然因素的干擾。第二次世界大戰(zhàn)后,他綜合了控制和通信系統(tǒng)共有的特點(diǎn),把這類系統(tǒng)與動物機(jī)體、神經(jīng)系統(tǒng)、社會經(jīng)濟(jì)等加以類比,并從統(tǒng)計(jì)觀點(diǎn)出發(fā)研究了這些自控系統(tǒng)的一般規(guī)律,創(chuàng)立了控制論,從而對戰(zhàn)后自然科學(xué)的發(fā)展和自動化技術(shù)的發(fā)展產(chǎn)生了巨大影響。
1940年,維納開始考慮計(jì)算機(jī)如何能像大腦一樣工作,發(fā)現(xiàn)了二者的相似性。維納認(rèn)為計(jì)算機(jī)是一個進(jìn)行信息處理和信息轉(zhuǎn)換的系統(tǒng),只要這個系統(tǒng)能得到數(shù)據(jù),就應(yīng)該能做幾乎任何事情。他從控制論出發(fā),特別強(qiáng)調(diào)反饋的作用,認(rèn)為所有的智能活動都是反饋機(jī)制的結(jié)果,而反饋機(jī)制是可以用機(jī)器模擬的。維納的理論抓住了人工智能核心——反饋,因此可以被視為人工智能“行為主義學(xué)派”的奠基人,其對人工神經(jīng)網(wǎng)絡(luò)的研究也影響深遠(yuǎn)。
五、約翰·麥卡錫與達(dá)特茅斯會議
約翰·麥卡錫(John McCarthy),于1927年生于美國馬薩諸塞州波士頓市,于1948年獲得加州理工學(xué)院數(shù)學(xué)學(xué)士學(xué)位,于1951年獲得普林斯頓大學(xué)數(shù)學(xué)博士學(xué)位。他是首次正式提出“人工智能(Artificial Intelligence)”這一名詞的人,是LISP語言的發(fā)明者,還是達(dá)特茅斯會議的發(fā)起人,1971年圖靈獎得主。
約翰·麥卡錫與人工智能結(jié)緣要感謝馮·諾依曼。1948年9月,大數(shù)學(xué)家、計(jì)算機(jī)設(shè)計(jì)大師馮·諾依曼在加州理工學(xué)院主辦的希克森腦行為機(jī)制研討會上介紹了關(guān)于自復(fù)制自動機(jī)的論文。麥卡錫深受啟發(fā),認(rèn)為可以將機(jī)器智能與人的智能聯(lián)系起來,并計(jì)劃將其作為下一步的研究內(nèi)容。1949年,麥卡錫在普林斯頓大學(xué)數(shù)學(xué)系做博士論文時,有幸與馮·諾依曼一起工作。在馮·諾依曼的鼓勵和支持下,麥卡錫開始研究機(jī)器模擬人工智能,主要研究方向?yàn)橛?jì)算機(jī)下棋,并發(fā)明了著名的α-β搜索法,有效減少了計(jì)算量,至今仍被廣泛使用。
麥卡錫博士畢業(yè)留校工作兩年后,1953年到斯坦福大學(xué)任教,1955年去了位于美國新罕布什爾州漢諾威市的達(dá)特茅斯學(xué)院任教,1958年赴麻省理工學(xué)院任教,1962年又回到了斯坦福大學(xué)擔(dān)任計(jì)算機(jī)科學(xué)教授。1952年,麥卡錫結(jié)識了貝爾實(shí)驗(yàn)室的克勞德·艾爾伍德·香農(nóng)(Claude Elwood Shannon,美國數(shù)學(xué)家、信息論的創(chuàng)始人,香農(nóng)采樣定理的提出者)。他們在人工智能方面進(jìn)行了深入探討,并萌生召開一次研討會的想法。1955年夏天,麥卡錫到IBM打工(美國教授一般發(fā)九個月工資,其余需要申請項(xiàng)目經(jīng)費(fèi)或在暑假找一些科研工作),與他在IBM的領(lǐng)導(dǎo)納撒尼爾·羅切斯特(Nathaniel Rochester,IBM第一代通用機(jī)701的主設(shè)計(jì)師)興趣相投,決定第二年夏天在達(dá)特茅斯學(xué)院搞一次學(xué)術(shù)研討活動,并說服香農(nóng)和哈佛大學(xué)的馬文·明斯基(Marvin Minsky,人工智能與認(rèn)知學(xué)專家,1969年圖靈獎得主)一起申請洛克菲勒基金會的資助。麥卡錫的預(yù)算是13 500美元,洛克菲勒基金會只批了7500美元。但有資金支持總是好的。麥卡錫給這個第二年的活動起了個別出心裁的名字:“人工智能夏季研討會”(Summer Research Project on Artificial Intelligence)。
1956年夏天,麥卡錫、羅切斯特、香農(nóng)、明斯基、艾倫·紐厄爾(Allen Newell,計(jì)算機(jī)科學(xué)家)、赫伯特·西蒙(Herbert Simon,1975年圖靈獎得主,1978年因?yàn)椤坝邢蘩硇哉f”和“決策理論”獲得諾貝爾經(jīng)濟(jì)學(xué)獎)、奧利弗·塞弗里奇(Oliver Selfridge,機(jī)器感知之父,模式識別奠基人)等人齊聚達(dá)特茅斯學(xué)院,會議歷時兩個多月,研討主題包括自動計(jì)算機(jī)(即可編程計(jì)算機(jī))、計(jì)算機(jī)編程語言、神經(jīng)網(wǎng)絡(luò)、計(jì)算規(guī)模理論、自我改進(jìn)(即機(jī)器學(xué)習(xí))、抽象、隨機(jī)性與創(chuàng)造性等。會上首次就“人工智能”這一術(shù)語達(dá)成一致,并確立了可行的目標(biāo)和方法,這使得人工智能成為計(jì)算機(jī)科學(xué)一個獨(dú)立的重要分支,獲得了科學(xué)界的承認(rèn)。除此之外,還有四人也參加了此次會議。他們是來自IBM的亞瑟·撒米爾(Arthur Samuel)和阿列克斯·伯恩斯坦(Alex Bernstein),他們一個研究跳棋,一個研究象棋。達(dá)特茅斯學(xué)院的教授特倫查德·摩爾(Trenchard More)和機(jī)器學(xué)習(xí)的先驅(qū)、算法概率論的創(chuàng)始人雷·所羅門諾夫(Ray Solomonoff)。和其他來來往往的人不同,所羅門諾夫在達(dá)特茅斯待了整整一個暑假。他受麥卡錫“反向圖靈機(jī)”和喬姆斯基文法(艾弗拉姆·諾姆·喬姆斯基1956年提出的計(jì)算機(jī)形式文法表達(dá)分類譜系)的啟發(fā),發(fā)明了“歸納推理機(jī)”。
這次會議對后來人工智能的發(fā)展產(chǎn)生了深遠(yuǎn)影響。在此之后,人工智能的重點(diǎn)開始變?yōu)榻?shí)用的能夠自行解決問題的系統(tǒng),并要求系統(tǒng)有自學(xué)能力。
六、李飛飛與圖像識別
李飛飛于1976年出生于北京,在四川長大,16歲時隨父母移居美國新澤西州,先后攻讀普林斯頓大學(xué)物理系、加州理工學(xué)院電子工程專業(yè),獲得加州理工學(xué)院電子工程博士學(xué)位。
博士畢業(yè)后,李飛飛進(jìn)入斯坦福大學(xué)人工智能實(shí)驗(yàn)室,選擇了當(dāng)時并不被看好的研究方向——計(jì)算機(jī)視覺識別領(lǐng)域。從2007年開始,經(jīng)過兩年半的艱苦努力,并利用亞馬遜眾包平臺雇用了167個國家共計(jì)5萬人,李飛飛建成了一個后來大名鼎鼎的“ImageNet”數(shù)據(jù)集,可供計(jì)算機(jī)看圖訓(xùn)練使用。2009年時圖庫就包含了1500萬張圖片,涵蓋2萬多種物品。2009年,李飛飛團(tuán)隊(duì)發(fā)布了相關(guān)的論文和數(shù)據(jù)集。2009年年底,李飛飛在ImageNet中額外加入用算法為圖像定位的任務(wù),研究進(jìn)展取得快速突破,一口氣連發(fā)了5篇論文。
李飛飛覺得這根本不夠,她想讓更多的人知道數(shù)據(jù)集,知道圖像識別的作用。于是她奔赴歐洲找到著名的圖像識別大賽舉辦方,成功說服他們采用ImageNet。研究人員發(fā)現(xiàn)他們的算法在使用ImageNet數(shù)據(jù)集后,有了更好的表現(xiàn)效果。于是越來越多的人開始參與ImageNet大賽,當(dāng)時的科技巨頭谷歌、亞馬遜、Facebook等公司紛紛要求比賽持續(xù)辦下去。
經(jīng)過ImageNet大賽,研究者們終于意識到數(shù)據(jù)和算法同等重要,它解決了人工智能發(fā)展的許多問題,也引發(fā)了人工智能井噴式的發(fā)展,曾經(jīng)鮮為人知的人工智能開始進(jìn)入大眾的視野。而這一切的幕后推動者,正是一位年輕的華人女學(xué)者李飛飛。
李飛飛開放了ImageNet,供全世界的研究者們免費(fèi)使用。她自己則繼續(xù)待在實(shí)驗(yàn)室,將全部精力放在AI研究上。其間,她在權(quán)威計(jì)算機(jī)期刊上發(fā)表了超過100篇論文,引用量更是高達(dá)44773次。
鑒于李飛飛在AI領(lǐng)域取得的卓越成就,斯坦福大學(xué)在她33歲時授予她終身教授之職,她成為計(jì)算機(jī)系最年輕的教授。2015年,李飛飛入選“全球百大思想者”。2020年2月,李飛飛教授當(dāng)選為美國國家工程院院士。
七、神經(jīng)網(wǎng)絡(luò)的提出
神經(jīng)網(wǎng)絡(luò)是一種機(jī)器學(xué)習(xí)算法。神經(jīng)的神經(jīng)元部分是計(jì)算元件,網(wǎng)絡(luò)部分是神經(jīng)元之間的連接方式。神經(jīng)網(wǎng)絡(luò)可相互傳遞數(shù)據(jù),并隨數(shù)據(jù)傳遞實(shí)現(xiàn)更多的含義。由于網(wǎng)絡(luò)是相互連接的,因此可以更容易地處理更復(fù)雜的數(shù)據(jù)。
你可能已經(jīng)聽說過神經(jīng)網(wǎng)絡(luò),在當(dāng)今最先進(jìn)的人工智能背后,是大腦激發(fā)的人工智能工具。雖然像深度學(xué)習(xí)這樣的概念是比較新的,但它們背后的理論體系可以追溯到1943年的一個數(shù)學(xué)理論。
沃倫·麥卡洛和沃爾特·皮茨的《神經(jīng)活動內(nèi)在想法的邏輯演算》可能聽起來非常普通,但它與計(jì)算機(jī)科學(xué)一樣重要(甚至超過計(jì)算機(jī)科學(xué))。其中,《PageRank引文排名》一文,催生了谷歌的誕生。在《邏輯微積分》中,麥卡洛和皮茨描述了如何讓人造神經(jīng)元網(wǎng)絡(luò)實(shí)現(xiàn)邏輯功能。至此,AI的大門正式打開。
八、人工智能在棋類游戲領(lǐng)域超越人類
棋類游戲作為人類的一種智力游戲,備受人工智能開發(fā)者的青睞。人工智能的幾次熱潮都少不了人機(jī)對弈事件。1946年,第一臺計(jì)算機(jī)發(fā)明時,人們覺得那只是一臺能比人做算術(shù)題更快的機(jī)器。但是,當(dāng)1962年在IBM研究機(jī)器學(xué)習(xí)的研究員亞瑟·撒米爾編寫的跳棋程序戰(zhàn)勝了一位盲人跳棋高手羅伯特·尼利,引發(fā)轟動,人們才開始認(rèn)為這是人工智能。
隨著技術(shù)的不斷發(fā)展以及民眾科學(xué)水平的提高,人們發(fā)現(xiàn)計(jì)算機(jī)下棋,本質(zhì)上只不過是用窮舉或優(yōu)化搜索的方式來計(jì)算,并不是像人一樣“下棋”或者具有“智能”,于是有人提出跳棋過于簡單,在國際象棋等復(fù)雜到無法計(jì)算的項(xiàng)目上,計(jì)算機(jī)肯定是無法超越人類的。但35年之后,1997年IBM的“深藍(lán)”計(jì)算機(jī)戰(zhàn)勝了國際象棋冠軍加里·卡斯帕羅夫(Garry Kasparov)。于是又有人提出圍棋是一項(xiàng)無法窮盡搜索、需要依靠人類“大局觀”的智力運(yùn)動,是唯一計(jì)算機(jī)無法戰(zhàn)勝人類的棋類比賽。2016年,人類被快速發(fā)展的算法無情地嘲笑,從谷歌旗下DeepMind公司戴密斯·哈薩比斯團(tuán)隊(duì)開發(fā)的“阿爾法狗”(AlphaGo)與李世石對弈的4∶1,到其升級版Master與數(shù)十位人類頂尖棋手的60∶0,再到新的升級版“阿爾法元”(AlphaGo Zero)以100∶0的不敗戰(zhàn)績擊敗曾書寫歷史的“阿爾法狗”,這也成為人工智能第三次熱潮的典型事件。
九、人工智能在語言處理領(lǐng)域超越人類
人工智能在語言處理領(lǐng)域包括語音識別、機(jī)器翻譯、語言理解、語音合成等,目前已取得很大進(jìn)展,并得到廣泛應(yīng)用。例如,智能音響、文件翻譯、圖片文字識別、手機(jī)語音助手、人工智能銷售員等。
語音識別技術(shù)最早誕生于20世紀(jì)50年代的貝爾實(shí)驗(yàn)室,當(dāng)時是基于計(jì)算機(jī)系統(tǒng)開發(fā)的特定語言增強(qiáng)系統(tǒng)Audry,可識別十個英文數(shù)字單詞。在20世紀(jì)80年代末,卡耐基梅隆大學(xué)李開復(fù)主導(dǎo)研究,推出Sphinx系統(tǒng),成為第一個高性能的非特定人、大詞匯量連續(xù)語音識別系統(tǒng)。但這些系統(tǒng)都未能超越人類的語言理解和處理能力。
進(jìn)入21世紀(jì),隨著深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、長短時記憶模型、連接時序分類訓(xùn)練等技術(shù)發(fā)展和模型應(yīng)用,人工智能在語言處理領(lǐng)域開始超越人類。首先,在語音識別領(lǐng)域,2015年,在全國人機(jī)語音通訊學(xué)術(shù)會議上,百度公司分享了在人機(jī)語音交互方面的技術(shù)成果和突破,其最新研發(fā)的語音識別技術(shù),識別相對錯誤率比現(xiàn)有技術(shù)降低15%以上,使?jié)h語安靜環(huán)境普通話語音識別的識別率接近97%。語音識別詞錯率低于人類平均水平。2016年10月,微軟表示其語音識別技術(shù)的英文詞錯率已經(jīng)低至5.9%,持平人類水平。
其次,在語言理解上,人工智能也在不斷取得突破。為了提高人工智能的語言處理能力,2016年斯坦福大學(xué)推出一個閱讀理解問答數(shù)據(jù)集(Stanford Question Answering Dataset,SQuAD)。其中包含了10萬多個來自維基百科的問答對。該數(shù)據(jù)集與其他數(shù)據(jù)集相比,有很大不同:回答不是選擇題,而是問答題,或者說,不再是在幾個給定的選項(xiàng)中找答案,而是要從整段文本中去找正確答案。這就像讓人工智能做閱讀理解題,而且是問答題。2018年1月3日,微軟亞洲研究院開發(fā)的R-NET參加斯坦福閱讀理解問答數(shù)據(jù)集機(jī)器閱讀理解挑戰(zhàn)賽,在“精準(zhǔn)匹配”(Exact Match)這一項(xiàng)指標(biāo)上取得82.650的好成績,首次超越了人類水平。但隨后,斯坦福自然語言處理(NLP)團(tuán)隊(duì)于2018年6月3日對機(jī)器閱讀理解數(shù)據(jù)集進(jìn)行了更新,加大了難度,升級到SQuAD 2.0版本。相較于之前的SQuAD 1.1版本中的10萬個問答,SQuAD 2.0又新增了5萬個由人類眾包者設(shè)計(jì)的對抗性問題,而且問題在文中不一定有直接對應(yīng)的答案。人工智能暫時落后于人類。但很快,從2019年開始,平安科技的玲瓏心智能對話團(tuán)隊(duì)數(shù)次戰(zhàn)勝谷歌、科大訊飛等強(qiáng)勁對手,不斷刷新紀(jì)錄,并超越人類。2020年3月,平安科技在“精準(zhǔn)匹配”這一項(xiàng)指標(biāo)上取得90.386的好成績,超過人類86.831的水平。當(dāng)然,這一數(shù)據(jù)還在不斷被刷新。2021年2月的數(shù)據(jù)顯示,螞蟻服務(wù)智能團(tuán)隊(duì)在“精準(zhǔn)匹配”這一項(xiàng)指標(biāo)上獲得90.871的分?jǐn)?shù)。看來斯坦福NLP團(tuán)隊(duì)又該對數(shù)據(jù)集進(jìn)行升級了。
- 智能算法理論與實(shí)踐
- 深度探索:解碼DeepSeek及人工智能的未來
- 機(jī)器學(xué)習(xí)公式詳解(第2版)
- 機(jī)器視覺自動檢測技術(shù)
- 風(fēng)火少年戰(zhàn)AI:人工智能從編程到實(shí)踐
- 人工智能會搶哪些工作
- 深度學(xué)習(xí)之人臉圖像處理:核心算法與案例實(shí)戰(zhàn)
- 智能化社會:未來人們?nèi)绾紊睢⑾鄲酆退伎?/a>
- 人工的你:人工智能與心智的未來
- 圖解大模型:生成式AI原理與實(shí)戰(zhàn)
- 大數(shù)據(jù)區(qū)塊鏈金融:貴陽的實(shí)踐與思考
- 人工智能編程實(shí)踐:Python編程5級
- 人工智能
- ChatGPT漫談
- 從零開始玩轉(zhuǎn)ChatGPT