第4章 棋士為什么會輸給人工智能
- 人類的未來,AI的未來
- (日)山中伸彌 羽生善治
- 6587字
- 2022-02-17 16:20:16
我以為不可能輸
山中:人工智能的阿爾法圍棋(AlphaGo)以四勝一負(fù)的壓倒性勝利擊敗世界頂尖的圍棋選手李世石,引發(fā)了廣泛討論。
羽生:是的,那是二〇一六年三月的事。那一年的二月,在日本放送協(xié)會NHK的欄目播出的NHK紀(jì)錄片《天使或魔鬼 羽生善治 探索人工智能》探討人工智能的時候,我和在谷歌旗下的英國深度思考公司開發(fā)了阿爾法圍棋的杰米斯·哈薩比斯進(jìn)行了會談。大家都說圍棋至少十年內(nèi)趕不上人類,所以本以為是非常大的挑戰(zhàn)??峙吕钍朗约阂舱J(rèn)為“不可能輸”吧。
山中:人工智能的強(qiáng)大遠(yuǎn)遠(yuǎn)超出預(yù)期了。
羽生:是啊。將棋軟件也在以超乎想象的速度變強(qiáng)。二〇一七年四五月的電王戰(zhàn)上,將棋軟件“PONANZA”對佐藤天彥名人兩戰(zhàn)兩勝。
最近在對局轉(zhuǎn)播中,將棋軟件全部在同時解析。比方說,把當(dāng)下的局面評價為正三百分,或者負(fù)二百分等。
山中:哎喲,還能這樣啊。
羽生:我和軟件下出同一手,還被它一步步修改說“這是正解”,真是可怕的世界。
山中:比較圍棋的下法和將棋的下法,我本來以為將棋更復(fù)雜,其實圍棋要復(fù)雜得多啊。
羽生:是的。從可能性的數(shù)量上說,圍棋是十的三百六十次方,將棋是十的二百二十次方。而從軟件的發(fā)展上說,將棋與國際象棋和圍棋的歷史稍微有些不同。
山中:說到國際象棋,我在一九九〇年代中期訪問美國的時候,IBM的“深藍(lán)”計算機(jī)首次戰(zhàn)勝了世界冠軍。
羽生:一九九七年深藍(lán)擊敗了當(dāng)時的世界冠軍,俄羅斯的加爾里·卡斯帕羅夫。深藍(lán)的強(qiáng)大是由于過去的龐大數(shù)據(jù)力,以及硬件計算處理能力的組合。
當(dāng)時深藍(lán)的數(shù)據(jù)庫中已經(jīng)儲存了超過百萬局的巨量棋譜,再加上每秒鐘能夠思考兩億種可能的硬件。二十多年前,軟件還沒有那么先進(jìn),但依靠數(shù)據(jù)和硬件的力量戰(zhàn)勝了人類。
山中:就像推土機(jī)一樣靠蠻力取勝。換了圍棋,就算以今天的計算機(jī)技術(shù),組合數(shù)量也無法計算吧。阿爾法圍棋是從過去的對局識別大致的勝負(fù)模式,然后進(jìn)行對局的嗎?
羽生:阿爾法圍棋采用的技術(shù)叫作“深度學(xué)習(xí)”,讓機(jī)器通過學(xué)習(xí)來不斷變強(qiáng)。學(xué)習(xí)有兩個階段,首先用人類之間的十五萬份對局棋譜做基礎(chǔ)。利用圍棋網(wǎng)站的數(shù)據(jù)讓它學(xué)習(xí),能和職業(yè)棋手下出一樣的棋。能和職業(yè)棋手下出一樣的棋,意味著水平和職業(yè)棋手一樣了。
然后再通過機(jī)器之間的對戰(zhàn)變強(qiáng)。機(jī)器之間可以二十四小時滿負(fù)荷對戰(zhàn),以一秒一局或者十秒一局的速度積累幾十萬、幾百萬場對局?jǐn)?shù)據(jù)。以人類完全望塵莫及的速度變強(qiáng)。
阿爾法圍棋的可怕之處在于,除了有這樣的硬件和數(shù)據(jù)的力量,還有“啟發(fā)式”,也就是不一定是正確的答案,但可以通過估算來確定大體符合要求的答案。
不是找到完全正確的答案,而是通過嘗試獲得相當(dāng)接近的答案。相當(dāng)于人類的第六感,或者將棋中的大局觀那樣的方式。我認(rèn)為,阿爾法圍棋的強(qiáng)大,在于將類似人類的思維方式引入程序、獲取進(jìn)步。
將棋軟件的“加拉帕戈斯式”進(jìn)化
山中:將棋軟件與國際象棋和圍棋軟件的進(jìn)化方式是不一樣的嗎?
羽生:是啊。國際象棋和圍棋的軟件,重視硬件能力和數(shù)據(jù)量,由谷歌等大企業(yè)開發(fā)并加強(qiáng)。然而,將棋界卻沒有巨額資本投入軟件的開發(fā)。
將棋軟件中,二〇〇五年保木邦仁開發(fā)的“Bonanza”是當(dāng)時的最強(qiáng)軟件,而且開放了源代碼。獨立程序員以它為基礎(chǔ),進(jìn)行改良和修正,不斷升級。
山中:具體來說,改良和修正都是哪些工作呢?
羽生:精簡和強(qiáng)化程序中最難的是準(zhǔn)確評價局面。在評價一個局面的時候,有所謂的“評價函數(shù)”,也就是將先手與后手哪個有利進(jìn)行數(shù)值化。程序員在這里不斷切磋琢磨,進(jìn)行細(xì)致的修改,讓軟件不斷變強(qiáng)。
山中:這幾年來,將棋軟件迅速變強(qiáng),是有什么原因嗎?
羽生:是因為有GitHub這個網(wǎng)站。GitHub是軟件開發(fā)的開源社區(qū)。將棋軟件基本上都上傳到GitHub開源了,任何人都能自由使用它進(jìn)行分析和研究。
誰都可以審查源代碼,提出各種意見,“這里有點奇怪”“這里需要修改”等,而且也會不斷上傳最新版本。于是開發(fā)者看到以后也會想,“自己也開發(fā)一個將棋程序吧”。不管是專業(yè)還是業(yè)余的棋手都會用它來分析看看。結(jié)果水平就有了飛躍性的提高。
山中:這是和國際象棋還有圍棋軟件不同的地方。
羽生:之所以能做到這一點,其實也是因為銷售將棋軟件的市場早在大約十年前就消失了。軟件太強(qiáng)大了,沒人買了。沒有了市場,也就沒有了利害關(guān)系。既然如此,不如干脆開放源代碼,讓大家都能自由改進(jìn)它。
一年一度的將棋軟件大會結(jié)束后,名列前茅的若干軟件會在網(wǎng)上公開,第二年又會出現(xiàn)以它們?yōu)榛A(chǔ)的新軟件。當(dāng)年登頂?shù)能浖乱荒昃蜁涞缴窖_@樣的情況不斷出現(xiàn),真的是以驚人的速度在進(jìn)化。
山中:大家不是在決出將棋的勝負(fù),而是在決出將棋軟件的勝負(fù)了。(笑)
羽生:是啊。其實我本來認(rèn)為,論軟件而言,將棋落后國際象棋十年、十五年。國際象棋是世界上競技人數(shù)最多的,論文的數(shù)量和質(zhì)量也是相當(dāng)高的。但是要說現(xiàn)在的情況,將棋世界里的強(qiáng)大軟件都是免費的。而且還開發(fā)出共通的平臺,能夠?qū)Ρ仁褂萌舾绍浖?。甚至還有人給不會用的人編寫手冊。非常體貼。
而另一方面,在國際象棋的世界里,要把軟件全部整合到一起,非?;ㄥX。所以國際象棋的軟件沒有那么多人用。因此,這五年來,我感覺將棋軟件一口氣超越了國際象棋軟件,用起來最為方便。
山中:開發(fā)這種軟件的人,大約不是為了收益吧。
羽生:沒有收益。首先,那不是工作。不過我想,也可能是因為這樣的情況:歸根結(jié)底,如今的程序,大數(shù)據(jù)的數(shù)據(jù)力量,或者說硬件的計算資源,左右著整體的性能和功能。那么在程序員看來,不就沒地方展現(xiàn)自己的能力了嗎?(笑)程序員的比重下降了很多。在這個意義上,將棋軟件能讓人感覺到自己的價值。
山中:這樣說來,將棋軟件已經(jīng)是個人興趣的世界了。
羽生:是啊。而且我看,不同領(lǐng)域的人分享各種各樣的想法、不斷進(jìn)步,開發(fā)者們也會覺得很開心吧。至今為止,創(chuàng)造出劃時代程序的人,原本也是化學(xué)專業(yè)或者法學(xué)專業(yè)等完全不同世界的人。將那里獲得的知識和經(jīng)驗置換過來,開發(fā)軟件。我認(rèn)為,這些人才的廣泛進(jìn)入,對軟件的發(fā)展非常有益。
所以,將棋軟件也有這樣的一面,它不是依靠數(shù)據(jù)或硬件的力量,而是通過不斷提升軟件的力量變強(qiáng)大的。在這個意義上,我想可以說是實現(xiàn)了“加拉帕戈斯式的進(jìn)化”[4]。
僅以電腦做練習(xí)對手的世代
山中:但是,不管怎么說,首先還是要看基礎(chǔ)數(shù)據(jù)庫的規(guī)模。
羽生:是的。醫(yī)學(xué)世界固然具有巨量的歷史數(shù)據(jù),而在將棋世界,數(shù)據(jù)庫里最多也就是十萬局棋譜。十萬局這個數(shù)量,作為數(shù)據(jù)來說,價值并不是很高。
山中:十萬局還不夠?
羽生:是的。打個比方,國際象棋的數(shù)據(jù)庫,目前有八百萬局以上的記錄。基于如此龐大的數(shù)據(jù),按照概率來選擇下法,電腦至少不會在序盤落下風(fēng)。
山中:是嗎?不能把國際象棋和圍棋軟件應(yīng)用到將棋上嗎?
羽生:有的適合AI,有的不適合。比如圍棋軟件有“蒙特卡羅法”,就是先計算到棋局的最后,通過統(tǒng)計來判斷是不是好棋的方法。但在將棋的情況中,有時候一百步就結(jié)束了,有時候兩百步才結(jié)束,這種不適合計算到最后。
而在另一方面,將棋軟件的預(yù)讀、探索部分,主要用的是國際象棋的開源程序“Stockfish”。以前人們說“將棋軟件沒有通用性”,認(rèn)為不可能把其他種類的軟件應(yīng)用過來,或者反過來應(yīng)用到其他種類中去。但是這個Stockfish超越了種類的障礙,橫向發(fā)揮出軟件的功能。
山中:將棋界也受到了AI的影響。如果把AI應(yīng)用在將棋的研究中,專業(yè)人士是不是也會有自尊心,認(rèn)為“身為專業(yè)棋手,怎么能依靠機(jī)器”?
羽生:我想是有的。
山中:即使知道AI很優(yōu)秀,但還是會有棋手拒絕它吧。
羽生:遇到那樣的東西,因為自尊心的敏感而不采用它,也是一種態(tài)度。不過AI確實是很有用的工具,就像是計算的時候可以選擇要不要用計算器一樣。所以在必須自己思考的時候自己思考,而把很基礎(chǔ)的、沒有必要思考的地方交給AI,也未嘗不可。
這一兩年來,將棋軟件已經(jīng)非常強(qiáng)大了,特別是年輕人利用將棋軟件進(jìn)行分析已是普遍趨勢。所以我想,今后的孩子們會把那樣的東西作為工具,變得更強(qiáng)吧。
山中:和科學(xué)的世界一樣,將棋世界的變化也很劇烈,也必須跟上那樣的變化啊。
羽生:只是伴隨技術(shù)的發(fā)展,這種事情也是一次又一次上演。最早是在出現(xiàn)棋譜數(shù)據(jù)庫的時候。怎么更好地使用數(shù)據(jù)庫,成為擺在棋手們面前的課題。然后是互聯(lián)網(wǎng)的出現(xiàn),大家都開始用互聯(lián)網(wǎng)練習(xí)了。以前如果住得比較偏僻,就很難找到對局的對手,而有了網(wǎng)絡(luò),不管在哪里都能下棋。城市和農(nóng)村的地理障礙從此消失,很多人年紀(jì)輕輕就有了豐富的對局經(jīng)驗。而現(xiàn)在則是有了軟件或者說程序,如何有效使用這種程序,成為接下來特別是年輕一代所必備的能力之一。今后將會出現(xiàn)僅以軟件做對手進(jìn)行練習(xí)的強(qiáng)大的一代人吧。
為什么研究者傾向于隱瞞
山中:將棋軟件是以開源為基礎(chǔ),齊心協(xié)力,最大限度發(fā)揮網(wǎng)絡(luò)社會的優(yōu)勢,促使其不斷進(jìn)化。但是,我所在的生命科學(xué)的世界,研究競爭非常激烈,感覺大家都傾向于隱瞞自己的研究,直到發(fā)表論文的時候才公之于眾。
羽生:前沿科學(xué)的世界,有點令人意外啊。
山中:沒錯。發(fā)表論文的過程,首先是將自己的論文發(fā)送到《自然》或者《科學(xué)》雜志的編輯部,然后由幾個在做同樣研究的研究者,基本上在匿名的情況下進(jìn)行審閱,這叫作“同行評審”。再根據(jù)他們的意見,比如“這里最好做些調(diào)整”,進(jìn)行修改。
羽生:經(jīng)過各種過程才能刊登。
山中:最糟糕的情況是被拒,“這項研究毫無價值”。這種情況相當(dāng)多。最好的結(jié)果是,“這項研究很精彩,我們立刻刊登”,然后一個月之后就登了。這種事情偶爾也會有,但是很少。大部分情況是給出意見退回,“這里有問題,請追加實驗”“這里和這里請修改”,于是花費幾個月時間追加實驗,再發(fā)回去。然后又被退回來說,“這次請改善這個地方”。有時候需要一兩年。所以生命科學(xué)的領(lǐng)域中,現(xiàn)在在做的研究,最早也要等兩三年才能問世。
羽生:時間相當(dāng)滯后啊。
山中:相當(dāng)滯后??茖W(xué)技術(shù)日新月異,數(shù)據(jù)很快就能拿到。而且是巨量數(shù)據(jù)。但是無處發(fā)表,只能一直抱在手上,這已經(jīng)成為現(xiàn)在的大問題了。
越來越多的人認(rèn)為,生命科學(xué)也應(yīng)該改變發(fā)表的方法了,現(xiàn)在需要實時問世的機(jī)制,但一直沒能取得什么進(jìn)展。畢竟,過去一百多年來,我們的研究目標(biāo)都是這樣發(fā)表論文。
羽生:這種研究習(xí)慣也是很頑固的。
山中:是的。很難改變這種習(xí)慣。發(fā)表論文就是我們的生命。如果由研究領(lǐng)域接近的幾位研究者進(jìn)行評分,那么得分必然會被自己和他們的關(guān)系好壞所左右。這就很難說公平。
一切都“實時”的時代
羽生:我最近聽說了一個很有趣的消息,說的是康奈爾大學(xué)的數(shù)字化收藏項目“arXiv”。那是將物理、數(shù)學(xué)、計算機(jī)等領(lǐng)域的研究論文預(yù)印本進(jìn)行電子數(shù)據(jù)化存檔和公開的電子檔案服務(wù)。
如果從研究到發(fā)表需要一定時間,人們就很難知道其他研究者正在研究什么。但是去看arXiv就會知道目前人們在做哪些最新的研究,因為上面刊載了審查前的論文。也有許多研究者在那上面做驗證。
山中:在很久以前,物理學(xué)和數(shù)學(xué)領(lǐng)域就有那樣的實時發(fā)表渠道。發(fā)表論文是最后補(bǔ)足的完成形態(tài)。在學(xué)會或網(wǎng)絡(luò)上的發(fā)表,也會不斷給出數(shù)據(jù),同時接受實時的批評。如果有錯誤,自然會有人發(fā)現(xiàn)。許多學(xué)術(shù)領(lǐng)域都是這樣的情況。
但是生命科學(xué)的傳統(tǒng)是隱瞞,直到論文發(fā)表為止。在學(xué)術(shù)研討會上發(fā)表的時候,也要把重要的地方隱藏起來。一直都是這樣的風(fēng)格。比如基因分析,如果發(fā)現(xiàn)某個序列與某種疾病有關(guān),當(dāng)然會寫成論文。但與之同等重要的信息是,這個序列與疾病有關(guān),但那個序列與疾病無關(guān)。
羽生:是的。
山中:但是按照目前生命科學(xué)的發(fā)表方式,這樣的信息基本上不會公布,結(jié)果造成研究資源的浪費。
羽生:很可能會出現(xiàn)這樣的情況:重復(fù)做了同樣的研究,或者其他研究室已經(jīng)得出結(jié)論了——
山中:這種情況我覺得很多。數(shù)據(jù)越多越準(zhǔn)確,錯誤也會越少。但是與其他共享大數(shù)據(jù)的領(lǐng)域相比起來,生命科學(xué)領(lǐng)域沒有進(jìn)步,研究發(fā)展面臨巨大的障礙。
創(chuàng)立Facebook的馬克·扎克伯格,他的妻子是兒科醫(yī)生,所以他給科學(xué)研究捐了很多錢。二〇一六年,一個家庭就投入了三十億美元,啟動了一項消除疾病的研究項目。他們試圖將生命科學(xué)的發(fā)表方式改變成剛才提到的arXiv那樣的開放形態(tài)。這項計劃也得到了許多捐贈。
羽生:科學(xué)論文網(wǎng)站的訂閱費很高,所以很多機(jī)構(gòu)都不得不停止訂閱,這也是問題啊。大學(xué)生不滿這樣的情況,通過電腦技術(shù),免費公開幾十萬份科學(xué)論文,結(jié)果又會受到論文期刊方的投訴。
山中:論文和期刊原本應(yīng)該是為了推動研究的發(fā)展,現(xiàn)在有些地方卻反而變成了阻礙。
羽生:其他領(lǐng)域也可能有這種情況,但因為這是伴隨研究產(chǎn)生的權(quán)利,或者與專利有關(guān),所以也不可能一切都保持自由和開放。
山中:確實如此。研究中也會產(chǎn)生專利,該保護(hù)的地方確實也應(yīng)該保護(hù)。
提倡專利降價的原因
羽生:關(guān)于專利,我也想請教一下。美國有“專利流氓”的問題,就是有人從他人手中購買收集專利,等到有人侵犯了那些專利,就去索取巨額賠償金或者許可費。生命科學(xué)的世界里也有這種情況嗎?
山中:有的,有的。有些公司很喜歡這么干。所以我們申請專利,有時候并不是為了獲得利益,而是為了防護(hù)。
羽生:原來如此。
山中:iPS細(xì)胞是很基礎(chǔ)的技術(shù)。以它為平臺,可以開發(fā)出各種應(yīng)用。所以我們雖然開發(fā)出iPS細(xì)胞,但希望能有更多的人使用這項技術(shù),盡可能不做任何限制。
但正如您說的那樣,除了我們的專利之外,也有公司基于營利目的申請專利。如果那些專利申請成功,哪怕只是部分內(nèi)容,iPS細(xì)胞技術(shù)也會很難使用。
專利本來是為了保護(hù)企業(yè)能夠獨占技術(shù)開發(fā)的利益而建立的制度,但在我們看來,作用卻完全搞反了。京都大學(xué)這樣的公立機(jī)構(gòu)取得專利,設(shè)置合理的許可費,通過這樣的做法,避免某個企業(yè)通過專利獨占技術(shù),確保各個研究機(jī)構(gòu)能夠更加廣泛和自由地使用iPS。所以雖然都是申請專利,意義完全不同。實際上,我們在二〇一七年,曾經(jīng)要求富士膠片降低細(xì)胞開發(fā)和制造的專利許可費。
羽生:與其讓企業(yè)持有專利,還是大學(xué)持有專利更具公益性啊。
山中:大學(xué)持有專利非常重要。因為企業(yè)是以收益為目的的。企業(yè)新開發(fā)的藥物和醫(yī)療手段,成本非常高,甚至有患者會為此花費掉一億日元。這是全球性威脅。
羽生:企業(yè)股東追求利潤,這也是理所當(dāng)然的。
山中:是啊。無論如何,各項應(yīng)用如果不能提高收益,就肯定無法發(fā)展。但是歸根結(jié)底,我們還是希望基礎(chǔ)的技術(shù)能得到更廣泛的使用,就像操作系統(tǒng)一樣。以前微軟不斷公開操作系統(tǒng),蘋果就很封閉。雖然很難說哪種做法更好,但是目前基本上,基礎(chǔ)部分的公開已經(jīng)成為世界性的潮流。生命科學(xué)的領(lǐng)域也是,根本性的技術(shù)盡可能不要封閉,我認(rèn)為這對于推動研究來說非常重要。
人會揣測,因而會犯錯
羽生:不過,不同國家的專利申請方式并不相同,非常復(fù)雜。
山中:是的。當(dāng)年只有美國采用“發(fā)明優(yōu)先原則”的方法。其他國家,包括日本和歐洲,都是“申請優(yōu)先原則”。
羽生:意思是先申請者優(yōu)先?
山中:這是重視申請者權(quán)利的原則。提出申請的日期有具體的公開記錄,清清楚楚。但在美國,即使申請以后,一旦有人提出不同的主張,說“不,實際上是我更早想到的”,也有可能被承認(rèn)。要應(yīng)對這樣的主張,唯一的方法就是留下詳細(xì)筆記,記錄創(chuàng)意和想法是何時誕生的。而且不能只有自己寫,因為可能是事后補(bǔ)的,所以需要第三者定期簽名。這樣的筆記驗證我也做過,用來應(yīng)對美國的發(fā)明優(yōu)先原則。
羽生:那要花費很多工夫吧。
山中:是的。不過在奧巴馬總統(tǒng)任職期間,美國也改成了申請優(yōu)先原則,和其他國家保持一致了。從這個意義上說,如今倒是不再需要筆記驗證。不過我們?yōu)榱朔乐狗欠ㄑ芯浚€是在繼續(xù)驗證筆記。
羽生:記錄也很重要。
山中:是的。規(guī)則雖然都一樣了,但是做審查的還是人。美國的專利局、日本的專利局,都是由審查團(tuán)來做審查。特別是美國,針對某項專利申請,通常是一個人審查決定。
羽生:這樣的嗎?
山中:所以那個審查人的想法會對結(jié)果產(chǎn)生很大的影響。如果能保持公平裁決當(dāng)然很好,但在我們看來,有的裁決還是不太合理的。不知道是不是他們的國策,總之有些地方過于考慮自己國家的利益。
羽生:論文審查也是同樣的問題。不像網(wǎng)球,如果對判決不服,可以“鷹眼挑戰(zhàn)”[5]。(笑)
山中:如今球賽的規(guī)則非常清晰。以前的美學(xué)觀念是,就算裁判做了完全錯誤的判罰,也必須遵守。現(xiàn)在幾乎所有的球類比賽都有錄像記錄,挑戰(zhàn)發(fā)現(xiàn)判罰錯誤的時候,判罰會被推翻。在這一點上,拳擊、花樣滑冰、體操等需要評分的競技項目,很難做到客觀判斷。由人類來做的工作,怎么都——
羽生:法院審判也是這樣。需要得出現(xiàn)實結(jié)論的時候,常常會擔(dān)心人類做的判斷難免帶有偏見,或者代表某種利害關(guān)系。這本身雖然說不上是揣測,但畢竟存在這樣的可能。
山中:所以,專利的裁定、論文審查、評分競技,最好不要由人來做,而是讓公平公正的AI來做。(笑)
- 重建現(xiàn)代兒童福利制度:中國兒童福利政策報告(2014)
- 英國人:國家的形成,1707-1837
- 人生之鑒
- 從零開始的女性主義
- 孝道之網(wǎng):客家孝道的歷史人類學(xué)研究
- 自殺?他殺?青少年為何走上絕路?
- 當(dāng)代美國華人政治參與研究:1965—2012
- 中國少數(shù)民族古籍文獻(xiàn)整理研究
- 環(huán)境·經(jīng)濟(jì)·社會:近代徐州城市社會變遷研究:1882~1948
- 首都人口、就業(yè)與可持續(xù)發(fā)展
- 英國下層階級的憤怒
- 湖北省殘疾人事業(yè)發(fā)展重要文獻(xiàn)選編(1989—2019)(下冊)
- 超單身社會
- 人口流動與社會融合:理論、指標(biāo)與方法
- 中國老年人居住模式之變遷