官术网_书友最值得收藏!

第4章 棋士為什么會輸給人工智能

我以為不可能輸

山中:人工智能的阿爾法圍棋(AlphaGo)以四勝一負的壓倒性勝利擊敗世界頂尖的圍棋選手李世石,引發了廣泛討論。

羽生:是的,那是二〇一六年三月的事。那一年的二月,在日本放送協會NHK的欄目播出的NHK紀錄片《天使或魔鬼 羽生善治 探索人工智能》探討人工智能的時候,我和在谷歌旗下的英國深度思考公司開發了阿爾法圍棋的杰米斯·哈薩比斯進行了會談。大家都說圍棋至少十年內趕不上人類,所以本以為是非常大的挑戰。恐怕李世石自己也認為“不可能輸”吧。

山中:人工智能的強大遠遠超出預期了。

羽生:是啊。將棋軟件也在以超乎想象的速度變強。二〇一七年四五月的電王戰上,將棋軟件“PONANZA”對佐藤天彥名人兩戰兩勝。

最近在對局轉播中,將棋軟件全部在同時解析。比方說,把當下的局面評價為正三百分,或者負二百分等。

山中:哎喲,還能這樣啊。

羽生:我和軟件下出同一手,還被它一步步修改說“這是正解”,真是可怕的世界。

山中:比較圍棋的下法和將棋的下法,我本來以為將棋更復雜,其實圍棋要復雜得多啊。

羽生:是的。從可能性的數量上說,圍棋是十的三百六十次方,將棋是十的二百二十次方。而從軟件的發展上說,將棋與國際象棋和圍棋的歷史稍微有些不同。

山中:說到國際象棋,我在一九九〇年代中期訪問美國的時候,IBM的“深藍”計算機首次戰勝了世界冠軍。

羽生:一九九七年深藍擊敗了當時的世界冠軍,俄羅斯的加爾里·卡斯帕羅夫。深藍的強大是由于過去的龐大數據力,以及硬件計算處理能力的組合。

當時深藍的數據庫中已經儲存了超過百萬局的巨量棋譜,再加上每秒鐘能夠思考兩億種可能的硬件。二十多年前,軟件還沒有那么先進,但依靠數據和硬件的力量戰勝了人類。

山中:就像推土機一樣靠蠻力取勝。換了圍棋,就算以今天的計算機技術,組合數量也無法計算吧。阿爾法圍棋是從過去的對局識別大致的勝負模式,然后進行對局的嗎?

羽生:阿爾法圍棋采用的技術叫作“深度學習”,讓機器通過學習來不斷變強。學習有兩個階段,首先用人類之間的十五萬份對局棋譜做基礎。利用圍棋網站的數據讓它學習,能和職業棋手下出一樣的棋。能和職業棋手下出一樣的棋,意味著水平和職業棋手一樣了。

然后再通過機器之間的對戰變強。機器之間可以二十四小時滿負荷對戰,以一秒一局或者十秒一局的速度積累幾十萬、幾百萬場對局數據。以人類完全望塵莫及的速度變強。

阿爾法圍棋的可怕之處在于,除了有這樣的硬件和數據的力量,還有“啟發式”,也就是不一定是正確的答案,但可以通過估算來確定大體符合要求的答案。

不是找到完全正確的答案,而是通過嘗試獲得相當接近的答案。相當于人類的第六感,或者將棋中的大局觀那樣的方式。我認為,阿爾法圍棋的強大,在于將類似人類的思維方式引入程序、獲取進步。

將棋軟件的“加拉帕戈斯式”進化

山中:將棋軟件與國際象棋和圍棋軟件的進化方式是不一樣的嗎?

羽生:是啊。國際象棋和圍棋的軟件,重視硬件能力和數據量,由谷歌等大企業開發并加強。然而,將棋界卻沒有巨額資本投入軟件的開發。

將棋軟件中,二〇〇五年保木邦仁開發的“Bonanza”是當時的最強軟件,而且開放了源代碼。獨立程序員以它為基礎,進行改良和修正,不斷升級。

山中:具體來說,改良和修正都是哪些工作呢?

羽生:精簡和強化程序中最難的是準確評價局面。在評價一個局面的時候,有所謂的“評價函數”,也就是將先手與后手哪個有利進行數值化。程序員在這里不斷切磋琢磨,進行細致的修改,讓軟件不斷變強。

山中:這幾年來,將棋軟件迅速變強,是有什么原因嗎?

羽生:是因為有GitHub這個網站。GitHub是軟件開發的開源社區。將棋軟件基本上都上傳到GitHub開源了,任何人都能自由使用它進行分析和研究。

誰都可以審查源代碼,提出各種意見,“這里有點奇怪”“這里需要修改”等,而且也會不斷上傳最新版本。于是開發者看到以后也會想,“自己也開發一個將棋程序吧”。不管是專業還是業余的棋手都會用它來分析看看。結果水平就有了飛躍性的提高。

山中:這是和國際象棋還有圍棋軟件不同的地方。

羽生:之所以能做到這一點,其實也是因為銷售將棋軟件的市場早在大約十年前就消失了。軟件太強大了,沒人買了。沒有了市場,也就沒有了利害關系。既然如此,不如干脆開放源代碼,讓大家都能自由改進它。

一年一度的將棋軟件大會結束后,名列前茅的若干軟件會在網上公開,第二年又會出現以它們為基礎的新軟件。當年登頂的軟件,下一年就會落到山腰。這樣的情況不斷出現,真的是以驚人的速度在進化。

山中:大家不是在決出將棋的勝負,而是在決出將棋軟件的勝負了。(笑)

羽生:是啊。其實我本來認為,論軟件而言,將棋落后國際象棋十年、十五年。國際象棋是世界上競技人數最多的,論文的數量和質量也是相當高的。但是要說現在的情況,將棋世界里的強大軟件都是免費的。而且還開發出共通的平臺,能夠對比使用若干軟件。甚至還有人給不會用的人編寫手冊。非常體貼。

而另一方面,在國際象棋的世界里,要把軟件全部整合到一起,非常花錢。所以國際象棋的軟件沒有那么多人用。因此,這五年來,我感覺將棋軟件一口氣超越了國際象棋軟件,用起來最為方便。

山中:開發這種軟件的人,大約不是為了收益吧。

羽生:沒有收益。首先,那不是工作。不過我想,也可能是因為這樣的情況:歸根結底,如今的程序,大數據的數據力量,或者說硬件的計算資源,左右著整體的性能和功能。那么在程序員看來,不就沒地方展現自己的能力了嗎?(笑)程序員的比重下降了很多。在這個意義上,將棋軟件能讓人感覺到自己的價值。

山中:這樣說來,將棋軟件已經是個人興趣的世界了。

羽生:是啊。而且我看,不同領域的人分享各種各樣的想法、不斷進步,開發者們也會覺得很開心吧。至今為止,創造出劃時代程序的人,原本也是化學專業或者法學專業等完全不同世界的人。將那里獲得的知識和經驗置換過來,開發軟件。我認為,這些人才的廣泛進入,對軟件的發展非常有益。

所以,將棋軟件也有這樣的一面,它不是依靠數據或硬件的力量,而是通過不斷提升軟件的力量變強大的。在這個意義上,我想可以說是實現了“加拉帕戈斯式的進化”[4]。

僅以電腦做練習對手的世代

山中:但是,不管怎么說,首先還是要看基礎數據庫的規模。

羽生:是的。醫學世界固然具有巨量的歷史數據,而在將棋世界,數據庫里最多也就是十萬局棋譜。十萬局這個數量,作為數據來說,價值并不是很高。

山中:十萬局還不夠?

羽生:是的。打個比方,國際象棋的數據庫,目前有八百萬局以上的記錄。基于如此龐大的數據,按照概率來選擇下法,電腦至少不會在序盤落下風。

山中:是嗎?不能把國際象棋和圍棋軟件應用到將棋上嗎?

羽生:有的適合AI,有的不適合。比如圍棋軟件有“蒙特卡羅法”,就是先計算到棋局的最后,通過統計來判斷是不是好棋的方法。但在將棋的情況中,有時候一百步就結束了,有時候兩百步才結束,這種不適合計算到最后。

而在另一方面,將棋軟件的預讀、探索部分,主要用的是國際象棋的開源程序“Stockfish”。以前人們說“將棋軟件沒有通用性”,認為不可能把其他種類的軟件應用過來,或者反過來應用到其他種類中去。但是這個Stockfish超越了種類的障礙,橫向發揮出軟件的功能。

山中:將棋界也受到了AI的影響。如果把AI應用在將棋的研究中,專業人士是不是也會有自尊心,認為“身為專業棋手,怎么能依靠機器”?

羽生:我想是有的。

山中:即使知道AI很優秀,但還是會有棋手拒絕它吧。

羽生:遇到那樣的東西,因為自尊心的敏感而不采用它,也是一種態度。不過AI確實是很有用的工具,就像是計算的時候可以選擇要不要用計算器一樣。所以在必須自己思考的時候自己思考,而把很基礎的、沒有必要思考的地方交給AI,也未嘗不可。

這一兩年來,將棋軟件已經非常強大了,特別是年輕人利用將棋軟件進行分析已是普遍趨勢。所以我想,今后的孩子們會把那樣的東西作為工具,變得更強吧。

山中:和科學的世界一樣,將棋世界的變化也很劇烈,也必須跟上那樣的變化啊。

羽生:只是伴隨技術的發展,這種事情也是一次又一次上演。最早是在出現棋譜數據庫的時候。怎么更好地使用數據庫,成為擺在棋手們面前的課題。然后是互聯網的出現,大家都開始用互聯網練習了。以前如果住得比較偏僻,就很難找到對局的對手,而有了網絡,不管在哪里都能下棋。城市和農村的地理障礙從此消失,很多人年紀輕輕就有了豐富的對局經驗。而現在則是有了軟件或者說程序,如何有效使用這種程序,成為接下來特別是年輕一代所必備的能力之一。今后將會出現僅以軟件做對手進行練習的強大的一代人吧。

為什么研究者傾向于隱瞞

山中:將棋軟件是以開源為基礎,齊心協力,最大限度發揮網絡社會的優勢,促使其不斷進化。但是,我所在的生命科學的世界,研究競爭非常激烈,感覺大家都傾向于隱瞞自己的研究,直到發表論文的時候才公之于眾。

羽生:前沿科學的世界,有點令人意外啊。

山中:沒錯。發表論文的過程,首先是將自己的論文發送到《自然》或者《科學》雜志的編輯部,然后由幾個在做同樣研究的研究者,基本上在匿名的情況下進行審閱,這叫作“同行評審”。再根據他們的意見,比如“這里最好做些調整”,進行修改。

羽生:經過各種過程才能刊登。

山中:最糟糕的情況是被拒,“這項研究毫無價值”。這種情況相當多。最好的結果是,“這項研究很精彩,我們立刻刊登”,然后一個月之后就登了。這種事情偶爾也會有,但是很少。大部分情況是給出意見退回,“這里有問題,請追加實驗”“這里和這里請修改”,于是花費幾個月時間追加實驗,再發回去。然后又被退回來說,“這次請改善這個地方”。有時候需要一兩年。所以生命科學的領域中,現在在做的研究,最早也要等兩三年才能問世。

羽生:時間相當滯后啊。

山中:相當滯后。科學技術日新月異,數據很快就能拿到。而且是巨量數據。但是無處發表,只能一直抱在手上,這已經成為現在的大問題了。

越來越多的人認為,生命科學也應該改變發表的方法了,現在需要實時問世的機制,但一直沒能取得什么進展。畢竟,過去一百多年來,我們的研究目標都是這樣發表論文。

羽生:這種研究習慣也是很頑固的。

山中:是的。很難改變這種習慣。發表論文就是我們的生命。如果由研究領域接近的幾位研究者進行評分,那么得分必然會被自己和他們的關系好壞所左右。這就很難說公平。

一切都“實時”的時代

羽生:我最近聽說了一個很有趣的消息,說的是康奈爾大學的數字化收藏項目“arXiv”。那是將物理、數學、計算機等領域的研究論文預印本進行電子數據化存檔和公開的電子檔案服務。

如果從研究到發表需要一定時間,人們就很難知道其他研究者正在研究什么。但是去看arXiv就會知道目前人們在做哪些最新的研究,因為上面刊載了審查前的論文。也有許多研究者在那上面做驗證。

山中:在很久以前,物理學和數學領域就有那樣的實時發表渠道。發表論文是最后補足的完成形態。在學會或網絡上的發表,也會不斷給出數據,同時接受實時的批評。如果有錯誤,自然會有人發現。許多學術領域都是這樣的情況。

但是生命科學的傳統是隱瞞,直到論文發表為止。在學術研討會上發表的時候,也要把重要的地方隱藏起來。一直都是這樣的風格。比如基因分析,如果發現某個序列與某種疾病有關,當然會寫成論文。但與之同等重要的信息是,這個序列與疾病有關,但那個序列與疾病無關。

羽生:是的。

山中:但是按照目前生命科學的發表方式,這樣的信息基本上不會公布,結果造成研究資源的浪費。

羽生:很可能會出現這樣的情況:重復做了同樣的研究,或者其他研究室已經得出結論了——

山中:這種情況我覺得很多。數據越多越準確,錯誤也會越少。但是與其他共享大數據的領域相比起來,生命科學領域沒有進步,研究發展面臨巨大的障礙。

創立Facebook的馬克·扎克伯格,他的妻子是兒科醫生,所以他給科學研究捐了很多錢。二〇一六年,一個家庭就投入了三十億美元,啟動了一項消除疾病的研究項目。他們試圖將生命科學的發表方式改變成剛才提到的arXiv那樣的開放形態。這項計劃也得到了許多捐贈。

羽生:科學論文網站的訂閱費很高,所以很多機構都不得不停止訂閱,這也是問題啊。大學生不滿這樣的情況,通過電腦技術,免費公開幾十萬份科學論文,結果又會受到論文期刊方的投訴。

山中:論文和期刊原本應該是為了推動研究的發展,現在有些地方卻反而變成了阻礙。

羽生:其他領域也可能有這種情況,但因為這是伴隨研究產生的權利,或者與專利有關,所以也不可能一切都保持自由和開放。

山中:確實如此。研究中也會產生專利,該保護的地方確實也應該保護。

提倡專利降價的原因

羽生:關于專利,我也想請教一下。美國有“專利流氓”的問題,就是有人從他人手中購買收集專利,等到有人侵犯了那些專利,就去索取巨額賠償金或者許可費。生命科學的世界里也有這種情況嗎?

山中:有的,有的。有些公司很喜歡這么干。所以我們申請專利,有時候并不是為了獲得利益,而是為了防護。

羽生:原來如此。

山中:iPS細胞是很基礎的技術。以它為平臺,可以開發出各種應用。所以我們雖然開發出iPS細胞,但希望能有更多的人使用這項技術,盡可能不做任何限制。

但正如您說的那樣,除了我們的專利之外,也有公司基于營利目的申請專利。如果那些專利申請成功,哪怕只是部分內容,iPS細胞技術也會很難使用。

專利本來是為了保護企業能夠獨占技術開發的利益而建立的制度,但在我們看來,作用卻完全搞反了。京都大學這樣的公立機構取得專利,設置合理的許可費,通過這樣的做法,避免某個企業通過專利獨占技術,確保各個研究機構能夠更加廣泛和自由地使用iPS。所以雖然都是申請專利,意義完全不同。實際上,我們在二〇一七年,曾經要求富士膠片降低細胞開發和制造的專利許可費。

羽生:與其讓企業持有專利,還是大學持有專利更具公益性啊。

山中:大學持有專利非常重要。因為企業是以收益為目的的。企業新開發的藥物和醫療手段,成本非常高,甚至有患者會為此花費掉一億日元。這是全球性威脅。

羽生:企業股東追求利潤,這也是理所當然的。

山中:是啊。無論如何,各項應用如果不能提高收益,就肯定無法發展。但是歸根結底,我們還是希望基礎的技術能得到更廣泛的使用,就像操作系統一樣。以前微軟不斷公開操作系統,蘋果就很封閉。雖然很難說哪種做法更好,但是目前基本上,基礎部分的公開已經成為世界性的潮流。生命科學的領域也是,根本性的技術盡可能不要封閉,我認為這對于推動研究來說非常重要。

人會揣測,因而會犯錯

羽生:不過,不同國家的專利申請方式并不相同,非常復雜。

山中:是的。當年只有美國采用“發明優先原則”的方法。其他國家,包括日本和歐洲,都是“申請優先原則”。

羽生:意思是先申請者優先?

山中:這是重視申請者權利的原則。提出申請的日期有具體的公開記錄,清清楚楚。但在美國,即使申請以后,一旦有人提出不同的主張,說“不,實際上是我更早想到的”,也有可能被承認。要應對這樣的主張,唯一的方法就是留下詳細筆記,記錄創意和想法是何時誕生的。而且不能只有自己寫,因為可能是事后補的,所以需要第三者定期簽名。這樣的筆記驗證我也做過,用來應對美國的發明優先原則。

羽生:那要花費很多工夫吧。

山中:是的。不過在奧巴馬總統任職期間,美國也改成了申請優先原則,和其他國家保持一致了。從這個意義上說,如今倒是不再需要筆記驗證。不過我們為了防止非法研究,還是在繼續驗證筆記。

羽生:記錄也很重要。

山中:是的。規則雖然都一樣了,但是做審查的還是人。美國的專利局、日本的專利局,都是由審查團來做審查。特別是美國,針對某項專利申請,通常是一個人審查決定。

羽生:這樣的嗎?

山中:所以那個審查人的想法會對結果產生很大的影響。如果能保持公平裁決當然很好,但在我們看來,有的裁決還是不太合理的。不知道是不是他們的國策,總之有些地方過于考慮自己國家的利益。

羽生:論文審查也是同樣的問題。不像網球,如果對判決不服,可以“鷹眼挑戰”[5]。(笑)

山中:如今球賽的規則非常清晰。以前的美學觀念是,就算裁判做了完全錯誤的判罰,也必須遵守。現在幾乎所有的球類比賽都有錄像記錄,挑戰發現判罰錯誤的時候,判罰會被推翻。在這一點上,拳擊、花樣滑冰、體操等需要評分的競技項目,很難做到客觀判斷。由人類來做的工作,怎么都——

羽生:法院審判也是這樣。需要得出現實結論的時候,常常會擔心人類做的判斷難免帶有偏見,或者代表某種利害關系。這本身雖然說不上是揣測,但畢竟存在這樣的可能。

山中:所以,專利的裁定、論文審查、評分競技,最好不要由人來做,而是讓公平公正的AI來做。(笑)

主站蜘蛛池模板: 阜阳市| 沁水县| 达孜县| 肥东县| 平凉市| 金平| 都江堰市| 巴马| 张家界市| 平邑县| 阿拉善右旗| 杨浦区| 安国市| 夹江县| 津市市| 呼伦贝尔市| 宁陕县| 扶沟县| 北辰区| 沈丘县| 彰化县| 塔河县| 仪陇县| 陕西省| 阿荣旗| 郁南县| 丹东市| 黔西县| 静宁县| 涿鹿县| 涟水县| 通江县| 大埔区| 鹿泉市| 昌平区| 扬中市| 垦利县| 玉山县| 庆安县| 榆树市| 阿荣旗|