官术网_书友最值得收藏!

第4章 圖靈在布萊切利園

圖靈對國際象棋非常著迷,英國數學家I.J.古德也是。兩人對弈,通常是古德獲勝,他們一起研究出決策程序和獲勝的經驗法則。下國際象棋需要遵守游戲規則(才智),似乎也需要洞察力(直覺),來確定棋盤的不同位置上該選用哪條規則。想要在棋局中獲勝,僅僅遵守規則是不夠的,你得先知道該選哪條規則。

圖靈把國際象棋看作一個既便捷又愉快的方式,他用這種方式來思考賦予機器直覺的可能性。圖靈的朋友、信息論的創始人克勞德·香農(Claude Shannon)也在貝爾實驗室研究國際象棋。1950年,香農發表了論文《程序實現計算機下棋》(Programming a Computer for Playing Chess),開啟了計算機下棋的理論研究。

簡化智能的出現

國際象棋深深吸引了圖靈等人,一部分原因是,計算機似乎能用編寫好的程序下棋,而人類程序員無須事先知曉一切。計算機能識別邏輯運算符,例如:如果—那么、或、和等。計算機不僅可以在一系列指令下運行,還能根據在指令下運行時遇到的不同場景,產生不同的結果。在圖靈等人看來,這種基于“所見”而改變路線的能力,模擬了人類思維的一個核心方面。

這些學者們——圖靈、古德、香農,以及其他人——也在思考另一個極具挑戰性的數學問題。德國使用新的通信密碼來部署攻擊英吉利海峽和大西洋上的軍艦和商船。這些學者的核心任務就是幫助盟軍破解德國的通信密碼。圖靈覺得自己投身到了一場殊死的戰斗中——在第二次世界大戰中協助盟軍打敗納粹德國。正是他對計算的想法,幫助盟軍扭轉了戰爭的局勢。

布萊切利園

布萊切利園位于英國的一個小鎮上,遠離倫敦和其他可能遭受炸彈襲擊的大城市,很不起眼。在第二次世界大戰期間,布萊切利園是英國政府進行密碼破譯的主要地點,進而協助盟軍發現德國U型潛水艇的位置。對于英國海軍來說,德國U型潛水艇是個大問題。這些潛水艇不斷在英吉利海峽襲擊英國運輸船隊,它們擊沉了數千艘船,破壞了大量的物資和裝備。為了維持戰斗力,英國每年需要進口總計3000萬噸的貨物,而德國U型潛水艇的襲擊一度使這些貨物一個月損失20萬噸,這是一個巨大的威脅。德國在戰爭中使用的這個策略,一度令英國無從應對。于是,英國政府作出回應,集結了一組天賦異稟的密碼專家、國際象棋手、數學家來研究如何破解U型潛水艇的通信密碼。

U型潛水艇的通信密碼是一臺名為“恩尼格瑪”(Enigma)的密碼機生成的。它的外形就像一臺打字機,從20世紀20年代起被用于商業。而德國人改進了它的性能并把它用于戰爭。改進后的恩尼格瑪密碼機被用于德國軍隊的所有戰略通信,例如,德國空軍空戰及德國海軍海戰中的通信都使用了恩尼格瑪密碼機。當時的人們普遍認為,改進后的恩尼格瑪密碼機的通信密碼是無法破譯的。

圖靈在布萊切利園的工作內容以及他在戰后被奉為國家英雄的故事廣為流傳,并在2014年被影片《模仿游戲》(Imitation Game)搬上熒幕。以純數學標準來看,圖靈做出的重大突破并不新奇,因為他使用了來自演繹邏輯的舊觀點。他半開玩笑地稱這種方法為“圖靈法”:這種方法是通過找到矛盾的組合,排除大量恩尼格瑪密碼的可能解法。該方法的依據是矛盾組合是無法存在于可能解法中的。因為在某些邏輯系統中,我們不可能既有“A”又有“非A”,就像我們不可能同時既“在商店”又“在家”。“圖靈法”見效了,它加快了破譯恩尼格瑪信息的速度,協助與世隔絕的密碼破譯團隊完成了任務。在布萊切利園,其他科學家想出了不同的方法來破解密碼。他們的想法被放在一臺名叫“炸彈”(Bombe)的密碼破譯機上進行測試。“Bombe”這個隨意的名字取自“Bomba”(波蘭的一臺早期的密碼破譯機的名稱)。我們可以把這臺解碼機想象成一臺原始的電腦,它能運行不同的程序。

1943年前后,戰爭的優勢從軸心國轉向了同盟國,這在很大程度上歸功于布萊切利園的密碼破譯團隊的不斷努力。這個團隊取得了舉世矚目的成就,其成員都成了戰爭英雄。與此同時,布萊切利園也被證明是計算思維的避風港。密碼破譯機“炸彈”通過運行程序,解決了人類自己無法解決的問題。

直覺機器?不是。

對圖靈來說,在布萊切利園的工作具有重大的意義,這一工作使他關于智能機器可能性的想法具體化。與古德和香農一樣,圖靈也發現了機器“頭腦游戲”在破譯密碼方面的力量和作用:它們能破解軍隊無法讀懂的無線電通信密碼。這種新的計算方法很有意思,不僅因為它會自動下國際象棋,不夸張地說,它還能擊沉軍艦。

圖靈再次思考一件抽象的事:頭腦和機器,或智能的一般概念。但是他對智能含義的理解稍顯特別。20世紀40年代,人們通常認為,智能不是形式系統的特性,比如布萊切利園的純機械密碼破譯機“炸彈”。哥德爾證明,一般來說,事實不能簡化為形式,就像用一系列規則來玩一個正式的游戲。但是哥德爾的證明也留下了一個問題:人類的大腦靠直覺來選擇所要遵循的規則,如果不存在能證明一切的高級系統,那么這種直覺是否真的可以整合到特定的機器里?

完成布萊切利園的密碼破譯工作之后,圖靈的重心轉向另一個問題:我們能否制造出擁有直覺和智能的強大機器。為了破譯德國的密碼,海量可能的數字組合需要被驗證,這使人類直覺的作用顯得微不足道。但是,有正確程序的系統能夠通過簡化如此復雜的數學難題來完成任務。對圖靈來說,這表明機器可以擁有直覺。也就是說,在布萊切利園獲得的成功意味著人工智能是可能實現的。

然而,要理解圖靈的思路,我們必須先確定某個關于“智能”的特別想法:就機器所具備的能力而言,人類的智能需要被簡化。從本質上講,智能必須被簡化為解決問題的能力。畢竟,下國際象棋就是解決問題,破譯密碼也是。

于是我們明白,圖靈的偉大天賦和他的重大錯誤,都在于他認為人類智能要簡化為解決問題的能力。1950年,圖靈在《計算機器與智能》一文中談到了有關智能機器的想法。無論這個想法是否能在戰爭年代變得明確,顯然,他在布萊切利園的經歷使他對于人工智能的觀點變得具體化。而且,在沒有進行必要的自我分析的情況下,人工智能也會沿著他規劃的道路前進。

然而,如果我們仔細審視在布萊切利園成功的密碼破譯工作,就會發現有關人和機器的哲學概念被危險地簡化了。布萊切利園是一個智能體系,它協調軍事行動(包括間諜和偵查活動,以及攻擊敵方軍艦),在軍隊和布萊切利園的科學家和工程師之間傳遞情報,這個體系的成功有時還需要一點運氣。現實中,基于數學上有關機械破譯難度的論證,德國人認為改進后的恩尼格瑪密碼機無法通過純機械方式破解。因而布萊切利園的成功,一部分該歸因于德國指揮官對恩尼格瑪密碼的盲目自信。因此,在發現某些密碼被破譯后,他們沒有意識到他們在科學上的失敗,并在關鍵時刻改進密碼機,而是把問題歸咎于秘密的間諜行動。但是,戰爭的迷霧不僅整合了新的技術,也把新形式的人類和社會智能融合在一起。

比如,波蘭軍隊曾得到了恩尼格瑪密碼機的重要資料。這些資料后來為布萊切利園的密碼破譯工作提供了寶貴的線索。早在20世紀30年代,波蘭人就利用這些資料,開發了他們自己的簡化版密碼破譯機。圖靈于1940年初基于波蘭人的成果開發出了新的版本——利用“圖靈法”的密碼破譯機“炸彈”。圖靈也會看到,自己的設計改進是對他的同事高登·威爾什曼(Gordon Welchman)所做改進的回應。高登添加了一個“對角線板”,進一步簡化了搜索過程。這就是兩個人類大腦運用直覺進行的合作。

一些發生在戰區的事件也至關重要。1940年6月8日,一艘英國航母在挪威海岸被德軍擊沉。這次襲擊使英國損失慘重,大量船員葬身海底,但是它暴露了德國U型潛艇的位置。就在幾個星期前,1940年4月底,德國巡邏船隊中極具破壞性的一員——VP2623被捕獲,其內部藏有大量關于恩尼格瑪密碼機的珍貴資料。破解恩尼格瑪密碼機的關鍵部分落入了盟軍手中,繼而被送往布萊切利園。

這些支離破碎的信息本身遠不足以破譯德國無線電通信密碼,但是它們推進了關鍵的第一步——幫助密碼破譯團隊研究出如何給“炸彈”編寫程序。圖靈和同事們借用了美國科學家和邏輯學家查爾斯·桑德斯·皮爾士(Charles Sanders Peirce)所創的說法,把它稱為“證據權重”。

數學家們可以用不同的方式來理解證據權重。但是布萊切利園的成功(以及有關人工智能的問題)意味著人類可以運用可靠直覺給機器指明方向。從一艘被捕獲的德國U型潛艇上發現的一段被破譯的文字就像在一袋白球旁邊發現的一個白球一樣,具有多種可能性。我們可以猜測發生了什么事。我們會猜測這個球很有可能來自那個袋子,即使我們沒有看到它從袋子里被取出來。雖然這種猜測無法被證明是正確的,但是為設計機器程序而設定初始條件,保證了程序不會朝錯誤的方向沒有目的地運行,人類的直覺越準確,程序最終得出期望結果的可能性就越大,證據和猜測使密碼破譯機發揮效力。

布萊切利園的科學家不只是把信息輸入密碼破譯機,讓它不知疲倦地排除數百萬個不正確的編碼。圖靈想象到了密碼破譯機“炸彈”的另一種可能性——他的“機械程序”可以復制或取代人類智能。

然而,布萊切利園的密碼破譯團隊的首要工作是猜測:他們分析來自戰場的指令、密碼、信息碎片,并建立假設。在科學里,猜測就是建立假設,是人類認知發展的基礎。因此,布萊切利園的成功其實來源于一個善于猜測的系統。它的必要因素不是機械,而是初始智能觀察。密碼破譯機必須先有一個明確的目標,然后才能開始有目的地運行。

我們第二章將要探究的主題和皮爾士的發現一致。早在19世紀末期,皮爾士就發現,每一個形成復雜的智能概念和判斷的觀察都源于猜測,他亦稱之為“溯因”:

在一個美好的春日清晨,我望向窗外,看到一朵盛開的杜鵑花。不,不對!我沒有看到,這只是我用來描述所見的唯一方式。這是一種觀點、一句話、一個事實,但是我感知到的不是觀點、句子或事實,只是我通過陳述事實來理解的一幅圖像。這個陳述是抽象的,但是我看見的東西是具體的。我用一句話來表述我看見的任何東西,這就是溯因。事實上,我們的整個知識構架是由用歸納法證實過的假設構成的。如果只停留在毫無目的的觀察,每一步都不做溯因,就不會取得任何進展。

在布萊切利園,圖靈和他的同事們正是通過每一步的智能溯因,打贏了一場把命令和控制轉化為智能的戰爭。圖靈無疑知道這一點(回想他在1938年關于序數的論文中對直覺的論述),但是,這似乎沒有對他后期有關智能本質和智能機器可能性的想法產生明顯的影響。無論成就多么輝煌,他所做的只是構思真正智能的簡化形式,以擺脫早些時候令他著迷的直覺的概念和猜測的概念。

關于社交智能,一個重要的題外話

圖靈的智能觀念忽略了社交智能,但社交智能對于人工智能卻至關重要。圖靈不喜歡把思維或智能看作社會或情境的東西,然而布萊切利園的成功其實是一個宏大體系的一部分,這個體系遠遠延伸到了布萊切利園封閉的圍墻之外,并很快引入美國科學家的工作,比如貝爾實驗室的香農,以及著名的普林斯頓高等研究院[愛因斯坦、哥德爾、約翰·馮·諾依曼(John Von Neumann)都曾在該研究院工作]的科學家的工作;擴展后的人機系統是更加現實的模型,可以用來模擬真實世界的問題是如何解決的——世界大戰必定是其中最復雜也是最重要的問題之一。

已經有人注意到,人工智能對于社交或情境智能是“充耳不聞”的。最近注意到這個現象的一位是機器學習領域的科學家弗朗索瓦·喬列特(Fran?ois Chollet)。他很好地總結了他對圖靈(更廣泛地說,是人工智能領域)的智能觀點的評價。首先,智能是有情境的——沒有所謂的通用智能。你的大腦是更廣泛的系統中的一部分。這個系統包括你的身體、你所在的環境、其他人,以及整體文化。其次,智能是有語境的,絕非存在于真空中。任何個人智能都將永遠受到環境的定義和限制。如今,環境正在成為智能的瓶頸,而不是大腦。最后,人類智能在很大程度上是外化的,它并不包含在你的頭腦中,而是包含在你的文化里。如果把個體想象成工具,他們的大腦就是一個比他們自身更大的認知系統里的模塊。這個系統存在已久,而且還會進行自我改進。

圖靈認為,人類可通過編程使機器擁有直覺,喬列特則主張,機器的智能無法達到人類智能的水平。其實,把直覺程序化的想法忽略了一個關于人類自身智能的基本事實——人類有社交智能和情感智能,且人類使用大腦的方式不能等同于一臺機器解決復雜問題的方式。

這個證據說明,圖靈斷然否決有關人的觀點,轉而相信人類所有的思維過程都可以被理解為“破譯密碼”——如解答難題或玩一盤類似國際象棋的游戲。因此,在20世紀40年代時,圖靈已經確定了他對智能的觀點,并于1950年發表了一篇預見人工智能的論文。他的觀點中包含著驚人的錯誤,這個錯誤被人工智能科學家代代相傳,直到今天。

圖靈的智能錯誤和狹義人工智能

智能就是用來解決問題的觀點,也可以用于解釋為何在人工智能的歷史長河中,它的應用始終很狹隘。比如,玩游戲一直是開發高級人工智能技術的靈感來源,但是游戲只是生活的“簡化版本”。國際象棋程序會下棋,卻不會開車。IBM的超級計算機“沃森”可以玩《危險邊緣[1]》游戲,卻不會玩國際象棋或圍棋,使用“沃森”來執行其他數據挖掘和自然語言處理需要進行大量編程或“植入”工作,就像最近“沃森”在醫療領域的應用一樣(其表現并不盡如人意)。

把智能當作解決問題的方法帶來了機器智能的局限性。把計算機系統設計成只用于解決某個問題的系統,會使系統只能解決該問題。圖靈無疑知道這一點,他在1950年的論文中推測,也許我們能讓機器學習,從而克服這種局限性。如果機器具備了“通用技能”,我們將會目睹解決特定問題的應用程序順利轉化為通用智能機器,從而擁有人工智能。

然而,時下流行的機器學習的方式和圖靈早期提出的機器學習的方式大相徑庭。當下的機器學習系統必須通過學習一些特殊的東西來達到它們的目標。研究人員把這叫作給機器設置一個“偏見(bias)”。這個詞不帶有它在現實世界的負面含義,它并不意味著機器很“固執”,使人難以與之爭辯。機器學習中的“偏見”指的是設計并調整系統,使之只能學習某些東西。但是,這種系統當然只是用來解決某些特定問題的狹隘的系統,這就是為什么臉書的人臉識別系統沒有學會計算你的個人所得稅。

所以研究人員已經認識到,給機器學習系統設置“偏見”,讓機器學習系統學習一個特定任務的設計,會使它在別的任務上表現糟糕。機器學會某一件事,和機器學會另一件事,這兩者之間是負相關關系。即使是看似相似的任務,也會使機器在表現上呈負相關。學習玩圍棋的計算機系統不會同時學習玩國際象棋。圍棋系統經過特殊的設計,對于學習圍棋的規則有特殊的“偏見”,它的學習曲線遵循圍棋的已知打分規則。而對于其他游戲,比如《危險邊緣》或國際象棋,該學習曲線是無效的——其實是不存在的。

機器學習的“偏見”通常被認為是誤差(error)的來源,是一個技術問題。如果遵循普通的語言用法,它還有一個次要的含義,意為其產生的結果在無意中受到種族或性別等因素的影響。因為系統一開始不會“尋找”解決方案,機器學習需要通過現有方案與正確方案(“偏見”)之間的誤差,引導系統提到正確方案,所以在機器學習中,“偏見”的確必不可少,因為它就是學習本身的一部分。

“沒有免費的午餐(No Free Lunch,NFL)”定理印證了我們在設計和構建學習系統時的所見。這條定理指出,任何運用沒有定理“偏見”的學習系統解決的問題,得出的解都不會好過隨機解。這意味著系統設計者必須有意地給系統一個“偏見”,它才會去學它應該學的東西——完全無“偏見”的系統是無用的。所以有些復雜的技術會用無人監督的方式對數據進行“預訓練”,以暴露需要學習的數據的特征。所有這些都是成功的機器學習的重要條件。然而,這個討論中遺漏了一點,即通過給予系統期望的“偏見”,讓它學習預設的東西,通常會導致它變得狹隘,從某種意義上說,它不會再推廣到其他領域。構建和使用一個成功的機器學習系統的部分意義是,這個系統不是無“偏見”和通用的,而是專注于特定的學習問題的。從這個角度來看,構建學習系統的方法在某種程度上是有局限性的。成功和狹隘是相伴相生的。

只是這個事實讓我們產生了嚴重的懷疑:今天的人工智能能否順利進化成未來人類水平的人工智能。有人認為,現代的機器學習方式,比如深度學習,總會做到“訓練有素”,機器能學得像人類一樣聰明,持這種觀點的人不理解機器學習的基本局限性。接受給學習系統提供“偏見”的必要性等同于接受圖靈的觀察——對數學的見解必須由人類用正規的方法驗證并得出,因為機器在學習之前,人類設計師就決定了機器的“偏見”。

圖靈留給后人的

綜上所述,“智能就是解決問題”的觀點必定會衍生出狹隘的應用,這對于更遠大的人工智能目標來說是不夠的。我們從圖靈那里繼承了關于智能的觀點。因而今日的我們使用的術語是“人工智能”,而不是“人工任務模擬”。圖靈的高明之處在于,他為制造自動機器清除了理論障礙和反對意見,但是這樣一來,他縮小了智能本身的定義和范圍。于是,人工智能開始生產解決問題的狹隘應用程序,直到今天還是如此。

雖然圖靈傾向于把人類智能看作單個的機械過程,也就是在20世紀40年代早期計算機問世時,許多媒體所稱的“機械大腦”。但他不喜歡把思考或智能看作社會性或情境性的事物。顯然,當我們談論到智能的話題時,必然要把智能置于更廣泛的語境之下。我們通常所說的通用(非狹義)智能,不是一個在我們頭腦中運行的算法,而是涉及我們在世間思考和行動的所有文化、歷史和社會背景的復雜體系。但如果開發者對智能的理解如此寬泛和復雜,人工智能將很難向前發展——這也是事實。同時,因為我們沒有徹底把人工智能的含義重新概念化,圖靈對智能概念的簡化導致我們最終只得到了狹隘的智能應用,無法得到通用的智能應用。

1950年,圖靈在他的論文中預見到這些難點,提出可以讓機器學習。然而,我們現在知道,學習本身就是在解決問題:給機器一個“偏見”,讓機器在某些特定任務中擁有學習能力,同時減少機器執行其他任務的能力。學習系統其實也只是狹隘的問題解決系統。如果沒有已知的理論橋梁就把如此狹隘的系統和人類表現出的通用智能聯系起來,人工智能就會陷入困境。早期對于智能的錯誤理解,已經逐漸使人工智能的發展陷入了不可逆轉的絕境。

讓我們再次思考圖靈原先對直覺和才能的區分。對他來說,人工智能的問題就是系統設計者提供的直覺是否真的能夠被“拉進”智能機器的主要系統中。如果答案是肯定的,系統就可以用直覺來解決問題,擺脫狹隘的詛咒,變得更聰明且能自主學習。迄今為止,還沒有人能用計算機做到這一點。我們確實知道,設計者通過人工智能系統之外的直覺,告訴這個系統去解決(或學習解決)哪些具體問題。系統自主使用人類的直覺進行推理成了核心問題,這將在本書第二部分談到。

在本書第二部分里,我們還會更多地談到人工智能的“狹隘陷阱”。接下來,我們將目光轉向另一個對智能的錯誤理解,也是對狹義智能的錯誤理解的自然延伸——超級智能。

注釋

[1]《危險邊緣》:美國一檔極受歡迎的智力競猜電視節目。2011年2月17日,“沃森”擊敗該節目歷史上最成功的選手,成為該節目的新王者。

主站蜘蛛池模板: 博爱县| 芦山县| 霍山县| 玛纳斯县| 南靖县| 醴陵市| 静宁县| 延长县| 怀来县| 沂源县| 鹤峰县| 阿坝县| 博爱县| 桐庐县| 兰州市| 方城县| 辛集市| 库尔勒市| 宜良县| 卢氏县| 仙居县| 沧州市| 英山县| 明水县| 临桂县| 楚雄市| 土默特右旗| 武胜县| 胶州市| 印江| 中方县| 冕宁县| 西贡区| 育儿| 肇源县| 黔西县| 张家川| 富锦市| 将乐县| 蒲城县| 星座|