- AI 3.0
- (美)梅拉妮·米歇爾
- 10171字
- 2021-02-08 10:06:01
序
等那一口仙氣兒
段永朝
財訊傳媒集團首席戰略官
葦草智酷創始合伙人
2019年,梅拉妮·米歇爾博士的這本新著《AI 3.0》甫一出版,就躋身亞馬遜“計算機與技術”暢銷書行列。10年前,她的《復雜》(Complexity)一書榮登亞馬遜年度十佳科學圖書榜單。人工智能(artificial intelligence, AI)類的圖書可謂汗牛充棟,大致可分為兩類:一類是給專業的工程師看的,另一類是給大眾的普及讀物。米歇爾的這部書介乎兩者之間,它有專業的技術闡釋,更有深刻的思想洞察。
“侯世達的恐懼”
米歇爾是侯世達(Douglas Hofstadter)(1)的學生。侯世達是蜚聲中外的暢銷書《哥德爾、艾舍爾、巴赫:集異璧之大成》(G?del, Escher, Bach: an Eternal Golden Braid)的作者。這部1979年出版的不朽著作,往往被簡稱為“GEB”,40多年來長盛不衰,令無數學習計算機科學和數理科學的大學生心醉神迷。米歇爾1990年在侯世達的指導下獲得博士學位,后在美國波特蘭大學任計算機科學教授,同時也是著名的復雜科學研究圣地——美國圣塔菲研究所的客座研究員。
2016年,谷歌公司的AlphaGo橫掃圍棋界一應高手,讓全世界見識了新一波人工智能掀起的巨浪。一時間,機器翻譯、語音識別、虛擬現實、自動駕駛、人工智能機器人等輪番登場,“奇點爆炸”“超級智能”“數字永生”等概念如雨后春筍般涌現,人工智能成為幾乎所有大型前沿科技論壇必設的主題,“通用人工智能”(artificial general intelligence,AGI)仿佛指日可待。
2018年4月18日,我有幸在騰訊研究院、集智俱樂部、湛廬和葦草智酷聯合主辦的一個沙龍上,見到了久仰大名的“大神”侯世達,并參加了圓桌對話。在侯世達眼里,人工智能沒那么高深,他直言很討厭“人工智能”這個詞,并以其新著《表象與本質》中的例子,批駁人工智能毫無“智能”可言。
米歇爾的這部《AI 3.0》為侯世達對人工智能的萬般憂慮做了一次深度的技術解析。
對人工智能的種種討論,特別是涉及技術倫理、社會價值和發展前景的時候,人們一般只會停留在悲觀或者樂觀的選邊站隊層面,無法進一步深入下去。這不奇怪,技術專家們擅長的話語是數據、算法、模型,社會學者和新聞記者們只能從技術的外部性、代碼的背后之手、人性之善惡的角度,捍衛或者批判某種價值主張。對絕大多數非專業人士而言,由于搞不懂隱藏在反向傳播算法、卷積神經網絡(convolutional neural networks,ConvNets)、馬爾可夫過程、熵原理這些硬核知識背后的思想內涵,就只能以“好與壞”“善與惡”的視角對人工智能進行理解和評判。講述技術視角的思想基礎,彌合“理科生”與“文科生”之間看待人工智能的思想鴻溝,正是米歇爾這部書的價值所在。當然,從我這樣一名30年前曾做過專家系統(expert system)、機器推理算法的半個業內人士的角度來看,米歇爾的這部書如果能再“柔和”一些,可能效果更佳,不過這的確很難,跨越學科分野的努力,既重要又充滿挑戰。
《AI 3.0》開篇即提出這樣一個“侯世達的恐懼”:不是擔心人工智能太聰明,而是擔心人工智能太容易取代我們人類所珍視的東西。這說出了很多人的心聲,人們對人工智能的憂慮,在于這一領域發展得實在是太快了,已經滲透到日常生活的各個角落。不知不覺,我們周圍的一切似乎都變得智能了,都被“強壯”的機器代碼、算法接管了,人工智能似乎就是為接管世界而生的。這一波人工智能浪潮,隨著一座座“生活城池的淪陷”,日益亢奮起來,超級智能、通用人工智能似乎指日可待,人工智能徹底接管這個世界似乎越來越現實,越來越不容置疑了。要知道,自1956年“人工智能”這一術語在美國達特茅斯學院的一個小型座談會上被提出之后,“通用問題求解器”(general problem solver,GPS)就是當年人工智能的重要目標。
本書共分為5個部分。這篇序言,并非是對原書精彩內容的“劇透”,而是試圖做一點點背景解析,與各位關注、思考人工智能的朋友交流。
人工智能的歷史遺留問題
本書第一部分回顧了人工智能超過半個世紀的發展歷史,并提出該領域兩類主要的人工智能,一類是符號人工智能(symbolic AI),另一類是以感知機為雛形的亞符號人工智能(subsymbolic AI)。前者的基本假設是智能問題可以歸為“符號推理”過程,這一學派也被稱為“心智的計算理論”(computational theory of mind,CTM)學派。這一理論可追溯至計算機鼻祖法國科學家帕斯卡以及德國數學家萊布尼茨,真正體現這一思想的所謂智能機器,源于英國的查爾斯·巴貝奇(Charles Babbage)以及艾倫·圖靈(Alan Turing)的開創性工作。
亞符號人工智能的出現歸功于行為主義認知理論的崛起,可追溯至英國哲學家大衛·休謨和美國心理學家威廉·詹姆斯,其思想基礎是“刺激-反應理論”。20世紀40年代,美國神經生理學家麥克卡洛克(W. S. McCulloch)、匹茨(W. A. Pitts)提出神經元模型后,心理學家弗蘭克·羅森布拉特(Frank Rosenblatt)提出了感知機模型,這奠定了神經網絡的基礎。
然而,20世紀五六十年代的人工智能,在符號演算和感知機兩個方向上都陷入了停滯。80年代興起的專家系統和神經網絡,也因為受制于計算能力和對智能的理解,并未獲得實質性的突破。
與一般人工智能著作不同的是,在概述“人工智能的寒冬”這一背景之后,米歇爾將注意力集中在“何以如此”這個關鍵問題上。了解人工智能“技術內幕”的專業人士都知道,算法在外行人看來的確神秘莫測,但在工程師眼里其所仰仗的說到底還是計算能力和符號演算的邏輯基礎——這才是理解人工智能的關鍵。
受惠于神經網絡和機器學習(machine learning)的發展,特別是2016年谷歌公司的AlphaGo在各種圍棋比賽中大獲全勝,給全世界做了一次人工智能科普,人工智能的第三波浪潮開始了。自從IBM的智能程序沃森(Watson)在智力競賽《危險邊緣》(Jeopardy!)中取得十分亮眼的表現,無人駕駛汽車、圖像識別和語音識別等技術越來越受到人們的關注,一大波斗志昂揚的“人工智能預言”伴隨著這一波人工智能浪潮愈演愈烈。DeepMind創始人之一沙恩·萊格(Shane Legg)認為,超越人類水平的人工智能將在2025年左右出現。谷歌公司戰略委員會成員雷·庫茲韋爾(Ray Kurzweil)(2)則提出了令人震驚的“奇點理論”,他認為2029年完全通過圖靈測試(Turing test)的智能機器將會出現,以強人工智能為基礎的智能爆炸將會在2045年出現。
米歇爾的論述有一條清晰的線索,她細致地分析了人工智能在視覺、游戲、機器翻譯等領域最新的進展后指出:迄今為止令人眼花繚亂的智能突破,其實尚未觸及智能問題的核心——自然語言理解和意義問題。為什么會這樣呢?恐怕這就是我們需要仔細研讀本書的一個原因吧。
到底什么是機器學習
本書第二部分分析了視覺領域的技術進展,這部分可用來理解人工智能核心算法演變的歷程。
視覺領域廣泛使用的專業工具是ConvNets,這一領域的創立者包括日本學者福島·邦彥(Kunihiko Fukushima),以及法國計算機科學家楊立昆(Yann LeCun)。對外行人來說,視覺識別繁復的算法過程遮蔽了其中包含的技術思想,米歇爾將其“拎出來”展現給讀者:所謂視覺識別,無非是訓練出某種算法,使得機器可以利用這種算法來識別和命名它所“看到”的世界。
視覺識別的工作過程被分為兩個步驟:第一步是給機器注入一定量的已知素材,比如包含貓、狗等事物的圖片信息,這些信息在機器“眼里”無非是細碎的小方格——像素。通過對機器進行大量的訓練,讓其把這些圖片中所包含的“特征”一一抽取出來。
面對一個不知道其內部構造的對象,要想猜測出其內部構造具備哪些特征,這一課題在“信號處理”這一學科中已經有長足的進展,最著名的方法就是所謂“卷積變換”,也稱傅立葉變換。這一概念由法國數學家傅立葉提出,傅立葉對現代工程技術最大的貢獻就在于,他發現可以通過傅立葉變換將對象的時域過程轉換成方便計算的頻域過程。這么說令人一頭霧水。下面為幫助讀者理解這一過程,我將提供一些盡可能通俗易懂的線索。
在控制論創始人諾伯特·維納(Nobert Wiener)將“反饋”的概念引入系統控制之前,電子工程正面臨大量的信號處理過程。我們可以把信號處理問題,理解成一個輸入信號經過某個信號裝置,產生特定輸出的過程。工程師面臨的問題是:在不知道信號裝置本身的詳細信息的前提下,如何通過輸入特定的信號序列刺激信號裝置產生特定的輸出,從而根據這一特定的輸出信號序列,推測出信號裝置的特征?
舉個例子:假設有一個黑箱,數學上用一種函數來表示黑箱的特征,這種函數可稱為特征函數,你若想知道這個黑箱的特征,可以往黑箱里輸入一個信號序列(輸入函數),然后觀測黑箱在這個輸入函數的刺激下,產生的輸出函數有什么表現。
傅立葉的偉大思想有兩個:一個是傅立葉級數,另一個是傅立葉變換,前者是后者的數學基礎。傅立葉的洞見在于:任何一個周期函數,都可以表示為一個包含正弦與余弦函數的無窮級數之和(三角級數)。這一出現于1806—1822年間的偉大思想,從形式上看其實是泰勒級數(1715年提出)展開式在工程領域的應用。對于理工科同學來說,當第一次見到某個函數在一定條件下可以展開為該函數的一系列不同階次導數之和的時候,會頓時領悟到數學的奇妙。
通俗地說,泰勒級數在一定條件下,總可以把某個函數展開成一個無窮級數。這樣就從理論上找到了表示任意一個函數的可能性:將函數表示為一個包含無窮多項的級數,如果做近似處理,只需取這個級數的前幾項就夠用了。
那么,什么叫“卷積”呢?簡單來說,就是一個黑箱的輸出函數等于輸入函數和這個黑箱特征函數的卷積。你不必管卷積的數學過程,只需要理解這一點就夠了:卷積就是告訴我們,一個黑箱的輸出信號(輸出函數)與輸入信號(輸入函數)及這個黑箱自身的特征函數有關。在已知輸入函數和特征函數時,求解輸出函數的過程,叫作“求卷積”,實際上就是計算傅立葉積分的過程。
傅立葉變換的美妙之處在于:它把這一幾乎不可能計算的積分求解過程,轉換成兩個特定函數的乘積。稍微專業一點的說法是:將對一個函數求解其微分方程的過程,轉化為求解其三角級數的傅立葉積分的過程。經過這一變換,立刻讓另一個問題得到了解決:如何從特定的輸入函數和觀測到的輸出函數推算黑箱的特征函數?既然傅立葉變換將難解的積分問題轉化為乘法,那問題就迎刃而解了。根據輸入函數和輸出函數求解黑箱的特征函數,無非是傅立葉變換的逆運算而已,你也可以把它理解成一次除法運算。
傅立葉變換讓電子工程進行波形分析、對象特征函數提取成為可能。進而,傅立葉變換被提出150年后,成了今天人工智能學習算法的基礎,即提供了以黑箱的視角,推測目標對象的特征函數的可能路徑。
由此來看,人工智能在視覺系統上的應用,以及一切所謂深度學習(deep learning)算法,從數學角度上看,無非是使用20世紀七八十年代的多層神經網絡(multilayer neural network),通過傅立葉變換來求解對象的特征方程的過程。
人工智能應用ConvNets分為兩個過程:第一個過程是猜測對象的特征函數,也就是為對象建模的過程(識別);第二個過程則是根據對象的輸入-輸出響應序列,進一步調節對象參數的過程,這一過程也是“學習”的內在含義。也就是說,做卷積分析,就是面對一個不知其內部構造如何的對象,通過輸入一個已知的函數,觀察輸出函數,最終給出對目標對象內部構造的一個猜測。
在應用深度學習算法的時候,人們通常會將數據集分為“訓練集”和“測試集”兩個部分:前一個部分的數據集,用來做猜測,猜測對象是什么東西;后一個部分則用以對在訓練集上取得的成果進行驗證并優化相關參數,以便更準確地適應不同形態的對象。
深度學習又分為監督學習和無監督學習兩種。監督學習,事實上就是通過人機交互,明確告訴算法猜對了還是猜錯了。這種學習過程需要人機交互,也需要明確的關于對象的先驗知識,其應用場合是受限的,且效率低下。無監督學習則是需要學習機自行判斷結果是否恰當,進而優化判別參數。比如生成式對抗網絡(GAN)應用的就是無監督學習,它可以根據此前的學習結果,構造出全新的模式(全新的貓或者狗),來拓展對象認知的邊界。當然,無監督學習仍然需要人為的干預,因為說到底,學習算法并不“認識”這個世界。
從對計算機視覺領域人工智能的分析可以看出:目前,強大的人工智能依然在練習認識這個世界,認識自己的工作,而其所仰仗的無非是兩樣東西——強大的算力(比如神經網絡可以做到上百層,過去只能做到幾層)、傅立葉分析。歸根到底,對于世界究竟是什么樣的,機器自己是沒有任何真實的感知的,依然需要人的干預和解釋。
了解當下人工智能非凡表現的技術背景,可以讓非專業讀者也能把握住技術的“本領”究竟位于何處。作為控制論創始人的諾伯特·維納曾這樣說:“我們最好非常確信,給機器置入的目的正是我們真正想要的目的。”也就是說,機器的任何表現都先天地面臨一個重要的束縛,而這種束縛恰恰來自人,是人在教育機器這個“孩子”,是人在給這個“孩子”注入靈魂。
然而,人給機器吹一口仙氣兒,機器就有靈魂了嗎?問題恐怕沒這么簡單。
人工智能的“能”與“不能”
在第三部分,米歇爾通過討論游戲中的人工智能來進一步說明這一點。
用人工智能算法練習打游戲,是挖掘算法潛能、理解算法機理的有效途徑。智能算法打游戲基本都是無監督學習的過程,典型的比如《打磚塊》游戲,人不能事先給機器注入太多游戲策略,或者有利于獲勝的先驗知識,只能把游戲規則灌輸給算法,剩下的就全看機器自己的“修煉”了。
通過前面的簡要分析,大家理解了ConvNets中最重要的是參數調節,在游戲領域就是機器的游戲策略選擇。事先存儲再多的游戲策略,在暴力算法面前其實也是不堪一擊的,這其實是AlphaZero最終完勝人類的奧秘。人類棋手或者游戲玩家的“功力”往往來自經驗,也就是人們積攢的大量的套路,這些套路只是針對某個封閉對弈空間的有限選擇。如果機器只會模仿人的經驗策略,它就不能獲得獨立應對意外局面的能力,機器必須進入更大的對弈空間,這就是強化學習的含義。如理查德·薩頓(Richard Sutton)所言,強化學習就是“從猜測中學習猜測”,米歇爾將其調整為“從更好的猜測中學習猜測”。
分析到這一步,其實就十分接近人工智能的核心問題了。什么是“更好的猜測”?智能機器目前所能做的,還只是“最快的猜測”,或者說“以快取勝”。目前的人工智能,往往在速度上卓爾不凡,因為它可以動輒在更大的博弈空間里處理海量的數據,表現出令人咋舌的算力水平,遠遠超過人類的計算能力。這種能力在讓人驚艷的同時,也帶有很強的迷惑性,使人誤以為機器已經“沾了仙氣”,比如IBM的智能機器沃森就是如此。其實這是假象,如今的人工智能,與真正的人工智能之間依然有巨大的鴻溝。什么是真正的人工智能?業界對其定義也一直爭論不休,這里暫且不論。
人工智能的核心問題,依然涉及對客體對象、目標過程的認識。真正的人工智能必須有能力認識某一對象是什么。人工智能專家所找到的解決之道,其實還遠不是“認識對象”的解決之道(這一點米歇爾放在本書的最后一部分討論),而是找到了一個退而求其次的路徑,就是“目標函數”的構建。
目標函數是什么?舉個例子,比如玩蒙眼點鼻子的游戲。蒙眼人拿著筆走向一幅大鼻子卡通畫,然后摸索著去點畫中的鼻子。如果有個聲音不停地提示其偏離的方向,蒙眼人就可以很快地點中鼻子。這個提示點鼻子的偏差的信息,對蒙眼人點中鼻子至關重要。想象讓機器來完成這個任務,機器可以不理解什么是鼻子,什么是點,也不用明白這么做有什么娛樂的價值,但如果能給出判斷點中與否的目標函數,就可以大大提高機器成功完成任務的概率。
其實,當下的人工智能算法依然停留在工程意義上,也就是說,還只是以完成任務為目標。至于做這件事的意義,則全然不在機器算法的“視野”之內。
谷歌的AlphaGo到AlphaGo Zero的演化歷程,就是一個活生生的例子。第一階段,AlphaGo向人學習;第二階段,AlphaGo Zero自學成才。不管哪個階段,谷歌公司的創見在于:讓算法可以洞察整個盤面。為了大大減少計算的負擔,并使算法可以獲知距離獲勝還有多遠,他們使用的是蒙特卡洛方法,只要確保最優策略依然在剩下的搜索空間里就好,換句話說,比對手多預測幾步就有更大的勝算。
從游戲中學習套路,人工智能是不是就早晚可以超越人類?在人工智能剛剛興起的20世紀五六十年代就有這個論調,當年在機器上玩跳棋的亞瑟·塞繆爾(Arthur Samuel)曾樂觀估計,10年內機器必然戰勝人類。今天的機器算法,固然已經在棋類博弈中完勝人類棋手,但從智能角度看,與那時相比其實并無實質性的進步。也就是說,無論機器的自學能力有多強,有一件事是確定的,即游戲目標的存在。游戲規則和游戲目標作為先驗知識,給出了這樣一個明確的博弈邊界,即這一游戲的博弈空間是有窮空間。算法的唯一目標就是贏,不管其對手是人還是另一個機器算法,也不管對弈雙方是否理解游戲,或者能否欣賞游戲之美,它只追求贏。棋類游戲博弈中的“贏”,其實隱含一個假設,即游戲本身是存在贏的可能性的,比如在圍棋中,平局、和棋也是“輸贏”的特定形態。換句話說,就是一個有趣的、有輸贏的游戲設計,其本身先天地規定了這一靜態目標的成立——零和博弈。
因此,機器在零和博弈空間里完勝人類這一點,并非凸顯了機器智能超群,只是進一步驗證了人類的局限性和零和博弈目標的有限性。除此之外,機器所取得的成功說明不了更多。
從視覺系統和游戲,并不能看出人工智能所面臨的最大的挑戰在哪里。人工智能所面臨的最大挑戰,可能在于人們忘記了智能機器的強項依然是算力,錯誤地選擇將今日之人工智能更多地用于人類增強中,而且將人機聯合的活動空間,定義為更大的零和博弈游戲場景。
米歇爾很好地說明了這一挑戰下的另一個場景,就是人工智能所面臨的一個“硬核”場景:機器翻譯。這是本書第四部分的內容:當人工智能遇上自然語言處理。
早在1956年達特茅斯會議提出人工智能之前,在20世紀40年代美國“科技工業共同體”建設中扮演重要角色的官方技術官員沃倫·韋弗博士就提出了機器翻譯的理念。機器翻譯既是特別有市場號召力的應用場景,也是檢驗人工智能技術思想所取得的前沿突破的重要領域,谷歌、微軟、科大訊飛等公司在這方面投入了巨大的熱情。機器翻譯無疑是最“硬核”的人工智能難題,它難在人工智能需要直接面對“理解”這一難題。谷歌和微軟等公司還將翻譯的含義拓展,用智能算法給圖片打標簽,試圖解決海量圖片的識別問題。斯坦福大學開發了人工智能閱讀理解項目,希望有一天能夠讓機器“讀懂”它所面對的內容。
就在我寫這篇文章的時候,旅居美國30余年,長期關注生物科技、人工智能、區塊鏈等領域的前沿進展的企業家邵青博士,給我發來一篇來自美國硅谷的報道,這則報道的主角叫作GPT-3算法,它的發明人埃德·萊昂·克林格(Ed Leon Klinger)稱:“從今天起,世界徹底改變了。”GPT-3是硅谷領先的人工智能公司OpenAI開發的第三代語言模型。這一模型的神奇之處在于,它通過分析網絡上的海量文字,來預測哪些單詞更可能會跟隨在另一些單詞的后面。讓許多程序員興奮不已的是,GPT-3被開放給所有程序員公測。
相應的報道使用了這樣的表述:GPT-3竟然能直接理解自然語言。從報道中看,所謂理解自然語言,就是你可以用語音向算法提任何問題,然后它就可以給你呈現你想要的。比如你說“給我一個長得像Stripe官網的聊天App”,過幾秒鐘,定制好的App就推送過來了,像點餐一樣方便。還不止這些,GPT-3還可以寫論文、小說,起草格式合同,甚至大批量生產段子。當然,也有評論不客氣地指出,GPT-3根本不懂自然語言,它只是很快而已。它的確太快了,據說它有1 750億個參數,我們姑且認為它可以處理如此巨量的參數吧。
但是,這其實依然是一種使用蠻力進行計算的模式,僅此而已。
對于目前的自然語言項目,我可以武斷地說,它們其實毫無“理解”可言,它們唯一的本領就是“見多識廣”。問題在于,雖然一款智能機器可以快速遍歷狀態空間的更多可能性,把邊邊角角都掃描到,然后表現出越來越多令人驚訝的本領,甚至超過人類的表現,但是,它們依然像是“狗眼看星星”,并不認得什么叫“星圖”。
意義問題:人工智能所面臨的“硬核”挑戰
米歇爾這本著作的第五部分落到了“意義”問題上。她指出,理解的基礎是意義,意義是人工智能的真正障礙。至于這一障礙是否不可逾越,這可以成為激烈爭論的話題。我感覺,米歇爾所闡述的意義問題,并不是說人工智能無法理解意義,也不是說人工智能無法創造出新的意義(當然這取決于你怎么定義“意義”),而是說,人工智能對意義的理解是否在安全邊界之內——這其實也是全書開篇提到的“侯世達的恐懼”的核心內容。
為了便于大家理解意義問題,我先舉一個生活中的例子。很多經常外出旅游的人都有這樣的經驗:即便不懂異國他鄉的語言,你仍然可以用連比畫帶手勢的方式與當地人交流,至少淺層次的生活交流大致是沒問題的。原因也很明顯:大量超越語言的生活常識,其實是超越文化差異的全人類共有知識,這是意義的“底座”,但機器并不具備這些共有知識,用擬人化的語言說,機器像一個探索新奇世界的嬰兒,世界對它而言是全新的,它需要學會語言,但更重要的是它要學會理解沉淀在語言背后的意義。
嬰兒理解這個世界的過程,是不斷將自己的新奇感受裝入成人的詞語世界的過程,這個過程也是絕大多數真實的認知歷程,當然也有“漏網之魚”,比如日益流行的網絡用語,就突破了附著在傳統詞語上的固有含義。意義的產生,既有漫長、深厚、難以細數的生活積淀,以及約定俗成的“能指-所指”的任意配對,也有突破詞語邊界的“類比”和“象征”,按米歇爾的導師侯世達的觀點,這種類比和象征是“思考之源和思維之火”。
借用吉安-卡洛·羅塔(Gian-Carlo Rota)的話,米歇爾提出了一個根本性的問題:人工智能是否以及何時能打破意義的障礙?
米歇爾并未直截了當地回答這個艱難的問題,但她畢竟是侯世達的學生,她從侯世達的思想中汲取營養:這個世界是隱喻式的,我們并非確鑿無疑地生活在符號世界中,我們生活在色彩斑斕的隱喻中。固然不同的文化所對應的底層邏輯之間難以互通或相互轉化,甚至不同的文化隱喻所導致的生活信念彼此抵牾,但人類仍然有共享的元認知(metacognition),這一元認知是維系多樣化世界的最后屏障。
從這個意義上說,人工智能所面臨的“硬核”問題,并不在于機器和人誰控制誰,而在于機器成長的過程意味著什么,機器將如何成長,什么時候會變得強大,強大之后機器會是什么樣子。這一系列問題將人們對人工智能的思考引向深處。人們不能總是停留在悲觀或樂觀的情緒選擇中。天才的工程師、創新公司的CEO(首席執行官)雖然也會思考這類問題,但他們更愿意先干起來再說。硅谷的很多公司信奉的準則是:預測未來最好的辦法就是把它造出來。
人們爭論的焦點其實在于,當人工智能科學家和工程師興致盎然地挑戰各種邊界、義無反顧地奔向臨界點的時候,如果他們謙遜地將這種技術的未來,謹慎地描述為探索未知世界的諸多可能性這種程度,而不是將手中的算法不容置疑地看作必須接受的未來,那便罷了,可怕的恰恰是工程師忘記了“意義”問題其實遠遠超出人類目前的認知邊界。
當然,無論如何機器將“長大”,并將開啟自己的獨立生活,創造自己的語言,甚至可能會形成與人類相抗衡的文化符號,提出自己的價值主張,創造自己的社群、藝術,甚至宗教,并與人類分享這個世界的快樂。
對這一切的思考,還缺乏一個更開放的框架,而且,這一思考還深深局限在文字,特別是英文的線性思維當中。智能機器的存在和成長,是否會拓展人類的元認知,將這一元認知拓展為人機共享的元認知?僅靠文字的思維方式,可能難以走出符號演算的“如來佛之掌”。侯世達在40多年前寫作“GEB”的時候,針對人工智能提出了10個問題并給出了自己的答案,侯世達對這10個問題的思考,更多地指向形式邏輯、符號演算和線性思維天然的不足之處,這一不足之處正在于:符號思維難以超越其內生的邏輯悖論。
米歇爾仿照侯世達的做法,也在本書最后提出了6個問題——看上去都是人工智能領域亟待解決的問題,并嘗試給出了自己的回答。米歇爾的回答只是眾多可能答案中的一種,勇敢地面對這些基本問題并持續展開深入思考和交流的時代才剛剛開始。人工智能領域真正的挑戰在于:我們需要清醒地意識到,當下人工智能的發展動力,依然來自“舊世界的邏輯”。這一舊世界的邏輯的鮮明特征就是:將人機關系看作“主體世界”和“客體世界”這兩個可分離的世界。這種笛卡兒式的世界觀,雖然會被巧妙地轉化為“人機共生”的版本,但經過盎格魯-撒克遜文化的改造,加上新教倫理與資本主義的強力助推,導致工程師和CEO憧憬的未來是這樣的:當比賽終場的哨聲降臨,人們滿腦子想的都是輸贏。
需要看到的是,這種舊世界的世界觀屬于符號世界。人工智能底層思維的突破,關鍵可能就在于:超越這一舊世界的束縛,將婆羅門世界觀中的因明(3)思想與中國春秋戰國時期的名辯(4)思想以及古希臘的邏格斯(5)思想,在更大的框架下融合起來,這是一個偉大的挑戰。
在2020年疫情肆虐全球期間,湛廬的策劃編輯給我寄來米歇爾這本書的預讀本,并提出了4個有助于理解本書的問題。在編輯的鼓勵下,筆者嘗試把隱藏在本書背后的思想,用盡可能通俗的語言表述出來。米歇爾的著作有一條充滿探索精神的主線:第三波人工智能浪潮已經大大突破了前兩波人工智能浪潮在思想上的束縛,在哲學范式上捅開了一個突破口,不只是符號表征、計算問題,更多的是意義問題。那么符號演算、視覺處理以及機器學習將如何推動人工智能走向“覺醒”?這恐怕是人工智能領域的專業人士以及普羅大眾都非常關心的問題。這本《AI 3.0》的獨特魅力就在于:站在前沿,深度思考,超越技術。
在米歇爾的書中,這個被她稱作“侯世達的恐懼”的“硬核”挑戰,就在于人工智能競賽浪潮中最后的哨聲,可能真的會成為“最后的”,如果人們不能摒棄滿腦子輸贏的想法的話。
人工智能這個話題,亟待科學家、工程師和人文學者之間的深度交流,更需要不同文化的人們之間的深度交流。人工智能的興盛,不是吹口仙氣兒就能實現的事,讓等那一口仙氣兒的機器,再等等吧。
- Deep Learning Quick Reference
- 高性能混合信號ARM:ADuC7xxx原理與應用開發
- 控制與決策系統仿真
- Effective DevOps with AWS
- ROS機器人編程與SLAM算法解析指南
- AutoCAD 2012中文版繪圖設計高手速成
- Excel 2007技巧大全
- 工業機器人運動仿真編程實踐:基于Android和OpenGL
- The DevOps 2.1 Toolkit:Docker Swarm
- Building Google Cloud Platform Solutions
- 計算機應用基礎實訓·職業模塊
- Cloudera Hadoop大數據平臺實戰指南
- Arduino創意機器人入門:基于Mind+
- AVR單片機C語言程序設計實例精粹
- SQL語言與數據庫操作技術大全