- 巨浪:生成式AI的史詩與現實
- 裴培(互聯網怪盜團團長)
- 6075字
- 2025-08-19 17:43:34
第一章 AI之春:一部正在進行的史詩
從“深藍”到AlphaGo:兩種截然相反理念的斗爭
1997年5月11日,由IBM開發的超級電腦“深藍”擊敗了國際象棋世界冠軍加里·卡斯帕羅夫。這是人工智能第一次在國際象棋這樣復雜且流行的智力運動中擊敗最高水平的人類選手,所以理所當然地成為了全球性、爆炸性的新聞。當時還在讀初中的我,不僅在報紙上讀到了連篇累牘的報道,還在自己訂閱的《科幻世界》雜志上看到了好幾篇以“人工智能統治世界”為主題的小說——其中有一篇甚至直接提出,“深藍”擊敗卡斯帕羅夫是人工智能全面崛起的標志性事件。
斗轉星移,轉眼間到了2016年3月15日,由谷歌開發的AI機器人AlphaGo擊敗了圍棋世界冠軍李世石,摘下了這顆最復雜、最考驗大局觀、一度被認為不可能由AI攻克的“智力運動皇冠上的明珠”。對于非專業人士而言,“AlphaGo擊敗李世石”和當年的“深藍擊敗卡斯帕羅夫”,這兩件事情是一脈相承的,對應的無非是技術的自然演進、AI應用復雜度的提升。然而,在專業人士看來,上面兩件事情完全不可同日而語:“深藍”所代表的是上個時代的、已經被拋棄的技術路線,可以稱為人工智能發展史上的“一條死胡同”;AlphaGo所代表的則是2012年以來蓬勃發展的新技術路線,今天流行的大語言模型以及自動駕駛等AI應用,都是這條路線演進的結果。
因此,開發出“深藍”的IBM,未能在21世紀保持“人工智能王者”的地位,在當代人工智能產業中的地位已經相當薄弱。而開發出AlphaGo的谷歌,雖然在大語言模型方面落后于OpenAI,讓資本市場頗為不滿,但仍然是人工智能產業的領軍者之一,其基礎研發和應用實力不容小視。如果有人要寫一部生成式AI的技術演進史,他可以完全不提IBM的名字(或者只在腳注里面提一下),而谷歌是一定要占據相當大的篇幅的。
“深藍”和AlphaGo的技術理念究竟有什么區別?在討論這個問題前,我們不妨先討論一個哲學問題:人類知識的來源是什么?或者說,人類是怎么學習知識、認識世界的?
在17~18世紀的歐洲哲學界,“人類知識的來源”是一個熱門話題,主流觀點有兩種:一種是唯理論(Rationalism),認為人類知識源于某些“公理”,通過這些“公理”可以推導出更多的知識,直至建立一個完整的知識體系。另一種是經驗論(Empiricism),認為人類知識是來自感性經驗,一切真理都是來自對經驗的總結與揚棄,所謂“公理”也是基于大量經驗的。
接受過現代教育的人,大部分應該更認同經驗論,畢竟我們的知識都是來自對現實的學習,無論是發生在課堂之內還是課堂之外。有誰能坐在屋子里面壁思考出整個客觀世界的規律呢?然而,在數學領域,唯理論具備相當的合理性,最典型的例子就是幾何學。
歐幾里得的整套《幾何原本》是基于5個公理,由此推導出了465個命題,從而建立了人類的第一個“公理化體系”。有趣的是,歐幾里得的第五公理(平行公理)比前4個公理更復雜,在歷史上一直有人質疑其“公理性”。后世的數學家果然通過推翻第五公理,建立了龐大的非歐幾何體系,而愛因斯坦的廣義相對論正是基于非歐幾何理論的(準確地說,是基于非歐幾何的一個分支——黎曼幾何)。直到今天,仍然有大批數學家和哲學家認為,數學在本質上是一系列抽象的“公理化體系”,不一定與人類的感性經驗相關。
人類歷史上的第一個公理化體系:歐幾里得平面幾何5大公理

在哲學史上,唯理論和經驗論之間的沖突可以說已經被18世紀末的德國哲學家伊曼努爾·康德所基本解決了。康德認為,人類的所有知識毫無疑問都來自經驗,但是人類之所以能把經驗化為知識,是因為人類具備“先天綜合判斷”的能力,即某種先于經驗、超越感官、可以從具體經驗中總結出抽象真理的判斷力。例如,人類看到蘋果成熟之后往下落,這是經驗;但是,從“蘋果會往下落”的經驗推斷出“萬有引力定律”,就要用到所謂“先天綜合判斷”了。當然,在康德之后的兩百多年中,歷代哲學家、心理學家、腦科學家又對人類知識的來源進行了更深入的研究,其深度和廣度均遠遠超過了當年的康德,在此就不贅述了。
看到這里,有些心急的讀者可能會抗議:“17~18世紀的歐洲哲學史,與本書的主題究竟有何關系?”關系很大!人工智能,是由人類創造出來的“智能”,它理所當然應該具備知識,那么它的知識是從哪里來的呢?自從1956年約翰·麥卡錫與一眾科學家在達特茅斯會議上提出人工智能這個概念以來,關于上述問題的爭議就沒有停止過。絕大部分科研人員對這個問題的看法,均可以歸結為下列兩大類之一。
1.由人類教給計算機一套理論體系,或曰“知識圖譜”。計算機可以通過這套體系,按照人類設定的邏輯,自我推論出更復雜、更詳細的知識。在這種情況下,人工智能所做的一切判斷,都是人類可以理解和追溯的。在學術界,這種觀點一般被稱為“符號主義”,因為它在本質上是把知識以人類所能理解的符號(自然語言、程序等)形式灌輸給了計算機。
2.由人類提供給計算機大量知識素材,讓它根據一定的統計算法去自行學習、總結出知識。在這個過程中,人類可以提供指導,也可以不提供。人類可以檢驗和利用計算機所總結出的知識,但是無法理解其學習的具體過程(或者只能粗略地理解)——這就是所謂的“機器學習”。在此過程中,機器可能得出人類此前不具備的知識。
我們不妨回憶一下自己學習英語的歷程。對于任何一門外語,都存在兩種主流的學習方法:第一種是由老師把詞法、語法、習慣用法歸納為知識點并在課堂上傳授,學生把這些知識點記下來,在考試中投入使用;這種方法對應著人工智能中的“符號主義”。第二種是讓學生自己閱讀、聽寫大量外文資料,產生所謂“語感”,在考試的時候根據“語感”行事即可;這種方法對應著人工智能中的“機器學習”。在實踐中,稱職的英語老師一般是雙管齊下,一邊讓學生自己積累“語感”,一邊不失時機地幫助學生總結規律。如果條件允許,學生接觸的英語資料越多,效果當然越好,打下的基礎也越穩固。但是由于時間等因素的制約,大部分學生還是高度依賴老師灌輸的“知識圖譜”,乃至在考前通過死記硬背謀求高分。
“深藍”就是符號主義人工智能的一座豐碑。它起源于美國卡內基·梅隆大學開發的國際象棋電腦“深思”,那是人類歷史上第一個達到特級大師棋力的國際象棋AI。1989年,IBM雇用了“深思”的核心研發人員,以此為基礎組建了“深藍”團隊。經過長達七年的開發,到了1996年,“深藍”已經成長為一部具備32個Power PC處理器,以及480張專門為國際象棋運算定制的芯片的超級電腦,每秒能夠計算1億步;到了1997年擊敗卡斯帕羅夫的那一戰前夕,“深藍”的系統又得到了一次提升,每秒能夠計算2億步。硬件算力只是基礎,關鍵在于軟件層面:“深藍”是如何理解棋局并做出決策的?完全是依靠人類事先設定的規則。

1997年版“深藍”使用過的一個Power PC處理器,現藏于美國硅谷的電腦歷史博物館
首先,IBM的工程師為“深藍”編寫了一個基本的評價體系,其中包含大量參數。例如,不同的棋子的價值如何比較?同樣一個棋子處在棋盤中央時,與處在棋盤邊緣時相比,價值有何變化?為了保護國王的安全,值得付出多大的代價?這些參數指標,都是由開發人員(其中也包括國際象棋專業人士)在分析了上萬局國際象棋對局之后,人為決定的。“深藍”的評價體系最終演化為了一個包含8000個部分的龐然大物,所有可能出現的特殊局面都被寫進了程序里——這可能是到當時為止,人類為國際象棋所繪制的最全面的“知識圖譜”。
與此同時,“深藍”至少包含了三個對局數據庫:開局數據庫,包括至少4000種開局套路;殘局數據庫,包括所有可能出現的少于或等于五個棋子的殘局,以及一部分六個棋子的經典殘局;延伸數據庫,包括一些特級大師下過的名局的全局數據。在與人類對局的時候,“深藍”從開局起就利用自身算力在上述數據庫中進行搜索,根據自己的評價體系選擇在當時勝率最高的下法,如此反復,直到棋局完成。在與卡斯帕羅夫對戰前,IBM還根據他的棋風,對“深藍”的數據庫進行了特別調整。
1996年2月,“深藍”與卡斯帕羅夫在美國費城進行六局對戰,結果以2比4的總比分輸掉了。算上1988年“深藍”的前身“深思”挑戰卡斯帕羅夫失敗,這已經是卡斯帕羅夫第二次擊敗最先進的國際象棋超級電腦了。IBM在對“深藍”進行全面升級和針對性調整之后,于1997年5月再次發起挑戰,這一次終于以3.5比2.5的總比分取得勝利。然而,很多人都忽略了,“深藍”的勝利帶有一些嚴重缺陷,可以說“勝之不武”。
◆ 在兩次比賽之前,卡斯帕羅夫均提出希望學習“深藍”下過的棋譜,但是IBM兩次均予以拒絕。在對對手毫無了解的情況下,卡斯帕羅夫只得與市面上流行的商用國際象棋軟件對弈以熟悉電腦的棋風,這樣的準備顯然談不上充分。
◆ “深藍”不但在對弈開始前就針對卡斯帕羅夫調整了數據庫,而且在每局對弈之前都會在人類棋手的指導之下再次調整數據庫和參數。雖然人類棋手沒有直接幫助“深藍”下棋,但他們給予的幫助相當重要。與其說這是“人類vs電腦”,不如說是“‘人類+電腦’vs卡斯帕羅夫”。
◆ 在1997年5月的對弈中,由于一個程序Bug,“深藍”在第一局的第44步做出了一個罕見的下法。這本來是出于隨機,卻被卡斯帕羅夫誤以為電腦已經產生了某種超越人類的創造力,從而背上了沉重的心理包袱。這個插曲很可能影響了勝負。

深藍vs卡斯帕羅夫,1997年5月第六戰的最終局面:深藍執白,卡斯帕羅夫執黑,在僅僅19手之后,后者就認輸了,創下這一系列比賽的最短紀錄
無論如何,“深藍”擊敗卡斯帕羅夫還是引發了媒體和資本市場的一陣狂歡。在比賽之后的一個星期內,IBM的市值累計上漲了114億美元。投資者樂觀地估計,“深藍”將開啟一個人工智能大規模商用的黃金時代——國際象棋已經被征服了,那么下一個被征服的領域又會是什么呢?
很遺憾,什么都不是,什么都沒有。“深藍”不是AI黃金時代的開拓者,而是符號主義AI發展到尾聲的象征。它無法承擔除了國際象棋之外的任何使命,哪怕在國際象棋領域,如果要與卡斯帕羅夫之外的特級大師對弈,它也需要重新調整數據庫。“深藍”的每一行代碼都是由人類主動輸入的,這就意味著它其實沒有自主學習的能力。假設IBM想要攻克另一種智力游戲,例如中國象棋或圍棋,那它就要從頭開始組建一個全新的團隊,再砸上幾年時間和幾千萬美元。更可悲的是,像圍棋這樣的智力活動實在過于復雜,無法以“人工評價體系+數據庫”的技術路線去征服。所以,圍棋作為人類智慧的驕傲,又堅持了長達十九年,才被谷歌AlphaGo以機器學習的技術路線攻克了。
那么問題來了:為什么當時的IBM沒有擁抱機器學習?其實這是一個偽命題,IBM本身就是機器學習的先驅者,它未能在這個方向上取得突破,主要是出于時代的局限性。機器學習不是什么新概念,早在計算機誕生之初就已經被學術界提出了。1952年,人工智能研究領域的先驅人物亞瑟·薩繆爾就在IBM的實驗室里開發出了第一款應用了深度學習理論的跳棋程序;20世紀60年代,雷神公司基于機器學習技術為美國軍方開發了聲吶分析程序。20世紀80年代初,神經網絡的概念已經被學術界比較清晰地建立起來了,它將在三十多年后引導一次史無前例的人工智能革命——但是在此之前,它還得忍受長達三十年的寂寞。
機器學習需要高效的算力和龐大的存儲空間,這對于早期的計算機而言是難以實現的。哪怕到了20世紀90年代,計算機硬件的發展仍然難以支持機器學習的需求。“深藍”配備的32個Power PC處理器、480張定制芯片,以當時的標準已經堪稱豪華,可是放到今天就只能以孱弱不堪來形容了。
而且,對海量數據進行機器學習所需要的分布式計算、虛擬化和云計算技術,直到21世紀才初逐漸投入使用。回頭去翻閱1980—2000年的人工智能學科論文,我們會發現,在算力和存儲能力有限的條件下,機器學習的主要技術路線是“知識驅動型”:先由人類總結出一套知識圖譜,計算機以知識圖譜為學習對象。這與后世基于大量原始數據的“數據驅動型”路線相比,簡直大相徑庭。
因此,我們可以理解,為何整個20世紀90年代以及21世紀的前十年,被后世學術界視為一個漫長的“AI寒冬期”:符號主義已經達到了它的天然上限,“深藍”就是達到上限的標志;而“知識驅動型”的機器學習,在本質上是符號主義與機器學習的調和,上限也不可能很高。世界上有的是比國際象棋更復雜的問題,而且大部分問題都不像國際象棋那樣信息對稱、一目了然。對這些問題繪制“知識圖譜”,即便在理論上存在可能性,在現實中也不具備可操作性。在“深藍”引發的狂熱討論結束之后,資本市場和媒體對人工智能失去了興趣,就連學術界的熱情也大幅降低。在廣闊的計算機科學領域,存在太多話題、太多值得開拓的賽道,誰會熱衷于在人工智能這一棵樹上吊死?
作為整個20世紀人工智能研究的領軍者,IBM并未放棄嘗試。從2005年開始,IBM決定押注于自然語義識別,其初步目標是在電視問答游戲當中擊敗人類選手。這個研發項目被命名為Watson,那是IBM第一任和第二任CEO的姓氏。經過四年多的研發,到了2010年,Watson已經具備了在美國最熱門的電視問答節目《危險邊緣》(Jeopardy!)當中擊敗人類選手的能力。2011年2月,它在公開的電視節目當中擊敗了全部人類對手,獲得冠軍,由此再次引發了外界對人工智能的興趣(盡管這一次享受的媒體熱度遠不如當年的“深藍”)。

2010年,IBM Watson在《危險邊緣》特別節目中擊敗了該節目歷史上最成功的兩個人類選手
IBM試圖趁熱打鐵,將Watson應用于醫學、教育、烹飪等領域,甚至專門成立了一個Watson醫療事業部。遺憾的是,Watson從一開始就注定了命途多舛,因為它采取的是一種拙劣的、過時的技術路線:本質上仍然是知識圖譜,由人類向其數據庫灌輸大量的、系統的“知識”,然后根據問題在這些“知識”當中搜索結果,它也包含一些機器學習成分,但仍然是以“知識驅動型”的機器學習為主。通俗地說,Watson是在符號主義的骨架之上披了一件機器學習的外衣,并且努力彌合外衣和骨架之間的縫隙。IBM采取上述拼湊式技術路線是可以理解的:它在符號主義時代的歷史包袱太重,不愿放棄;而在機器學習技術上,它又不是領先者,相對于冉冉升起的谷歌沒有任何優勢。
當然,在一開始,IBM Watson似乎是有成功希望的。憑借自身強大的品牌號召力和銷售能力,IBM把Watson推銷給了大批醫院,用于癌癥這種最復雜、最高風險的病癥治療。但是,從“事后諸葛亮”的角度看,IBM的整個人工智能技術路線,在2012年9月30日就被歷史判了死刑。就在那一天,由加拿大多倫多大學的三位科學家開發的AlexNet,在著名的ImageNet大規模視覺識別挑戰賽上,取得了歷史最低的錯誤率,而且遠遠低于第二名的水平。后世的科學家和歷史學家必將把這一事件視為“AI春天”的開始,因為它至少產生了兩個意義深遠的結果。
1.AlexNet證明了神經網絡的重大意義,此后幾乎所有的人工智能研發都是沿著以神經網絡為基礎的深度學習(Deep Learning)路線前進。符號主義和知識圖譜的思路幾乎被徹底拋棄了,“數據驅動型”路線徹底獲勝,數據的數量和質量成為人工智能研發的焦點。
2.在AlexNet的研發團隊中,有一位名為伊利亞·蘇茨克維的博士生(當時尚未畢業),日后他將成為OpenAI的聯合創始人和首席科學家,并于2022年11月點燃ChatGPT之火,從而徹底改寫人工智能(以及整個人類社會)的發展史。
站在使用角度,一個人工智能專業的研究者,完全可以不考慮2012年9月30日以前發生的一切事情,就當它們不存在。因為當代AI尤其是生成式AI的主流技術路線完全發源于那個時間節點,“新天新地”就此降臨,此前的一切都被顛覆了。
“傳說結束了,歷史剛剛開始。”