- 巴拉巴西網絡科學
- (美)艾伯特-拉斯洛·巴拉巴西
- 12497字
- 2020-02-17 14:05:43
I.1 曲折之路
如今,每年有十余個學術會議、研討會和講習班在關注網絡,有百余本書及多本重點期刊專注于網絡領域,大部分大學開設了網絡科學課程,有三個大洲的大學設置了網絡科學博士學位,科研資助機構也在網絡領域投入了數億美元的經費。看到這些,人們不禁會想,這個僅出現十余年的領域真可謂一帆風順。不過,受此種效應的影響,我們可能會忽略一個最耐人尋味的問題:網絡領域是如何成長得這么快的?
我把這一章視為我的科學發現旅程,原因其實很簡單:我并沒有打算對上述問題提供一個無偏見的回答,而是希望從一個參與者的角度去回憶網絡科學的興起。我恰好是最了解這個參與者的人,因為“他”就是我。我想回憶的并不是什么勝利大游行,相反,我經歷的是一場曲折坎坷的旅行,一場充滿挫折、矛盾和沖突的旅行。這一章也不是什么全貌圖,而是主要關注我在穿越網絡科學的“森林”時,反復碰到的那些令人難以忘記的“樹”。需要提醒大家的是,科學發現絕不像教科書中描述的那樣直觀和自然,而是像接下來幾頁里你將看到的那樣充滿曲折。
我的首篇關于網絡的論文(1994年)
我對網絡的著迷始于1994年,即我在IBM傳奇之地——沃森研究中心做短期博士后的那幾個月。考慮到假期即將來臨——假期期間不能留在IBM,我決定利用這段時間更多地去了解我的雇主(當時,IBM幾乎就是計算機的代名詞)。于是我去了沃森圖書館,尋找關于計算機科學的入門書籍。
懷著對計算機領域科學問題的好奇心,我從沃森圖書館借閱了一本書。這本書涵蓋了很多內容,包括算法、布爾邏輯(Boolean Logic)和NP-完全性(NP-completeness)。我對書中講述最小生成樹問題的一章特別感興趣。我發現,書中介紹的克魯斯卡爾(Kruskal)算法很好地對應了統計物理學領域的著名模型——侵入滲流。于是,在圣誕節過去的兩個月后,也就是1995年2月24日,我的第一篇關于網絡的論文在《物理評論快報》(Physical Review Letters)上發表了[1]。該論文闡述了物理學和計算機科學領域中這兩個廣泛研究的網絡問題之間的等價性(圖I-1)。在如此有影響力的物理期刊上發表一篇單作者論文對于我的學術生涯來說無疑是重要的,不過這一舉措的真正影響遠不止于此:這篇論文打開了我對網絡科學研究的熱情之門,奠定了我隨后數十年對網絡熱愛的基礎。

圖I-1 1994—1995:我在網絡領域的首次嘗試
我在1994年的寒假構思出了第一篇關于網絡的論文,將計算機科學領域著名的最小生成樹問題和統計物理學領域廣泛研究的侵入滲流關聯在一起。這標志著我對網絡科學長期追求的開始。
失敗1:第二篇論文(1995年)
學得越多,我越覺得自己對真實網絡知之甚少。居住在紐約市的我,想象著曼哈頓地下鋪設的數百萬條電線、電話線和光纜線到底有多么復雜。圖論告訴我們,這些網絡中的節點是隨機連接的,然而我并不這么認為。我堅信,一定有某些組織原則在支配著我們日常生活中使用的網絡。尋找這些組織原則恰好是統計物理學家的拿手好戲,畢竟他們經訓練而成的思維方式就游弋在有序和隨機的邊界。
隨后的幾個月里,我閱讀了貝拉·波羅巴斯(Béla Bollobás)關于圖論的優秀著作[2],這使我接觸到了保羅·埃爾德什(Paul Erd?s)和阿爾弗雷德·雷尼(Alfréd Rényi)在圖論方面的經典工作[3]。與此同時,斯圖爾特·考夫曼(Stuart Kaufmann)富有遠見的作品使我意識到網絡對于生物領域的重要性[4]。在這些書籍中,兩種截然不同的視角碰撞在了一起:一邊是由定理驅動的枯燥的數學世界,一邊是考夫曼那種不受數學羈絆的肆意想象(圖I-2)。

圖I-2 1995:有序,還是隨機?
這三本書中的兩本啟發我開啟了網絡科學之旅。我現在想不起來第一本書的標題或副標題了,這本我在1994年從IBM沃森研究中心圖書館借閱的書好像是叫“計算機科學的50個問題”。
在博士后崗位上工作了8個月后,我接受了美國圣母大學(University of Notre Dame)提供的教職,這使我在IBM余下的4個月內可以專注地完成我的第二篇關于網絡的論文。這篇題為《隨機網絡動力學:連通性和一階相變》[5]的論文,是我探究網絡拓撲結構的首次嘗試。該論文將波羅巴斯的世界和考夫曼的世界結合在一起,探索了網絡結構的改變會如何影響布爾系統的演變(圖I-3)。論文背后的觀察非常簡單:改變隨機網絡的平均度,布爾系統將經歷一次相變。因此,如果不能完全理解網絡的結構,你就無法解釋布爾系統的行為。

圖I-3 1995—1997:一直沒有發表的網絡論文
這是我在網絡科學領域的第二次嘗試,也是我探究網絡拓撲作用的首篇論文。在被4個期刊拒稿后,這篇論文于1995年11月出現在Arxiv的在線服務器上。我最終放棄了將其發表在期刊上的想法。
這篇論文受到了很多想法的啟發,這些想法源于蜂窩網、互聯網和萬維網。然而,我過去發表論文的物理期刊幾乎不涉及此類研究。因此,我努力嘗試,去尋找上述發現在我所在領域中的應用。最終,我決定把我的發現應用于神經網絡——物理學家經常研究的一個主題。在我看來,關注神經網絡的物理學家應該會認可網絡的重要性。然而,我錯了。這次決定標志著隨后4年間我的網絡科學之旅中一系列失敗的開始。
1995年11月10日,我將完成的論文投稿到《科學》雜志,之后便回到波士頓參加美國材料研究學會的年度會議。在那里,我碰到了《自然》雜志的編輯菲利普·鮑爾(Philipp Ball),他對交叉學科很感興趣。我有幸向他介紹了那時令我非常著迷的新研究對象——網絡。于是,當我的論文在幾周后被《科學》雜志拒稿時,我將它發給了菲利普,希望《自然》雜志會對它感興趣。的確如此,論文被送審了。
不過,論文的評審人對網絡并不那么著迷。其中一位評審人在他的評審意見中坦率地寫道:
1.論文的研究動機不清晰;
2.技術上很受限;
3.關于演化和互聯網的推測不切實際。
當然,這位評審人是正確的:論文中沒有解釋為什么我們需要關注網絡。答案都在我腦子里,但由于我博士畢業不過一年,僅僅靠4年前讀博士時才開始學習的英語,實在是難以把腦中的想法通過文字變成故事。
我很失望,并于1996年4月25日將該論文再次投稿到《物理評論快報》——結果并沒有好多少,論文經過漫長的評審過程之后再次被拒收。1997年11月21日,在首次投稿兩年后,我又把該論文投稿到《歐洲物理快報》(Europhysics Letters)。那時候,我的網絡科學之旅的第二個重大失敗已經開始了。
失敗2:繪制萬維網地圖
當我為第二篇論文的發表而付出艱苦努力時,我開始感覺到,要想繼續前進,就需要放棄我一直使用的圖論,而應該做物理學家擅長的事情:從真實世界中尋找靈感。也就是說,我需要地圖——確切地說是真實網絡的地圖。
在蒂姆·伯納斯-李(Tim Berners-Lee)開放萬維網5年后,也就是谷歌創立的兩年前,那時的萬維網還處于成長期。許多在實驗室中開發出來的搜索引擎,譬如JumpStation、RBSE Spider或Webcrawler,開始嘗試繪制萬維網鏈接結構的地圖。1996年2月,我向一些運行此類網絡爬蟲工具的研究人員發送了郵件(圖I-4),希望他們能夠提供部分數據——當然,最好是有完整的地圖,哪怕沒有這樣的地圖,能夠知道每個節點擁有多少個鏈接也足夠了。“我希望使用這些數據繪制一個直方圖。”我寫道。我希望得到這個在三年之后被我們稱為“萬維網的度分布”的直方圖。

圖I-4 1996:尋求數據
這是我尋求數據時發出的一封郵件。郵件發給了一些在20世紀90年代搭建網絡爬蟲的計算機科學家,我希望他們能夠共享一些關于萬維網拓撲的數據。回過頭來看,這并不是一封非常有說服力的郵件,沒有人回復也就不足為奇了。我不得不再等兩年,直到鄭浩雄(Hawoong Jeong)加入我的實驗室并搭建了我們自己的網絡爬蟲。這個網絡爬蟲收集到的數據讓我們發現了無標度網絡。如果能夠像我希望的那樣,在1996年就得到這些數據,我們可能會提前三年發現無標度網絡。
沒有人說“不”。實際上,沒有人顧得上答復我。就在等待回復的時候,我的第二篇論文遭遇了最后一擊——它被《歐洲物理快報》拒稿了。
到那時為止,我的網絡之旅可謂非常讓人失望。我的第二篇關于網絡的論文向4個期刊投稿,經過了三輪評審。沒有人說它是錯誤的,評審人的意見很簡單:誰關心網絡呢?那時候,我打算獲取真實數據的“B計劃”也進入了死胡同。我感到失望,同時也承受著發表論文和申請經費的壓力,于是,我逐漸開始從網絡轉向相對穩妥些的量子點方面的研究。
我真的是別無選擇。成為助理教授兩年后,我的首項經費資助才姍姍來遲,要成為終身教授更是前景渺茫。雖然我是那么相信網絡,過去三年里拿得出手的也只有一篇論文和一系列的失敗罷了。不過,轉向更傳統的研究課題讓我得到了回報:到1997年年底,我得到了兩項經費資助,這使我可以雇用幾個學生和一個博士后了。
復興(1998年)
1997年,我居住在芝加哥,每隔一天去一趟圣母大學。為了打發無聊的兩個小時車程,我開始聽一些書的磁帶。有一天,我在圖書館看到一本童年時讀過的書——艾薩克·阿西莫夫的《基地》(圖I-5)。瀏覽這本書時,我被哈里·謝頓(Harry Seldon)能夠預測數百年后人類命運的能力深深吸引了。

圖I-5 1997:復興
阿西莫夫的科幻小說《基地》三部曲促使我重返網絡科學領域。
《基地》是一本極好的科幻小說:非常有趣,描述的未來遙不可及,但從某種抽象角度來看又是合理的。
連接圣母大學和芝加哥市的90號公路兩側是大片的玉米地,這使我能夠打開思緒,思考很多荒誕的問題:怎樣才能把阿西莫夫的科幻世界變成現實?是否可以設計出一些方程,從而對社會這樣復雜的系統進行預測呢?為了達到這個目標,我能做些什么?在我關于量子點的研究進行得有聲有色時,阿西莫夫把我的思考拉回到那些讓我經歷了很多挫折卻從未失去興趣的事物上——網絡和復雜系統。
1998年年初,我打算再試一次。我規劃了一個與網絡相關的新研究項目,于3月在圣母大學最好的餐廳邀請了我的學生雷卡·阿爾伯特(Réka Albert)共進午餐。雷卡那時攻讀碩士學位剛滿一年半,但成績斐然。她關于顆粒介質的論文剛剛成了《自然》雜志的封面文章,而她正在進行的研究項目的初步結果看上去也非常好。因此,我邀請她共進午餐的目的看起來很不現實:我希望說服雷卡放棄她幾乎就要成功的研究,我想讓她和我一起研究網絡。
當我讓我最好的學生加入這場網絡之旅時,我沒有什么鼓勵的話可以對她講。我不得不告訴她,我關于網絡的第二篇論文被4個期刊拒稿,可能永遠都無法發表。網絡這個研究題目在當時沒有學術群體,沒有專業期刊,也沒有資助。我必須坦誠地對她說,似乎并沒有人關心這個研究題目。因此,從事網絡研究有很大的風險,可能會讓她之前的成功之路戛然而止。
然而,我同時也告訴雷卡,成功必須經歷風險。而且在我看來,網絡值得賭一次。
午餐后,我把一個密密麻麻寫滿字的文檔交給了雷卡,上面寫的是我對網絡科學的構思。我設想,大概需要6個月時間量化網絡拓撲,接下來還需要6個月去理解網絡拓撲對網絡動力學的影響。然后,我們便可以轉向真實的問題,探索網絡拓撲和網絡動力學的共同演化。
當然,我心里完全沒譜:我無法預見拓撲所能提供的重要意義。不過,那不是當時的重點,重要的是她平靜而優雅的回應——雷卡同意了,她加入了我前途未卜的網絡之旅。
失敗3:小世界(1998年)
1999年之前,那些研究網絡的科學家幾乎毫無交集,時至今日我仍然百思不得其解。一部分原因是,當時存在著一個小而活躍的社會網絡學術群體,該群體的形成可以追溯到20世紀40年代。實際上,我們今天關于小世界問題所知道的很多東西來自1960年左右的一篇鮮為人知的論文,該論文的作者是社會學家伊錫爾·德索拉·普爾(Ithiel de Sola Pool)和數學家曼弗雷德·科亨(Manfred Kochen)。雖然這篇論文在1978年之前一直沒有發表[6],它的預印版卻在社會網絡學術群體中流傳甚廣,并且啟發了斯坦利·米爾格拉姆(Stanley Milgram)在1967年完成小世界實驗[7]。而米爾格拉姆的工作在1/4個世紀后又啟發了劇作家約翰·格爾(John Guare)創造出“六度分隔”這個概念。
普爾和科亨所采用的模型,與同一時期的圖論學家埃爾德什和雷尼提出的模型一樣。但是,在社會學的論文中,沒有任何證據表明社會學家知道當時出現的關于隨機圖的大量數學文獻。另外,埃爾德什和雷尼的開創性工作雖然啟發了很多隨機圖方面的工作,但是圖論領域沒有人知道社會網絡學術群體的存在,他們關于小世界的研究成果也沒被引用過。
這兩個學科之間的界限集中體現在兩個學術群體所關注的問題不同:圖論學家關心的是相變、子圖和巨連通分支,而令社會學家著迷的則是小世界、弱鏈接和社區。對社會學家而言,擁有一百個節點的網絡便難以理解了,而令數學家興奮的是節點數趨于無窮大時的極限情況。
1998年,當鄧肯·瓦茨(Duncan Watts)和史蒂夫·斯托加茨(Steven Strogatz)關于小世界網絡的論文[8]在《自然》雜志上發表時,我首先想到的就是我第二篇關于網絡的論文在該雜志上發表失敗的嘗試。在閱讀他們這篇論文時,我發現自己那篇論文失敗的原因顯而易見,讓人惱火:我犯了一個“取景錯誤”。兩篇論文都采用了隨機網絡范式。但是,我問的問題是物理學家感興趣的,而論文定位的對象卻是神經科學家。相反,瓦茨和斯托加茨問的問題根源于社會學,六度分隔為他們的稿件做了很好的敘述鋪墊。
同時,小世界模型對于我和雷卡那時正在研究的問題而言似乎是一個終結。作為物理學家,我們關注的是不能由隨機性產生的模式。因此,我們當時正在尋找真實網絡中存在而那些固態物理學廣泛研究的規則網絡和埃爾德什與雷尼的純隨機網絡不能刻畫的現象。瓦茨-斯托加茨模型介于規則網絡和隨機網絡之間,而規則網絡和隨機網絡正是我們試圖規避的兩個極端。因此,我們把他們這篇論文放在一邊,將其視為行進道路上的干擾。僅僅幾個月后,當我們意識到小世界可以為我們的網絡之旅提供一些意想不到的幫助時,我再次拿出了這篇論文。
繪制網絡地圖(1998年)
1998年,當鄭浩雄以博士后身份加入我的研究組時,雷卡和我已深深沉浸在網絡研究中。畢業于韓國著名大學——首爾大學的鄭浩雄有著豐富的計算機方面的知識。1998年秋天的一個晚上,我來到他的辦公室,與他討論他在量子點方面的研究進展——那時候他的主要研究項目是量子點。我們不經意間談到了網絡,這促使我向他講述了我獲取萬維網真實拓撲數據時的失敗經歷。我問他是否知道如何搭建一個網絡爬蟲——網頁采集器的通俗說法。鄭浩雄說他之前沒有做過,但愿意試一下。就這樣,幾周后,鄭浩雄的網絡爬蟲就開始忙著爬進萬維網了。我那曾經失敗的探索萬維網結構的“B計劃”復興了。
我們決定使用鄭浩雄收集到的數據來延續我在1996年擱置的研究(圖I-4),測量萬維網的度分布。我們被一個簡單的問題驅動:萬維網到達它的逾滲閾值了嗎?埃爾德什和雷尼預言,當網絡的鏈接密度小于某個臨界值時,網絡會破碎成很多個彼此不連通的團。而一旦鏈接密度達到臨界閾值,網絡中會涌現出一個巨連通分支,該連通分支大到幾乎可以將其視為整個網絡。
萬維網還能被分裂成許多彼此不連通的部分嗎?還是像當時人們所認為的那樣已經連成一個大網絡了?無論答案是什么,這個問題都非常有趣。為了回答這個問題,我們需要知道萬維網的度分布。現在,鄭浩雄的網絡爬蟲可以幫助我們做到這一點。當從鄭浩雄收集的數據中繪制出萬維網的度分布時,我們著實吃了一驚:我們沒有看到隨機網絡理論所預言的泊松分布,出現在眼前的是一個冪律分布。
鄭浩雄的數據展示出的結果和我在過去4年的網絡之旅中學到的一切大相徑庭。在有關網絡的各類文獻中,冪律度分布并沒有被提及過。實際上,在那個時候,幾乎沒有人注意到冪律度分布:關于隨機圖和社會網絡的文獻都想當然地認為度分布是泊松分布。我們觀測到的冪律分布預測,萬維網中存在樞紐節點——樞紐節點是擁有大量鏈接的節點,它們在隨機圖中幾乎不可能出現。當時已有的模型都無法解釋樞紐節點的出現。
1999年3月30日是我的32歲生日,那天,我給鄭浩雄發了一封郵件,告訴他我要開始撰寫我的第三篇網絡論文。一個很容易想到的寫法是專注于真實發現,這很簡單:萬維網代表著一種新型的網絡,一種之前人們尚未認識到的組織形式。不過,我隱隱感覺到,這樣寫會是一個錯誤。那時候,我已經開始認為,我的第二篇網絡論文的失敗與科學沒有多少關系,而是因為前面提到的“取景錯誤”。如果專注于本質,觀測的科學價值就顯得過于枯燥,不可能會引起《自然》雜志編輯們的興趣。于是,我決定嘗試特洛伊木馬的方式:把這個發現藏在六度分隔的后面。我們給這篇論文起名為“萬維網的直徑”,聲稱萬維網中的六度分隔實際上是“十九度分隔”(圖I-6),然后就把論文寄給了《自然》雜志[9]。

圖I-6 1999:“十九度分隔”團隊
照片來自2000年的《商業2.0》雜志。照片上的人是雷卡·阿爾伯特、鄭浩雄和我,照片是在我們關于萬維網拓撲的論文發表不久后拍攝的。
發現(1999年)
論文提交后不久,我赴西班牙和葡萄牙進行了為期兩周的長途旅行,旅行的最后一站是一個在波爾圖大學召開的研討會。駕車穿越伊比利亞半島時,我的腦海里一直縈繞著這樣的問題:為什么會有樞紐節點呢?為什么是冪律分布呢?
為了弄清楚是什么使萬維網如此特別,我們需要了解更多的網絡。因此,在飛往歐洲之前,我開始嘗試尋找更多的網絡地圖。第一幅網絡地圖來自杰伊·布羅克曼(Jay Brockman)。布羅克曼是圣母大學的一位計算機科學教授,他向我們提供了一個IBM生產的計算機芯片的布線圖。鄧肯·瓦茨給了我們一個電網的地圖,布雷特·查登(Brett Tjaden)向我們分享了好萊塢演員數據庫。我把這些都留給了雷卡,讓她在我旅行這段時間內分析一下這些網絡地圖。
1999年6月14日,雷卡通過電子郵件向我匯報了她的分析結果,那時候我已經在波爾圖了。在電子郵件的最后,她寫下了這樣一行文字:“我查看了這些網絡的度分布,在幾乎所有這些系統中,度分布的尾部都遵循著冪律分布。”
雷卡的這句話就像晴天霹靂一樣。我再也不能專心地聽報告了,腦海里開始不停地思考這個發現的內涵。差異很大的萬維網和好萊塢演員網絡,居然具有同樣的冪律分布,我們之前在萬維網上看到的冪律分布居然是普遍的。因此,冪律分布的出現一定是由于某個法則或機制在起作用。而且,既然冪律分布適用于演員網絡、計算機芯片網絡和萬維網等不同類型的網絡,關于它如何出現的解釋一定是非常簡單和基本的。
我需要一個安靜的地方來仔細思考。于是,我離開研討會,回到我在會議期間居住的神學院。
不過,我沒有走太遠。就在從波爾圖大學步行到神學院的15分鐘內,我找到了解釋。我在房間內開始計算,試圖將自己的想法變成數學語言。然后,我發送了一個傳真給雷卡,讓她做一些數值模擬,以驗證我快速想到的這個結論(圖I-7)。

圖I-7 “無標度”傳真
這是我于1999年6月14日從葡萄牙波爾圖發給雷卡·阿爾伯特的傳真。這條匈牙利語和英語混雜的傳真描述了如今被稱為“巴拉巴西-阿爾伯特模型”的算法。該模型解釋了無標度網絡形成的原因,并勾勒出了計算度指數的連續介質理論(第4章)。
幾個小時后,她的回復通過電子郵件發過來了。令我感到吃驚的是,我的結論居然可行。一個非常簡單的模型,只含有兩個要素——生長和偏好連接,卻很好地解釋了我們在萬維網和好萊塢演員網絡中觀測到的冪律分布。
匆忙(1999年)
從葡萄牙回去后,我只能在圣母大學停留7天,然后就要去羅馬尼亞的特蘭西瓦尼亞(Transylvania)開始為期一個月的假期。然而,我不愿意等到一個月后再將這個發現公開。這就意味著,在葡萄牙的剩余2天加上回美國后的7天里,我就得把論文寫好。
我想立刻就開始。不過,我女朋友提醒我,我答應過她在旅行的最后2天不工作的。我們原計劃要去里斯本度假。于是,我只好先陪她一起在里斯本游玩,把論文寫作計劃推遲到從里斯本飛往紐約的8小時的航班上。不過,旅途中,我根本無法將網絡從腦海中抹去:當我在圣克魯斯(Santa Cruz)的狹窄街道上漫步時,論文的雛形逐漸形成了。
飛機一起飛,我就急匆匆地拿出電腦開始打字。在我剛剛寫完論文引言部分的時候,正在把一杯可樂遞給我身邊乘客的空姐一不小心把可樂全灑在了我的鍵盤上。她不僅毀掉了我那臺嶄新的筆記本電腦,還打碎了我計劃在飛機上完成論文初稿的夢想。
我不能就此放棄。最終,我在那個懊悔不已的空姐向我提供的便箋本上完成了論文初稿。一周后,論文投稿到了《科學》雜志。
不過,我好像是患上了妄想癥。那時候,我們有兩篇論文在評審中。第一篇論文報告了我們在萬維網中的發現,這篇論文正在《自然》雜志的評審過程中。第二篇是剛剛投稿到《科學》雜志那篇,論文指出無標度性質是普適的,并且提出了一種理論來解釋無標度性質出現的原因。沒錯,《自然》和《科學》是最著名的兩大學術期刊,但這兩個期刊的拒稿率也很高,只有不到10%的投稿最終能夠發表。這意味著我們的兩篇論文都被拒收的概率超過了81%,而都被接收的概率還不到1%。
我曾經的那篇網絡論文在我最終放棄之前,經歷了長達兩年的坎坷投稿歷程。如果這兩篇論文也遭遇了同樣的命運該怎么辦?如果其他人也同時做出了同樣的發現該怎么辦?我們發現的這個現象是如此明顯、隨處可見,有人獨立發現它的可能性非常大。我需要一個備選方案。
物理學領域有一個慣例,一篇簡短論文在《自然》、《科學》和《物理評論快報》上發表之后,通常緊接著會有一篇長論文發表,以介紹更多的細節。于是,在那7天里,雷卡、鄭浩雄和我又寫了一篇長論文。我打電話給Physica A期刊的主編吉恩·斯坦利(Gene Stanley),告訴他說,如果他能夠快速給出決定,我就打算把自己最炙手可熱的論文投稿到Physica A。我不知道他是否相信我所說的“炙手可熱”。不過,他答應了會快速評審。
沒過幾天,我的妄想就被證明是有根據的。我剛剛到達我的家鄉特蘭西瓦尼亞,就收到了《科學》雜志的拒稿郵件。雖然有些失望,但我堅信這篇論文的結論是重要的。于是,我做了一件之前從沒有做過的事:打電話給拒收我論文的編輯,做最后的努力,去嘗試改變他的決定。
令我吃驚的是,我成功了,他將我的論文送審了。幾個月后,1%的可能變成了現實:《自然》、《科學》和Physica A都接收了我的論文[9],[10],[11]。雖然出乎意料,但這是對我過去5年在網絡科學領域經歷的諸多挫折的最好回報。
180度轉變(1999年)
四個學生和一個博士后——那時候我的研究組并不大。除了雷卡之外,其他人都在研究面和量子點。在那篇投稿到《科學》雜志的論文被接收幾天后,我召開了一次研究組會議,并在會上做出了一個讓研究組成員感到震驚的聲明。我告訴他們,我打算退出材料科學的研究。原因很簡單:我不想再分散時間和精力。在距離評終身教授還有三年的時候,我決定轉變研究領域,從量子點轉到網絡。我讓研究組的成員選擇:要么和我一起開始新的旅程,要么離開。
兩個學生離開了,其他人選擇跟隨我一起開啟新的未知旅程。
失敗4:經費(1999年)
如果我們進入的是一個已經建立起來的領域,并且做好了研究工作,那么獲得科研經費只是時間問題。然而,進入一個還不存在的領域將使我們面臨不可預知的困難。
好消息是,那時我剛剛獲得美國國家科學基金(NSF)在量子點方面的經費支持。壞消息是,我對這個研究題目不再感興趣。當然,我假裝在從事量子點方面的研究,從而繼續使用這項經費。不過,這樣的做法讓我感到內心不安。于是,我打電話給國家科學基金的管理部門,詢問是否可以使用這項經費從事網絡方面的研究。
答復是“不行”。要么做量子點方面的研究,要么把經費退還給國家科學基金。這是一個進退兩難的境地:一方面,我有經費去從事我已經失去興趣的增量式研究;另一方面,對于那個有可能會實現突破的研究,我卻沒有經費支持。
最終,我選擇了夢想,把經費退了回去。這令我的研究組面臨很大的壓力:我們急需新的經費支持,但是還沒有資助機構認可網絡這樣一個研究題目。后來,我注意到美國國防部高級研究計劃局(Defense Advanced Research Projects Agency,簡稱DARPA)在征集“讓未來的網絡在受到攻擊時仍然能夠提供服務”的技術。
現在回過頭看,這明顯是為計算機網絡設計方面的專家準備的——計算機網絡設計是計算機科學的一個活躍分支。不過,我堅信,沒有人能在缺少對網絡拓撲及其固有脆弱性的初步理解的情況下構建出具有容錯能力的網絡。我們剛剛發現的網絡無標度性質及隨之而來的樞紐節點,對DARPA打算研制的技術一定具有重要意義。有我們在《自然》和《科學》雜志上剛剛發表的論文作為基礎,我決定立刻開始撰寫申請書。
不過,我們還需要一個確鑿的證據,讓DARPA的項目管理者相信網絡拓撲對于網絡健壯性的重要作用。因此,雷卡開始通過從無標度網絡中隨機刪除節點來模擬互聯網節點的隨機失效。她對比了隨機失效和網絡攻擊(刪除樞紐節點)對網絡連通性的影響。二者的差異非常大:無標度網絡在隨機失效面前表現得非常健壯,但在面臨攻擊時卻異常脆弱。我們立刻把這一發現寫進項目申請書,并且相信我們已經毫無疑問地證明了網絡拓撲在網絡容錯能力方面的重要意義(圖I-8)。

圖I-8 1999:健壯性
這幅圖來自我們于1999年11月1日提交的DARPA申請書,展示了網絡拓撲對網絡容忍錯誤和攻擊能力的影響。這幅圖的原始標題預見了我們一年后發表在《自然》雜志上的那篇關于容錯的論文[12]:
“攻擊和隨機失效對電網的連通性的影響。我們構建了一個有40000個節點的電網,該網絡中一個節點擁有k個鏈接的概率為P(k)~k-3。假定攻擊一般而言針對系統中擁有鏈接數最多的節點。為了研究攻擊帶來的影響,我們從網絡中刪除鏈接數最多的M個節點。上面一條曲線展示了‘孤島’數目關于M的函數。例如,刪除鏈接數最多的10個節點,會導致整個網絡碎裂成500個‘孤島’——孤島彼此之間無法通信。隨機失效等概率地影響網絡中的每個節點,由于大部分節點只擁有少數幾個鏈接,失效很少會帶來大的影響。實際上,隨機刪除M個節點只能讓網絡分成少數幾個不連通的團,而網絡的整體連通性基本不受影響。”
11月1日,項目申請書提交了。隨后,我對雷卡和鄭浩雄說,我們在申請書中提出的問題非常令人興奮,不能等到DARPA的經費支持批復了再開始研究這個問題,必須立刻行動。于是,在對我們的發現進行擴充之后,我們將其投稿到《科學》雜志。又一次,論文沒有送審就被拒收了。
我再次打電話給《科學》雜志的主編,得到的回應是,在他看來,這篇論文的結果與我們之前那篇論文相比沒有重大進步。我目瞪口呆,卻無法說服他,只好把論文改投到《自然》雜志。
幾個月后,DARPA拒絕了我們的項目申請。但是,《自然》雜志接收了我們的論文,并作為封面論文發布(圖I-9)[12]。

圖I-9 2000:阿喀琉斯之踵
2000年7月27日那期《自然》雜志的封面。封面上重點介紹了我們關于復雜網絡容忍攻擊和錯誤能力方面的論文。這篇論文受到了我們那個(未獲資助的)DARPA申請書中的想法啟發[12]。
失敗5:滑稽的錯誤
每當有重大科學發現出現時,總會有一些研究人員將保持宇宙平衡作為其人生使命,竭盡所能地將該科學發現從地球上抹掉。網絡科學在展現出其革新力量之前,也必須經受命中注定的質疑。
“滑稽的錯誤”是加州理工學院控制論學家約翰·多伊爾(John Doyle)在其對網絡科學十余年的質疑中經常使用的短語,他自稱是網絡方面的專家。小世界性質是讓人驚奇的,它很容易被想到,而且已經有幾十年的研究歷史了。無標度性質卻不同,因此招致了很多我們當時無法回答的質疑:如果這一性質是普適的,那么為什么十余年來一直沒有人發現?生長和偏好連接是否只是無標度性質眾多解釋中的一個?自帕累托時代起,我們就已經知道了冪律,這次又有什么不同呢?貝拉·波羅巴斯則更直接,我們在布達城堡第一次見面時,他對我說,如果沒有嚴格的數學證明,無標度性質可以說“根本不存在”。
這些質疑是有原因的:只有經歷過數學訓練的研究人員才能理解無標度的概念。由此導致的理解真空給誤解和訛傳提供了空間。約翰·多伊爾那個言過其實的說法正好填補了這個空間——每當有記者將這個問題拋給他時他總會這樣說。
接下來,風向慢慢變了。何塞·門德斯(José Mendes)、謝爾蓋·多羅戈夫茨夫(Sergey Dorogovtsev)和錫德·雷德納(Sid Redner)使用速率方程方法從連續介質理論的角度為無標度網絡提供了嚴格的數學基礎[13],[14]。貝拉·波羅巴斯和他的一些合作者在一篇里程碑式的論文中為無標度性質提供了嚴格的證明[15]。什洛莫·哈夫林(Shlomo Havlin)和他的學生將網絡健壯性和逾滲理論關聯在了一起[16],而貝拉·波羅巴斯和奧利弗·賴爾登(Oliver Riordan)為之提供了嚴格的證明[17]。一系列隨之而來的發現揭示了無標度性質如何深刻地改變了網絡的行為,譬如羅穆阿爾多·帕斯托爾-薩托拉斯(Romualdo Pastor-Satorras)和亞歷山德羅·維斯皮那尼(Alessandro Vespignani)關于無標度網絡上不存在疾病傳播臨界值的經典發現[18]。學術界由此開始意識到度分布在網絡研究中的核心地位。接下來我們將在本書中看到,幾乎所有網絡特性的解讀都必須考慮度分布,包括六度分隔、網絡健壯性和社區結構。關于網絡的許多根本性問題的提出吸引了數以百計的研究人員從事網絡研究,網絡科學因此逐漸形成。
小結
如果愿意,你也可以將前面提到的這些事情看作一系列的成功:在接下來的十余年中,1999年《科學》雜志發表的那篇關于無標度網絡的論文成了物理科學中引用次數最多的論文。2000年《自然》雜志發表的那篇關于網絡容忍失效和攻擊方面的論文不僅是該期刊的封面文章,而且對于我們理解網絡健壯性產生了深遠影響。雷卡和我在接下來的一年又寫了一篇關于網絡的綜述論文,詳細介紹了這個領域的理論基礎,該論文是《現代物理評論》(Review of Modern Physics)引用次數最多的論文[19]。美國科學院2015年出版的美國國家研究委員會(National Research Council)年度報告中使用了“網絡科學”一詞,并建議美國政府投入數億美元的經費支持這個新領域的研究,同時將該領域視為一個新的獨立學科。最后,兩家著名的科學出版社——劍橋大學出版社、牛津大學出版社,一個頂級的工程學會——美國電氣電子工程師學會(IEEE),各自創辦了一個期刊,專注于網絡科學領域的研究進展。從各個角度來看,我們都可以說一個新的學科誕生了,在一個學科高度交叉的充滿活力的學術群體的支持下誕生了。
科學的成功之路從來都不是一條直線(圖I-10)。新思想的產生往往需要數年的醞釀。你可以把無標度網絡理論視為一個例外,這個思想的火花從想法產生到論文投稿只用了10天時間。然而,若沒有那5年毫無成果的磨煉,這個火花也不會燃燒成大火。

圖I-10 通往成功的不同路徑
一位卡通畫家繪制的關于成功的作品。該作品生動地刻畫了我早期從事網絡科學研究的曲折歷程,其中充滿了各種失敗和死胡同。
網絡科學提醒我們注意科研合作和導師制度在科學中的重要作用。在雷卡和鄭浩雄加入我的網絡科學之旅之前,我所擁有的只是一系列的想法和失敗。如果沒有鄭浩雄的網絡爬蟲技術,我們根本不可能發現無標度性質。雷卡的數學能力為我們探究無標度模型背后的理論提供了保障。如果不是美國西北大學的醫師和研究人員佐爾坦·歐爾特沃伊(Zoltán Oltvai)說服我們將網絡應用到細胞生物學中,并耐心地指導我們去熟悉那奇妙的蛋白質和代謝物,我們隨后在生物網絡領域的研究將不會發生[20],[21],[22]。這些發現不是一個人完成的,而是真正的共同發現。
如今,許多領域將網絡科學歸于它們的范疇。數學家聲稱網絡科學是圖論的一部分;社會學家認為網絡科學屬于他們研究了幾十年的社會網絡范疇;物理學則為網絡科學的研究提供了普適性概念和許多解析工具;生物學領域投入了數億美元的經費繪制亞細胞網絡;計算機科學從計算機算法角度為研究大規模網絡提供了幫助;工程領域則在基礎設施網絡方面投入了大量精力。難以想象,這么多完全不同的學科是如何走到一起,共同哺育了這個新學科的。
這本教科書見證了網絡科學誕生的奇妙旅程,以及其中取得的一連串令人興奮的進展。網絡科學后續的成功依賴于我們保持其多學科特性的能力,我們希望每個科學家都能為網絡科學的發展帶來自己獨有的視角。這種思想和觀點的碰撞正是網絡科學的強大之處和力量之源。
- 巴拉巴西網絡科學
- Windmills and Waterwheels Explained
- A History of Modern Computing-現代計算機歷史 (英文原版)
- Playing with Sound-與聲音玩耍 (英文原版)
- 職業游戲玩家與新媒體工作者 (英文原版)
- Demolition
- Racing the Beam-與光線賽跑 (英文原版)
- Values at Play in Digital Games-數碼游戲里的價值 (英文原版)
- Disaster Recovery Project Management
- Steam Engines Explained
- Drawings Brought To Life