3.時勢論英雄
1993年,德國曼海姆大學漢斯(Hans Meuer, 1936—2014)、埃里克(Erich Strohmaier)等人發起創建了全球超級計算機TOP500排名榜。TOP500目前由德國曼海姆大學、美國田納西大學、美國能源研究科學計算中心(NERSC)以及勞倫斯伯克利國家實驗室聯合舉辦,每年排名兩次,已成為全世界最具權威的超級計算機排名榜,是衡量各國超級計算水平的最重要的參考依據。
TOP500排行榜起源于曼海姆超級計算機統計(Mannheim Supercomputer Statistics)。從1986年到1992年,德國曼海姆大學超級計算機研討會(Super-computer Seminars at Mannheim University)每年發布一份“曼海姆超級計算機統計”報告,簡單羅列安裝在美國、日本和歐洲的向量計算機系統——那一時期,超級計算機是向量計算機的同義詞。
漢斯在回顧發起TOP500緣由時說:“我們注意到,這期間,人們對超級計算機這類數據的關注程度逐年提高。但由于向量計算機的統計是由系統制造商們自己申報的,所以統計數據的可靠性并不高,缺少一個可靠的數據庫。另外,像日本Fujitsu VP30/50這類所謂的入門級向量計算機、美國Convex C1/2這種迷你型超級計算機始越來越流行,從性能上來看,這些系統是否是真正意義上的超級計算機呢?我們不得不開始非常謹慎地考慮,到底哪些系統符合超級計算機的定義,應該被納入這一統計。從20世紀90年代初開始,向量計算機已經不再是唯一的超級計算機結構,大規模并行系統如Thinking Machines (TMC)的CM2也開始進入市場。因此,我們需要一套方法來定義到底什么是超級計算機,由哪些部分組成,根據什么對這些計算機進行排名。”
在1993年春天啟動TOP500項目時,創始者們提出了一些簡單的指導原則:①對全球范圍內最強大的500臺計算機進行排名;②用Rmax(即最好的Linpack性能)做Benchmark(基準測試); ③排行榜每年更新和發布兩次——6月在德國的ISC(國際超級計算大會), 11月在美國的SC(超級計算大會); ④所有的數據都在www.top500.org進行公示,以供公眾查閱。
漢斯還對一些基本的問題進行了解答。
——為什么是“500臺最強大的超級計算機”? “一個原因是因為1992年我們做最后一次‘曼海姆超級計算機統計’時發現全球范圍內已經有530臺超級計算機。另一個確切的原因是,受到了福布斯500排行榜的影響,這個排行榜統計的是全世界最富有的500個人和規模最大的500家企業。”
——為什么選擇Linpack? “這主要是因為Linpack的Rmax指標廣為人知,而且對所有系統來說也比較容易獲得。嚴格來看,TOP500中所列的計算機僅僅是考察了它們在解決一組線性方程時的能力,比如,A x = b, using a dense random matrix A。”
——為什么一年兩次對TOP500排行榜進行更新,而非持續不斷地更新?“首先,更新TOP500排行榜是一件非常費時的工作,程序也比較復雜。其次,我們認為,每年更新兩次已經足以揭示HPC業界主要關心的那些重要的變化趨勢,而且多年的經驗也證明這點考慮是正確的。”
2014年1月23日,TOP500官方網站宣布,幾乎在每一屆國際超級計算大會上致開幕詞的漢斯教授因癌癥去世。而此時,第42屆TOP500排行榜才公布了不到兩個月。
盡管速度并不是衡量計算機能力的唯一因素,速度卻是為全球最強計算機進行排名的最科學指標。
2014年6月23日發布的第43屆排行榜上,第一名是中國國防科技大學研制、安裝在國家超級計算廣州中心的“天河二號”。它的浮點運算速度為每秒33.9千萬億次,比第二名快了近一倍。這是“天河二號”自2013年6月以來第三次奪冠。部署在國家超級計算天津中心、曾為中國摘得首枚超算“金牌”的“天河一號”此次下降至第14名。
第二名:泰坦(Titan)。部署在美國能源部橡樹嶺國家實驗室中的Titan繼續保持第二。Titan搭載Cray公司的XK7系統,使用560640個AMD皓龍處理器核心和261632個英偉達K20x加速器,運行速度為17.59千萬億次/秒。Titan是榜單上最節能的機器之一。
第三名:紅杉(Sequoia)。搭載IBM的BlueGene/ Q系統的Sequoia安裝在美國能源部勞倫斯·利弗莫爾國家實驗室,名次與上屆相比并無變化。Sequoia最早于2011年交付使用,取得了每秒17.17千萬億次運行速度,該超級計算機使用了1572864顆核心。
第四名:京(K)。富士通制造的K計算機安裝在日本神戶化學研究所高級計算科學研究院(AICS),使用了705024顆SPARC64處理核心,運算速度為10.51千萬億次/秒。“京”曾在2011年6月取代“天河一號”成為當屆冠軍。
第五名:米拉(Mira)。美國能源部阿爾貢國家實驗室的Mira采用了第二代BlueGene/Q架構,核心數量比排名第八的Juqueen要多得多,因此性能達到了幾乎翻番的每秒8.59千萬億次。
第六名:代恩特峰(Piz Daint)。位于瑞士國家計算中心的這臺計算機速度每秒6.27千萬億次,從第42屆榜單開始進入前10名,也是歐洲最快的超級計算機和前10名中能效最高的超級計算機。
第七名:Stampede。德克薩斯大學德克薩斯高級計算中心的Stampede運算速度為5.17千萬億次/秒。
第八名:Juqueen。Juqueen位于德國尤利希研究所,是目前歐洲第二快的超級計算機。Juqueen搭載了IBM的BlueGene/Q系統,在Linpack測試時處理能力可達每秒5.01千萬億次浮點運算。
第九名:Vulcan。Vulcan位于美國能源部勞倫斯·利弗莫爾國家實驗室,在Linpack基準測試運算速度達到4.29千萬億次/秒(petaflop/s)。
第十名:美國政府的一臺沒有名字的Cray XC30計算機,Linpack測試速度為3.14千萬億次/秒,不到“天河二號”的十分之一。這臺并未透露具體安裝地點的機器是第43屆TOP500排行榜前10名中唯一的“新人”。它取代德國萊布尼茲超級計算中心、歐洲排名第三的SuperMUC,成為與上一屆差別不大的新榜單上最顯著的變化之一。
新一屆榜單要點包括:
——2014年6月世界上最強大的500臺超級計算機總性能達到每秒274千萬億次浮點運算,這一指標在2014年1月和2013年分別為每秒250千萬億次和223千萬億次。但TOP500組織在一份聲明中說,從榜單看,超級計算機的整體性能提升速度已降至歷史最低點——例如,在1994年至2008年間,榜單最后一名的計算性能平均每年提升90%,而過去5年每年只提升了55%。
——目前世界上共有37套系統突破了Linpack千萬億次大關,比6個月前增加了6套。
——世界TOP500中TOP10的最低性能都超過了3.1Pflops,其中4臺由IBM公司制造,3臺來自Cray公司,國防科大、富士通公司和Dell公司各1臺。高端能力超算(TOP10)的研制呈現出百花齊放的局面,各家都在積極占領制高點,但IBM公司優勢明顯。
——世界TOP500中96%的機器使用6核及以上處理器,83%的機器使用8核及以上處理器。62套系統采用加速部件加速,比上一屆榜單的53臺多出9臺。其中44臺采用Nvidia的GPU, 17套系統采用Intel MIC。85.4%的機器使用Intel處理器,IBM和AMD是處理器的第二和第三大廠商,AMD的份額比6個月前下降了3個百分點。
TOP500運行的最初10年里,中國的高性能計算機未曾向國際申報Linpack性能測試結果,因此未能列入TOP500排行榜。2002年,聯想深騰1800萬億次機群名列2002年世界TOP500第43名,結束了在TOP500排行榜里沒有中國產高性能計算機的歷史。
截止2014年6月,中國研制的天河系列超級計算機第4次奪取世界第一名,牢牢站穩了中國在TOP500超級計算機俱樂部的冠軍位置。同時,中國進入新一屆榜單的超級計算機總數名列亞軍,共有76臺超級計算機上榜,比上一屆大幅增加13臺。而在10年前的TOP500榜單中,中國的上榜機器僅為個位數。除了天河系列計算機,繼續進入榜單的中國國產超級計算機還有來自曙光星云、神威藍光的多臺機器,它們這一次的最高排名分別為第28名和第46名,較上一屆略有下降。
與國際TOP500相對應,中國軟件行業協會數學軟件分會自2002年起每年發布一次中國高性能計算機排行榜(TOP100),至今已歷12年。2013年TOP100排行榜中機器的平均Linpack性能為570Tflops,而2013年國際TOP500排行榜中機器的平均Linpack性能為448Tflops。這意味著,中國與世界平均性能差距從原來的落后近一年提升為比國際平均水平高27%。
“出現跨越式發展的主要原因是我國僅天河二號一臺超級計算機的Linpack性能就占中國TOP100總性能的近60%! ”張云泉說,“因此,如何用好天河二號、發揮其巨大的計算能力,成為未來兩三年中國超級計算行業面臨的挑戰性問題。”
2013年中國TOP100的機器中,美國廠商制造的機器數量占裝機總數的48%,國內廠商份額為52%。在曙光、浪潮、國防科大、神威、中科院工程所和聯想等國內廠商的努力下,國外廠商已經很難達到2002年占裝機總數76%的絕對優勢狀態。曙光公司與IBM公司并列數量份額第一名,而曙光公司已連續5年保持總數量份額第一。
中國高性能計算的發展開始進入快速發展期,第一名性能開始出現大幅度的跳躍。未來兩三年,中國會相繼發布一系列新的國產超級計算機。
超算領域的應用與研發同等重要,這決定了在TOP500排行榜上擁有機器的數量——無論機器由誰制造,成為衡量各國科技實力的最重要因素之一。
美國仍然是世界最強超級計算機的最大用戶,擁有500臺機器中的233臺,盡管絕對數量較上一屆有所下降,仍舊是占了大半壁江山;在前10名中,美國占據6席;在37套Linpack千萬億次系統中,美國占據15席。從制造廠商來看,僅是惠普、IBM、克雷三家美國公司,就制造了500臺機器中的409臺,裝機份額占81.8%,遙遙領先于其他所有國家的制造商。
自世界上第一臺超級計算機在美國誕生以來,美國的超級計算機研制和產業一直處于世界前列,在大多數時間里占據著TOP500排行榜第一名的位置,以至于我們在談論世界高性能計算機發展的過去時,很多時候指的就是美國的高性能計算機發展史。幾十年來,美國開發了用于大型超級計算機的大多數基礎技術,并在其許多研究實驗室和大學制造了一批規模最大、速度最快的超級計算機,其中一些頂級超級計算機用于模擬核試驗,其他一些則用于預測天氣、能源等領域的研究。
從1982~2005年,美國國防部、能源部、國家科學院、國家科學基金委以及美國總統信息技術顧問委員會、美國信息技術咨詢委員會、美國國家競爭力委員會等提出的有關信息技術和計算機的建議報告中,大都涉及了高性能超級計算機的內容。2011年之后不到兩年的時間里,美國先后投入巨資成功研制紅杉和Titan,先后兩次重新奪取世界第一。美國目前正在積極構建運算能力超越中國天河系列的超級計算機系統。
機器份額排在美國、中國之后的是日本、英國、法國和德國。
“京”的成功并非偶然。在研發超級計算機方面,日本屬于起步較早的國家之一。自20世紀90年代起,日本意識到超級計算機研發是提高其國際競爭力的重要一環,不斷推出和更新超級計算機的研發計劃。最新TOP500排行榜中,日本上榜機器為30臺,但在37套Linpack值突破千萬億次的計算機中日本占了5席,超過中國的三席。
1999年,日本投入400億日元(約為人民幣25億元),開始名為“地球模擬器”的超級計算機研發,旨在通過在計算機內置“虛擬地球”預測及解析整個地球大氣、地殼、地震等活動為目的。2002年,“地球模擬器”成功推出,將一直獨占鰲頭的美國擠下了頭把交椅。之后,由于預算資金削減原因,日本超級計算機的研發政策發生了轉向,從政府主導型開始向產學一體化、為民生提供更多貢獻的方向發展。
不過,2011年6月由日本富士通公司研發、日本理化學研究所組裝、并接受來自日本政府資助的“京”超級計算機以每秒8162萬億次運算速度成為當時全球最快的超級計算機。這是時隔7年后日本重返世界超級計算機榜首。
在湖南長沙“2013高性能計算國際論壇”上,“京”計算機設計師大介博庫(Taisuke Boku)教授坦陳,超級計算機發展首先需要政府支持。“今天的超級計算機研制不僅僅是某一家公司的事了,在日本,這是國家工程。”
歐洲采取“化零為整”的聯合手法,共同打造“超超級”計算機。2010年6月,投資數億歐元、20個國家參與、每秒速度達百萬兆次的超級計算機合作平臺計劃在西班牙巴塞羅那啟動。此計劃旨在通過建立一個連接歐洲各種計算資源的基礎設施,增強歐洲的超級計算能力。最新TOP500排行榜中,英國、法國、德國三國的上榜機器總數為79,比6個月前增加了14臺。在37套Linpack值突破千萬億次的計算機中,歐洲占了14臺。
來自德國的計算機科學家施密特(Sebastian Schmidt)在“2013高性能計算國際論壇”上表達了對中歐合作前景的信心:“合作前景非常美好,因為我們面臨的問題是相同的,比如智能性社會和能源問題。因此,我們需要共同努力,需要在科學家之間、計算機工程師之間開展廣泛的合作。”
最新TOP500排行榜中,俄羅斯有5臺機器上榜,最高排名為世界第42位,名次比6個月前有所下滑。俄羅斯最強的超級計算機是莫斯科大學研制的“羅莫諾索夫(Lomonosov)”計算機,理論峰值和Linpack實測數值分別是1.7千萬億次浮點運算/秒和0.9千萬億次浮點運算/秒。
印度也是世界上為數不多的自主擁有超級計算機的國家,它以低廉的成本研制出了高品質和具備高速運算能力的超級計算機。2007年的全球TOP500排行榜中,印度首次有超級計算機打入世界第4位。印度的IT產業具備強大潛力,在最新500強中印度占有9席,最高排名為第44名,與6個月前相比實現了大步跨越。
曾經奪得世界第4名的計算機EKA位于印度塔塔集團計算研究實驗室(CRL)。CRL公司CEO維平·喬杜里(Vipin Chaudhary)早在2007年就認為,CRL具有建造世界最快超級計算機的能力:“CRL并不看重保持排名,如果需要,我們就能設計和建造出最快的計算機系統。”
據報道,俄羅斯超算公司RSC集團和俄羅斯科學院日前提議與印度合作,共同建造先進的超級計算機設備。
縱觀諸雄逐鹿的世界超算戰場,可以發現四大趨勢——
第一,超級計算一直是世界大國必爭的戰略制高點,西方強國保持超級計算領先地位的決心從未改變。“天河一號”奪取世界第一,進一步加劇了國際競爭。繼中國奪冠之后,遭受“311地震”重創的日本投資“京”10億美元以上,提前于2011年6月奪取世界第一;美國IBM為“紅杉”投資11億美元,提前半年于2012年6月奪回世界第一;美國Cray則在2012年底推出“泰坦”——希臘神話中擁有超強能力和巨大形體的統治者,再拿世界第一。
第二,在經濟危機席卷全球的大背景下,西方把發展超級計算作為振興實業經濟的工具,既可直接帶動微電子、光通信、軟件研發等相關產業發展,又可間接支撐生物醫藥、金融分析、新材料等新興產業的發展。2012年4月出版的《科學美國》(Scientific American)刊文稱:“振興美國制造業的關鍵在于讓美國的超級計算機為中小型制造商服務,建議在美國政府、制造業界和大學之間建立一種協同機制,幫助中小型制造商克服缺少軟件、技能短缺等使用超級計算的障礙。”美國著名計算科學家杰克·唐加拉(Jack Dongarra)教授也認為:“西方國家把投資超級計算作為應對經濟危機的主要手段之一,加大投資力度,加快研制進程。”這幾年的發展趨勢表明,美國等西方國家正在將超級計算推向一個“產業貫通式”深化發展的階段,中小型企業普遍應用超級計算的時代正在到來。
第三,當前西方強國在超級計算領域的優勢得益于自然科學的領先地位,得益于長期的投入和核心技術的突破,得益于信息產業的整體優勢;盡管中國超級計算機幾度領先全球,盡管來自亞洲的機器份額逐年上升,西方強國的領先優勢目前并沒有改變。
第四,協同設計(Co-design)正成為支撐超級計算領域持續發展的重要途徑。超級計算機研制正從系統研制為主的發展模式,轉變為使能技術、系統技術和應用技術相結合的“生態環境”一體化發展模式。這種發展模式充分利用了公司、大學、研究機構的協同創新,持續加大微處理器設計、工藝結構、編程模型等領域的協同創新力度;同時,應用領域的協同創新正在深化,美國和日本的超算應用模式日趨成熟。

克雷公司研制的“泰坦”在2012年11月至2013年6月之間是世界上最快的超級計算機。它部署在美國能源部下屬的橡樹嶺國家實驗室,由同樣來自該實驗室的“美洲虎”多次升級改裝而成。