- 走入IBM小型機世界
- Orian編著
- 1070字
- 2018-12-28 23:12:07
1.2 藍色巨人和她的競爭對手
前面介紹過的這些RISC CPU都曾有過自己的輝煌,然而經過幾十年的大浪淘沙,在商業服務器領域僅剩下三家廠商還能夠互相比拼,其他的CPU已經失去了市場,逐漸淡出或者成為某一小領域的專用CPU處理器(例如ARM CPU在嵌入式領域甚至更為風光),不再用于商業服務器領域。這三家廠商是:被稱為藍色巨人的IBM公司;由DEC、Compaq、HP三個公司兩度合并組成的新惠普公司;以及曾經以生產UNIX領域個人機著稱的Sun公司。這三家廠商每一家也并非只生產UNIX小型機/服務器,他們每家都有很多種計算機服務器產品。
IBM公司原有四大系列計算機(或被稱為服務器),但在2003年,IBM公司進行了整合,將4條產品線的未來發展目標歸結為一條路線,并為之選擇了一個新名字:eServer。構成eServer的四大系列計算機分別如下。
1.zSeries
z是26個英文字母的最后一個,代表終極的意思,也有人說是zero的簡稱,含義是異常停機時間為零。
這一系列就是我們一直稱之為大型機、Mainframe的計算機,是最古老(并不等于落后)、技術也最成熟的大型計算機,許多計算機技術都源自于此系列計算機。它可以運行OS/390,VM,MVS和Linux(SUSE Linux)操作系統,用于大型商業交易處理環境,以穩定性著稱。其他廠商很少有與此類計算機類似的機型,只有富士通、日立等企業在生產“兼容”或者“半兼容”的同類型產品。雖然現在zSeries與其他的產品有點格格不入,屬于高高在上的一類,但從IBM公司公布的產品發展路線來看,zSeries將會逐漸與其他產品系列進行整合,也改用POWER CPU,有消息說從POWER 6起,IBM公司就會開始進行此次行動。POWER 6于去年(2007年)5月份剛剛發布,IBM公司的整合行動也為期不遠。最終IBM公司希望實現相同的硬件平臺,不同的操作系統,為用戶提供更為靈活的選擇,產品的研發、生產成本也更低。IBM z9 CPU如圖1-7所示,每個模塊封裝了2個處理器內核,15個模塊封裝在一起,加上一個管理模塊,共計16個模塊組成一個封裝芯片組。

圖1-7 IBM z9 CPU圖片摘自IBM網站
大型機最大的設計特點就是集中控制配合分布式處理,一臺物理的機器中有很多協處理器去幫助主CPU完成處理任務,而每個子系統都需要得到中心處理器的授權才能做動作,包括發送處理請求。這種架構可以保證足夠的安全性、整體最佳的處理性能和任務之間的平衡,幾萬以上的并行用戶訪問對zSeries系統司空見慣(與之相比,通常UNIX系統的并行訪問數量在幾百到幾千這個數量級)。當然缺點也隨之而來,那就是犧牲了單一業務的性能,所以不適合用于計算密集型的業務,并且也要求更為復雜的處理過程,軟件、硬件之間配合緊密,即使IBM允許,留給第三方廠商的開發空間也很有限。
2.iSeries
i代表Internet或者Integrated,設計者期望其可以提供集成的Internet網絡服務。
i系列即以前的AS/400系列,它更類似于大型機,運行OS/400操作系統,是硬件、軟件一體化設計,也就是當你購買iSeries產品的時候,硬件與操作系統、基礎平臺軟件被打包提供,不用單獨購買軟件,當然購買價格也比較貴,軟件費用已經包含在內。最近經過IBM產品線整合后,已經與pSeries在硬件層面實現了統一,即新款的iSeries與pSeries硬件完全相同,甚至也可以直接安裝AIX和Linux,另外通過一個附加的Intel CPU板,i系列還可以安裝Windows操作系統!
與大型機類似,iSeries被認為是不很“開放”的系統,其上運行的操作系統、數據庫、中間件等軟件,都幾乎必須是IBM公司的產品,而且購買硬件的時候就已經打包賣給你了,很少有第三方件產品可以運行于i系列之上(業務應用程序除外);從管理方面來看,也與我們常見的命令行方式不同,它采用一種數字式菜單選擇方式,直接輸入的命令也很古怪(當然也有人說UNIX命令很古怪)。
實際上,iSeries兼容大部分開放的UNIX編程API標準,大部分UNIX應用程序無需修改,只要重新編譯一下,就可以從其他UNIX平臺遷移到iSeries。由于iSeries在設計之初是為了方便管理、方便使用,所以強調了封裝技術,普通的用戶具有很少的權利。iSeries對于程序的控制性也很強,幾乎不可能被病毒入侵。iSeries對程序代碼的兼容性極強,最新的iSeries產品仍然可以運行10年前為老產品開發的程序,可以實實在在地被稱為傻瓜計算機。當然,因此帶來的缺點就是被廠商壟斷,因此被許多用戶所拒絕。另外這種整合性帶來的缺點就是難以跟上用戶業務的快速發展,這些都可能是AS/400逐漸沒落的原因之一。個人認為,對于某些行業的中、小企業,如果業務穩定,不想雇用很多計算機管理員去精心呵護計算機系統,iSeries倒也是不錯的選擇。
3.pSeries
p代表Power,意為力量強大,也代表它使用的是POWER CPU。
這是本書的主角,也就是我們常說起的IBM UNIX小型機,在以往被稱為RS/6000服務器或者簡稱6000,運行AIX操作系統。最新款的pSeries服務器也可以運行Red Hat或SuSe Linux(需要另外購買不同于安裝到PC上的光盤介質)。由于pSeries與iSeries共用硬件平臺,而它們之間還有價格、配置(軟件及部分硬件)的區別,所以IBM公司現在的市場策略是:如果按照iSeries購買,則可以運行OS/400,AIX,Linux三類操作系統;如果按照pSeries購買,則只能安裝AIX或Linux操作系統,而不能運行OS/400。
最近IBM已經開始了i系列和p系列整合的第二階段,i系列和p系列被合稱為System P,兩大系列各自成為System P產品系列中的一個子型號。
4.xSeries
x代表eXtendable,可以擴展的。
這是IBM公司生產的PC服務器,采用Intel奔騰、志強(IA-32)或IA-64及AMD的x86兼容CPU,可以運行Windows,Linux,Solaris 86等操作系統。
1.2.1 IBM eServer pSeries發展歷史
同時維護幾個產品線,即使IBM這樣財大氣粗的IT元老也難以為繼,因此IBM最近提出了產品線整合策略,繼已經完成的iSeries和pSeries整合之后,預計在未來3~5年內,會最后把zSeries也并入,實現完全的平臺合并,而合并的關鍵就是POWER處理器。另外xSeries似乎不完全在這個整合范疇之內,但可以預計,從CPU以外的架構平臺還是會被完全合并的,現在的技術趨勢就是將大型機的技術向中小型機遷移,許多x服務器的技術完全基于UNIX服務器,而UNIX服務器則師從大型機(Mainframe)。
IBM的POWER列處理器本身就有幾個分支,這也是IBM逐漸摸索市場需求的脈絡及自己技術發展的結果,它們分別是Power,Star(RS)系列、和Power PC系列,它們在發展過程中合合分分,最終演化成現在的三大發展方向:即高端商用服務器、中低端商用服務器和嵌入式處理器。IBM公司承諾無論今后怎樣發展,這幾種處理器的架構相同、代碼二進制兼容(特別指令除外),也就是說即使為嵌入式處理器開發的程序,只要沒有使用特別的外設操作,都可以不用重新編譯就在高端商用服務器上執行。

圖1-8 RS/6000,pSeries曾使用的系列芯片(摘自IBM網站)
1980:IBM公司設計了第一款RISC(Reduced Instruction Set Computer,精簡指令集計算機的)原型機,這時IBM公司還沒有確定要在RISC領域有所作為,但為了能跟上市場,保持技術領先,扔點研發費用對這頭藍色大象不過九牛一毛。IBM目前依然有自己的超級研發隊伍,從理論物理到軟件技術無所不包。
1990:IBM公司正式發布了RISC架構CPU的計算機產品線,被稱為RS/6000系列,運行AIX V3操作系統(AIX此版還可以支持PC平臺)。這個CPU被稱為POWER(POWER1),代表著:Performance Optimization With Enhanced RISC,即用增強的RISC技術實現性能優化。RS/6000的名字來自于大型主機,RS是Risc System的簡稱,6000則是表示比ES/9000(即390系列,Mainframe)低一點,當時已經有了AS/400系列,和PS2(PC),一到四位數字的編號都有了,在大型機ES/9000霸道的年代,還沒有哪個人敢提出一個RS/10000的名字,能取6000,比400高了一點,已經可以看出來IBM對此產品的期望頗多。
1991:IBM,Apple(蘋果)和Motorola(摩托羅拉)公司宣布了一系列的聯盟計劃,主要內容是用POWER系列CPU裝配蘋果公司的麥金塔個人計算機(Apple Macintosh Personal Computers)和摩托羅拉的通信產品。聯盟將一同研發新的基于RISC技術的處理芯片,命名為PowerPC芯片,用于PC、低端工作站,這個開放架構將能夠同時運行IBM AIX和Macintosh的軟件,以及聯盟合作開發的其他軟件。這個聯盟顯然是為了抗衡已經日趨壯大的Wintel聯盟。
1993:IBM公司開發了使用POWER芯片的并行系統(Scalable POWER Parallel System),第一次利用RS/6000技術建造了巨型機。IBM的技術專家將許多計算芯片組織在一起,通過任務分配將計算密集型的任務分散到多個處理器上以便提高整體運算速度。這也就是IBM的SP系列群及計算機產品。
IBM、Apple和Motorola公司共同發布了PowerPC 601,這個簡稱為PPC601的處理器包括超過280萬個晶體管,主頻為50 MHz。IBM稍后發布了66 MHz主頻的POWER 2處理器,專門用于RS/6000系統。
1994:IBM公司發布了Scalable POWER并行系統第二代,被稱為SP2(與卡斯帕羅夫下棋的深藍就是一種SP2架構)。康乃爾大學理論中心(Cornell Theory Center)部署了SP2超級計算機,實現了1360億次/秒的計算能力。歐洲粒子物理研究所(CERN,European Laboratory for Particle Physics)也訂購了歐洲有史以來最強大的超級計算機:運行AIX操作系統的64個節點的SP2。
IBM公司發布Power PC 604處理器,是當時業界最強大、銷售最廣的微處理器。IBM技術開發人員用此芯片達到40MB/s的數據無損壓縮處理能力,并且到當年7月就實現了一百萬片的銷售量。隨之IBM公司又發布了Power PC 403GA用于嵌入式系統,這是POWER系列第一款嵌入式芯片。
1995:64位的Power PC RISC處理器被用于IBM AS/400系統,在8月Apple公司發布了Power Book 500筆記本電腦,使用Power PC 603e芯片。這是第一款用于筆記本電腦的POWER系列芯片。
1996:IBM公司發布新的32位、135 MHz主頻的POWER 2 Super Chip(P2SC)用于RS/6000系統,P2SC是一種單片POWER 2架構的產品,包含1500萬個晶體管,采用高密度的CMOS技術。
1997:IBM公司的深藍(Deep Blue,開發代號)超級計算機與世界象棋冠軍卡斯帕羅夫(Garry Kasparov)對弈,并將其擊敗。深藍是32節點的IBM RS/6000 SP2計算機,使用32位POWER 2 Super Chip(P2SC),運行AIX操作系統。不過深藍并不是通用計算機,也就是說它不是單獨靠軟件實現的架構。在深藍中有許多專用的協處理板,幫助主程序并行計算可能的對弈局勢,它平均每秒鐘要思考一億兩千六百萬種可能的走法。現在深藍被存放于華盛頓特區的Smithsonian國家博物館。事后據卡斯帕羅夫回憶,此次深藍的勝利有點僥幸,并且是集體力量(開發小組成員個個都是國際象棋高手)加機器的力量的勝利。卡斯帕羅夫一直耿耿于懷,說他是在各種外界干擾、逼迫下同時與一群人和一臺不知疲倦的機器怪獸在下棋,據說當時一些報道指責小組成員在棋賽期間還在修改程序,調整(權重)參數,但無論怎樣,不能否認這是人工智能史上一個里程碑式的轉折點。
也許能印證卡斯帕羅夫的抱怨的事實是IBM在此次勝利后,就宣布結束深藍項目,讓卡斯帕羅夫再也沒有機會翻牌。這次勝利不僅僅是機器的勝利,更是IBM的一次成功的商業企劃,憑借這場人機大戰做宣傳,IBM賣出了好多SP2架構的計算機(與下棋的SP2差別很大,沒有專門設計的協處理板,并且SP2是為了高性能計算而設計的,并不太適合商業環境)。當然,我們還要記住,深藍的開發者是華裔科學家許峰雄博士。遺憾的是IBM公司確確實實把這次人機大戰當成了商業行為,由于以后不再投資這個項目,許博士也離開IBM公司而去了微軟公司。
IBM為美國宇航局(NASA)提供了每秒鐘可以執行三千五百萬條指令的32位Power PC處理器用于火星探路者號飛船(Pathfinder),這款芯片由位于弗吉尼亞的洛克西德·馬丁實驗室選定,為旅居漫游者飛船(Sojourner rover)制造耐輻射的RAD 6000飛船計算機。
1998:太平洋藍(Blue Pacific)發布,這是由IBM與美國能源部洛斯拉莫斯國家實驗室共同投資的超級計算機。系統由176節點的332 MHz Power PC 604組成,每秒鐘能進行3.9萬億次計算,大約相當于15 000臺當時最快的臺式機的工作能力。系統還配置了2.6 TB的內存,在當時相當于80 000臺臺式機的內存容量。它一秒鐘的計算能力相當于一個人63 000年的計算能力。
同年,IBM發布了世界上第一款銅導線芯片:Power PC 740/750,主頻為400 MHz,通過銅芯片技術,芯片處理能力大約提高了1/3。銅導線技術是芯片制造領域的一項創舉,傳統的芯片采用鋁作為導線,但由于鋁的導電性和散熱性不如銅,因此導線寬度、芯片頻率支持等方面都不如銅。不過鋁有自己的優勢,就是能和硅很好地結合,也更容易在芯片內加工。IBM解決了銅與硅相結合和加工技術,并將此技術賣給了幾乎所有的高端CPU芯片制造廠商,包括多年的老對手HP。這又一次印證了“沒有永遠的敵人,只有永遠的利益”。
新的64位POWER 3處理器整合了POWER 2(P2SC)和PowerPC兩種架構,特別為科學計算進行了優化,POWER 3每秒鐘能夠執行20億條指令,大約是深藍中使用的POWER2 Super Chip芯片能力的2倍。
同年IBM還發布了第一款POWER架構的SOC(System on Chip,單片機)處理器內核,這款Power PC 405內核不久就被用于各種嵌入式的單片機系統和ASIC(Application Specific Integrated Circuits)設計之中。
1999:IBM開始規劃一項投資10億美元的計劃:建造每秒鐘執行一個quadrillion指令(相當于1 petaFLOP,即1,000T FLOP或1 000 000G FLOP)的新超級計算機。這個計劃的代號是藍色基因(Blue Gene)。這臺計算機比當時最快的超級計算機還快500倍,將用于模擬、分析蛋白質的復雜結構。這個計劃一直延續至今,距離1P的目標越來越近。
IBM在當年就賣出了一百萬塊Power PC銅芯片。在6月,另一款Power PC 405 GP——基于405內核的單片機也被推向市場。
IBM和任天堂(Nintendo)宣布了一項為期多年的合作計劃,總合同額10億美元,用于開發任天堂的下一代家用視頻游戲終端——GAMECUBE的處理芯片,此芯片是Power PC架構的擴展,比當時所有的(包括即將發布的)游戲機芯片都要強大,它可以提供更好的圖形效果,實現更真實的動作模擬。
2000:IBM將原有使用POWER處理器的服務器系列:RS/6000更名為eServer pSeries。此次名字變更并沒有什么技術起因,而又完全是商業行為,IBM準備實現其偉大戰略構想:完成旗下眾多服務器品牌的大統一,在技術實現之前,先把名字統一了,這不需要任何投資,卻向業界傳送了一個重要的信息——整合。
2001:美國勞倫斯拉莫斯國家實驗室(Lawrence Livermore National Laboratory)啟動ASCI白計劃(ASCI White,又被稱為太平洋白),由IBM設計制造每秒鐘執行12.3 trillion指令的超級計算機,用于核爆炸模擬。這是IBM和美國核計劃安全管理委員會(National Nuclear Security Administration,NNSA)聯合啟動的戰略性計算加速計劃(Accelerated Strategic Computing Initiative,ASCI)的項目內容之一。這臺ASCI計算機將為美國能源署工作,可以減少不必要的核試驗,提高核設施的安全性。
同年,IBM發布了使用Power 4處理器的eServer p690服務器(代號“賽舟會——Regatta”大概開發者覺得p690的性能不錯,準備開始和其他UNIX服務器廠商賽一賽,而且32顆CPU的協同工作能力,正是龍舟比賽的特點),這是當時最快的UNIX服務器,是IBM用了5年的時間設計的一款全新的服務器,使用了大量最新的UNIX處理器和Mainframe的制造技術,最多支持32顆CPU。使用p690可以組合成一個具有1000個處理器的超級計算機群組(使用p690作為節點的SP2群集)。
索尼計算機娛樂公司(Sony Computer Entertainment Inc,SCEI)、IBM和東芝(Toshiba)宣布開發新一代芯片用于Internet寬帶網絡時代的信息處理,處理器代號賽羅(Cell),這個芯片將使用世界上最先進的芯片設計和制造技術,內部電路將僅有0.10微米,大約是頭發絲直徑的千分之一,這樣可以讓處理器性能更加強大,操作時散發更少的熱量(因此更加穩定、需要更少的外界散熱設備)。
IBM發布了Power PC 750FX,將片上二級緩存提高了一倍,達到512KB。
2002:IBM發布64位的Power PC 970,這是一款高性能的微處理器,可以被廣泛使用于各種應用環境,包括桌面機,入門級服務器等。此芯片使用了IBM POWER 4處理器的架構,其中包括單指令——多數據的流水線結構(Single Instruction Multiple Data,SIMD),另外“彈性I/O”(Elastic I/O)功能也被引入,這是業界最快的處理器內部總線結構。
IBM開始在pSeries上安裝POWER 4+處理器,于2003年正式對外銷售。
IBM發布支持32路CPU的eServer iSeries 890服務器,使用1.3GHz主頻的POWER 4處理器,使用了一億七千四百萬個晶體管。iSeries服務器現在已經和pSeries共用硬件平臺,只是操作系統不同,pSeries運行AIX,但不能安裝OS/400,而iSeries既可以運行OS/400,也可以安裝AIX。
IBM發布Power PC 440GP和440GX嵌入式處理器,用于網絡和存儲設備,440GX包括片內的TCP/IP協議加速器,獲得了嵌入式芯片EEMBC性能測試的全部5項最高分。
2003:IBM開放了32位嵌入式Power PC芯片的處理器核心的許可權。
蘋果、IBM發布了第一款64位桌上機處理器:Power PC G5,主頻為2.0 GHz,蘋果宣稱使用Power G5的Mac計算機是“世界上最快的個人電腦”(the world’s fastest personal computer見蘋果產品發布說明:http://www.apple.com/pr/library/2003/jun/c3 pmg5.html)。
IBM藍色基因計劃(Blue Gene/L)啟動,于2005年開始安裝到美國勞倫斯拉莫斯國家實驗室(Lawrence Livermore National Laboratory,LLNL),使用65 536個Power PC處理器,64機柜大小的計算群集系統,峰值計算能力達到360 T(1T即1 000G或1 000 000 000 000),占地大約半個網球場。它的結構是在一個芯片上有2個處理器內核,2個芯片組成一塊計算卡,16個計算卡組成一個節點板,32個節點板構成一個計算柜,64個計算柜組成了藍色基因系統如圖1-9所示。

圖1-9 藍色基因系統架構(摘自IBM網站)
同年,IBM發布了使用POWER 4+的pSeries服務器,以及刀片中心(BladeCenter JS20,一種非常薄的服務器,能夠在一個機柜內安裝更多的服務器)。這是在刀片服務器上第一次使用64位的Power PC處理器技術。同年發布的Power PC 750GX將片內二級緩存由750處理器的512KB提高到1MB。刀片式服務器不是由IBM最先發起,但IBM卻最有優勢,這是源自IBM日本公司的貢獻,因為設計刀片服務器的原班人馬都是設計IBM著名的Thinkpad筆記本電腦項目組的成員,把每一片刀片服務器比喻成是裸露的筆記本電腦主板,似乎最恰當不過了。由于這個原因,IBM的刀片服務器在密度(集成度)上一直領先于其他公司,如圖1-10所示。

圖1-10 包含14個刀片服務器的刀片中心抽屜(一個Drawer)及刀片的系統板插卡
2004:IBM開始使用硅絕緣技術制造高性能芯片,硅絕緣(silicon-on-insulator,SOI)與同時使用的應變硅(Strained Silicon)、銅導線技術都是IBM的專利技術,可以提升處理器的晶體管密度,增加性能,減少功耗。64位的Power PC 970FX微處理器是第一款使用此技術的芯片,通過這些技術顯著降低了功耗,提高了處理器散熱能力,因此可以比同類處理器運行于更高的頻率。
2005:藍色基因性能達到183T浮點運算/秒。同年,IBM發布使用POWER 5+芯片的新服務器,如圖1-11所示,其中P代表POWER。

圖1-11 多核POWER CPU
通過不同核心數量的封裝,IBM得以以恰當的生產成本、芯片合格生產率和芯片質量為業界提供靈活多樣的產品組合。因此IBM在2004/2005/2006年能夠在沒有重大芯片產品推出的情況下發布一系列的服務器新產品,這其中包括采用不同的芯片封裝:DCM(雙核)用于低端服務器;QCM(四核)用于中高端服務器;而MCM(八核)用于高端服務器。對于同一類型的服務器,又可以使用不同的主頻,從1.65GHz到2.2GHz。
2007:在本書即將出版之時,IBM新發布了POWER 6 CPU,采用更高集成度制造工藝和主頻,最高主頻達到近5GHz。POWER 6采用65納米絕緣硅(SOI)工藝、10層金屬導線,在340平方毫米的一塊芯片上集成了兩個同步多線程處理器,以及每個內核專用的二級高速緩存。
POWER 6有極高帶寬可提供給處理器內核。在5GHz下,每個MPU都有300GB/s的帶寬,大約80GB/s來自三級高速緩存,75GB/s來自內存,80GB/s來自MCM內總線,50GB/s來自遠程處理器,20GB/s來自本地I/O。POWER 6的非核心功能部分運行頻率都是核心頻率的一半,2GHz~2.5GHz;而各種POWER 5+處理器的頻率大約為0.8GHz~1.15GHz。
POWER 6的系統架構完全經過了重新設計,用于企業級系統的POWER 6使用兩條單向環(uni-directional ring)實現MCM內通信,而MCM間通信通過二維網狀結構(類似Switch)來進行。POWER 6使用了兩層架構和新的一致性協議進行配對,每個POWER 6 MCM組成了一個“單元”,全連接網絡中最多可以排列8個單元,在設計結構上可以支持到128個CPU內核。
討論
一臺計算機到底可以值多少錢?
這個話題無疑有嘩眾取寵之嫌,但確實這臺機器太貴了。IBM剛剛和美國政府簽署一個價值$244M美元(兩億四千四百萬美元),期限為4年的合同,合同的目的是為DARPA(就是著名的Internet的誕生地)建造“一”臺計算機。也就是說,這臺計算機價值將近18億人民幣,也許是有史以來世界上最昂貴的計算機。當然,這臺計算機不僅僅是昂貴,它將是目前最快的超級計算機運算能力的100倍,將達到10Peta浮點運算/秒的性能。
1P=1 000T=1 000 000G=1 000 000 000M=1 000 000 000 000K=1 000 000 000 000 000次浮點運算。通過這臺機器,10 000 000 000 000 000次浮點運算可以在1秒鐘內完成。
DARPA的高處理能力計算系統項目(High Productivity Computing Systems,HPCS)自2002年啟動,這是第3代建設,最早由Sun公司建立了第一套系統,而今天的這個合同,就根本沒有邀請Sun參與。IBM的銷售人員曾經這樣開玩笑:即使邀請Sun,他們也拿不出東西,10P/s是真金白銀的計算力,即使Sun能交貨,也一定是一棟大樓,里面是Sun的所有員工,每人面前一臺Sun PRIME POWER 25k,然后拿著電話聽筒報答案。
超級計算機之戰如火如荼,建造超級計算機的熱潮愈演愈烈,打水漂一樣投錢。此前不久,美國能源部剛定制了一臺價值$58M的超級計算機,最終將達到500T的處理能力(現在已經達到280T),用于模擬核爆炸。在這個數量級的超級計算機之戰完全沒有懸念,只是看誰有錢,賣家只有IBM。當然,微軟也虎視眈眈,但畢竟超級計算機是CPU,群集技術的組合,需要硬件、軟件廠商的配合,微軟要找一個聯姻廠商,HP?更可能是HP/Intel/MS的組合。
這臺世界上最貴的超級計算機除了計算力龐大之外,用途也不太一樣,DARPA希望它能更容易地使用,甚至可以在遠程自由(當然是授權用戶)使用,并且更傾向于成為政府的公共計算資源,提供給包括商業用戶在內的使用者。各種強悍的、胃口巨大的、專用的計算程序都可以很容易地在此臺超級計算機上加載、運行。例如計算天氣演變、模擬人類生長/衰老過程,甚至仿真禽流感病毒入侵。以往,很多此類程序都是軟硬件綁定的,特別軟件為特別計算機硬件設計、部署,如果真能實現這個通用、動態加載、高性能計算的目標,可能在不遠的將來,計算機又會在合久必分之后,分久必合。我們嘲笑老Watson(IBM創始人)所說的“可能以后世界上只需要5臺計算機。”這句話的時候不得不重新思量,也許今后世界上真的只需要5臺計算機!
建造超級計算機是一項龐大的系統工程,需要CPU技術(IBM早已經開始了POWER 7的研發),需要操作系統(當然是可愛的AIX),需要并行文件系統(GPFS),需要并行計算環境(IBM PE,并行計算庫),需要高效的節點間內部連接和存儲系統。這些技術無疑能極大地提高IBM在服務器領域的競爭力,超級計算機的力量不僅僅在于實力的證明,還能借用此投資進行技術演繹,得到廣告效應,其震撼力也是100倍的。
除了IBM之外,其他廠商也不甘落后,IBM也不能獨霸排行榜全部席位(IBM大約占據了一半左右),特別是x86(兼容)系列CPU,最近有異軍突起之勢。有興趣的朋友可以訪問最近發布的Top 500——http://www.top500.org/list/2007/11/100查詢最新排名(本書出版前的最新發布是2007年11月)。
1.2.2 競爭對手
HP(惠普)和Sun是IBM的死敵,他們都曾經在小型機市場上稱霸一方。HP也有若干款企業級服務器。
1.基于Alpha芯片
來自于DEC公司,可以運行Open VMS,DEC UNIX和Windows NT/2003操作系統。經過幾年的反復,惠普終于停止了此產品線研發,從今年(2007年)5月開始不再發布新產品,對舊產品的升級服務到明年4月,維護服務繼續支持到2012年。在此微妙的問題上,HP使用了至少支持到2012年這樣的字眼,但至多呢?
2.基于PA-RISC芯片
惠普公司原有產品,惠普用此款芯片生產了HP 9000系列,高端被稱為Superdome服務器(即HP 9000 Superdome),運行HP-UX(惠普公司的UNIX),Open VMS, Windows Server 2003企業版或者數據中心版(X64),還有Redhat Linux企業版和Suse Linux企業版也可以運行。
3.基于MIPS芯片
惠普的NonStop系列來自1997年Compaq收購的Tandem公司,是一家比較著名的生產容錯計算機的廠商,原使用MIPS CPU,由于惠普市場策略,其高端服務器被稱為Integrity NonStop服務器,被轉移到Intel的IA-64上,現在只有中低端,依然是用MIPS CPU。估計不久,此系列服務器都會轉為IA-64。NonStop系列以前使用的是T/TOS (Tandem Operating System),現在HP只使用了NonStop內核。雖然從兼容性上,也與各種UNIX不相上下,但類似IBM的i系列服務器,總被認為缺乏開放性,而且確實在此系列服務器上,對于大型商業軟件的支持數量非常有限。不過由于NonStop內核對容錯性的支持比較好,在一些專業領域,NonStop服務器還有一定的需求。
4.基于IA64芯片
惠普現在產品的主力都使用IA64芯片,HP生產的Integrity服務器大都采用了IA64芯片作為CPU,可以運行HP-UX,Open VMS,同時支持Windows Server 2003企業版或者數據中心版(X64),Redhat Linux企業版和Suse Linux企業版也可以跑在這款服務器上。
5.基于x86芯片
惠普的PC服務器,支持Windows和各種Linux系統。
惠普當前面臨著與2003年IBM相同的難題,如何整合這幾款服務器?整合或者刪減服務器體系已經成為必然,現代芯片研發行業的成本極其巨大,動輒需要幾十億、上百億美元用于研發,同時研發多款芯片必然分散技術力量和資金,結果是沒有拳頭產品,所以是否整合已經無需考慮。目前尚未有來自新惠普的明確聲音,猜想IA64芯片的服務器是最后歸宿,只是惠普在和Intel合作開發IA-64的過程中進展不順,導致了期間幾次反復,很多早應當終結的產品線遲遲不能結束,特別是PA-RISC,甚至在停止研發之后又不得不重新續命,不知HP何時能走出此困境。
Sun的產品相對比較單純,高端服務器使用SPARC VI芯片,低端則使用SPARC IV或SPARC III等,可以運行Solaris(是UNIX的一種改良版)。Solaris還可以跑在Intel/AMD的x86平臺上,這與AIX及HP-UX不同,Sun的中端服務器就是使用AMD Opteron或Intel Xeon。Solaris自己的芯片產品化力量比較弱,幸好SUN將自己的芯片體系開放了出去,Fujisu(富士通)按照這個架構開發的最新的SPARC 64 VI有不錯的性能表現,SUN現在就利用Fujisu的SPARC芯片裝備自己的高端服務器。Sun的中低端服務器還可以支持Windows Server或著Linux。
1.2.3 IBM eServer pSeries
pSeries是本文的主角,IBM現在銷售的最新產品系列從低到高有許多種,通常第一個數字代表CPU種類(最新的Power 6系列CPU例外,依然沿用5xx的命名規則),例如595與520的CPU是同一種類的,都是POWER 5系列的CPU(可能頻率不同),690則使用的是另外一種CPU(比POWER 5落后一點的POWER 4)。而后面的兩位數字則代表了該型號機器的體系架構,數字越大代表體系架構越大,可以支持更多的CPU、內存和I/O卡,可靠性穩定性越好(冗余度更高)。在CPU種類、數量和其他配置相同的情況下,體系架構更高的型號性能稍高一點(不超過10%),但價格相差很多。IBM的幾個主要款式服務器如圖1-12所示。

圖1-12 pSeries服務器產品
圖1-13是機柜內的570和桌邊式520的照片。570屬于中端服務器,被設計成多個抽屜式(CEC)的結構,每個抽屜最多可以放置4顆CPU,多個抽屜之間用集成電路板連接,實現高速總線互聯。其他的IO卡放置在單獨的IO抽屜中,通過被稱為RIO(Remote IO遠程IO)的電纜與CEC抽屜連接。CEC之間,CEC與IO抽屜之間的連接都是環形的,有任何一條鏈路發生故障,還可以從另一個方向迂回連通,具有一定的冗余性。

圖1-13 pSeries 570和520
在IBM的鏈路設計中,一直喜歡環形的結構,環形結構是實現節點互聯,同時提供單點保護的最少線路結構。隨著接觸IBM的產品,會越來越多地接觸到環形結構。
570以下的服務器的結構都差不多,幾乎等同于不同數量的CEC抽屜和IO抽屜的組合,例如520和一個豎起來的CEC抽屜一樣如圖1-15所示。590/595與其他型號之間外觀差別比較大,為了散熱、增加IO擴展能力等原因,增加了許多風扇、IO接口卡等設備,從圖1-14到圖1-16展示了IBM幾款服務器的外觀和內部結構。關于這些產品的詳細信息和外觀,請訪問IBM的網站:
http://www-900.ibm.com/cn/products/servers/pseries/index.shtml

圖1-14 p5 505Q內部結構

圖1-15 p5 520外觀和內部結構

圖1-16 p5-550/570外觀和單抽屜內部結構,p5-590/595外觀
問題:高端、低端服務器有什么區別?
答案:高端低端服務器可以從三方面來區分:CPU主頻、整體架構、市場策略。
(1)CPU主頻
盡管有些時候,高端服務器和低端服務器使用不同類型的CPU,但通常都是一樣的,區別僅在于高端服務器一般采用較高的主頻,低端則采用低一些的主頻。舉例來說,高端服務器p690
的CPU主頻有2款,分別是1.9GHz,1.65GHz;對應的低端服務器p610只有1.65GHz,1.45GHz,1.2GHz的產品。而實際上,它們的CPU都是相同的,只是主頻不同(這里給想“超頻”的發燒友留下了懸念)。
(2)整體架構
高端和低端的整體架構差別很大。通常高端服務器為了提供更快的處理速度、更穩定的系統,在進行設計的時候比低端考慮更多。例如支持更多的最大CPU數量、更寬的總線,更多的熱插拔設備支持,更高的設備冗余度。低端服務器比高端服務器相應標準降低了許多,這樣即使裝配了相同數量同主頻的CPU,高低端性能測試也會稍高,這是由于機器的性能不只靠CPU,還需要總線、外設的配合。由于CPU還是最關鍵的因素,因此差距并不會非常大。同理,同為一個等級的服務器,如果CPU增強一倍,性能也不會有超過一倍的差距,可能只增加了30%。
(3)市場策略
小型機的價格不僅與CPU型號和數量有關,還與高低端類型有關。同為8路1.65GHz的服務器,如果是高端的p670,會比低端的p650貴很多。這里面不但有體系架構的成本(670的冗余度更高),更有市場策略的原因:既然追求高端,高性能、高穩定性,廠商的銷量少,自然利潤率就要高一些。與這個市場策略對應,附帶的服務也會更好,例如IBM對高端服務器提供原廠工程師安裝、3年7天24小時響應的免費維修,而不是對低端服務器采用的集成商自己安裝,1年5天9小時響應的免費維修標準。
思考題:同樣的投資,買高端低配的服務器合算,還是買低端高配的服務器合算?
1.2.4 最后的對手
藍巨人向來船大難掉頭。如果在其轉型之前,競爭對手能夠以快制慢,搶先前三招,這個巨人就再無還手之力。Wintel聯盟就是這樣把IBM擠出了PC市場:先是OS/2不敵Windows,后來逼迫IBM將連年虧損的PCD(IBM PC的部門)賣給聯想,盡管IBM在筆記本電腦領域還有優勢,最后也不得不烈士斷腕。但是如果對手沒有抓住這個機會,等巨人進入了狀態,就絕對再沒他們的機會了。從DEC、Compaq到最后的新惠普,IBM恰好獲得了這個時間,雖然Sun,HP還能支撐下去,但從UNIX服務器領域,已經沒有辦法繼續抗衡IBM,未來IBM在UNIX服務器市場會不會找不到對手?
一個不容忽視的敵人就在眼前——PC服務器正在茁壯成長。從個人機擴展為服務器,再到與小型機爭奪市場,PC的成長速度非比尋常。而且PC服務器也如同它的大哥“小型機”一樣,從大型機中吮吸著先進技術,將其平民化,為己所用。雖然時至今日,小型機與PC服務器之間仍有“代溝”需要逾越,但它們之間的差距已經越來越小了。
那么小型機與PC服務器到底有什么區別?從各種性能評測指標到單一CPU處理能力,小型機似乎并不占優勢,那么它昂貴的原因何在?難道僅僅是欺世盜名?市場是很公正的,一個噱頭產品可以熱賣一時,卻不能長久。小型機之所以能占據市場幾十年,向上侵蝕大型機市場,向下抵擋PC服務器的沖擊,不斷開疆擴土,其中還是有很多原因的,我們可以從性能、可靠性、擴展能力這幾個比較有特點的方面來分析。
如果是單一CPU,PC服務器所用的Intel Xeon或者AMD Opteron并不比小型機所使用的CPU性能差。但是在PC服務器上發布的操作系統最多只支持到16顆CPU(最新的一些操作系統也可以支持更多的CPU,甚至與UNIX達到相同的支持度,例如Windows 2003 Data Center 64bit版,這開始給UNIX服務器越來越大的壓力)。
與此對比,在小型機上,一臺機器集成的CPU總數已經達到了幾十到幾百顆。目前,IBM p595配合AIX 5.3操作系統可以支持64顆POWER5 1.9GHz CPU; HP的Superdome使用PA-8900或Intel Itanium 2芯片更可以支持128顆CPU;Sun的M9000使用SPARC 64 VI芯片也可以支持128個CPU(內核)。這種超級的并行處理能力把PC服務器及Windows操作系統遠遠拋在后面。盡管當CPU增加后,處理能力不能完全實現線性增長,但毋庸置疑,80個CPU比8個CPU總要快得多(在相近主頻和制造工藝、技術的情況下)。
不僅僅是硬件處理能力,操作系統自身的管理能力也非常重要,能夠將數十個CPU充分調動起來,充分發揮每顆CPU的能力,本身就需要非常復雜的技術。另外,操作系統還要對一些內存的進程進行管理,如果某個進程有問題(例如死循環),可能會把系統的資源耗盡。UNIX在設計之初就是為更好地協調多用戶、多進程之間調度而設計的,通常可以更好地控制這些耗資源的進程,在各個進程之間合理地分配CPU處理能力。最后,UNIX一般也不提供很復雜的多媒體、圖形界面,而這些絢麗的用戶界面卻是CPU和內存消耗的大戶!
由于以上原因,在低端市場,小型機完全處于劣勢,但是到了高端,形勢開始逆轉,只有小型機才能負擔得起繁重的處理任務(當然還有Mainframe大型機)。
處理能力強不僅僅靠CPU,CPU僅代表計算能力,小型機還需要IO支持,如果機器不能及時接收請求,計算完成后無法返回結果、不能保存,計算能力再強也無用武之地,或只能用于特定的計算領域。一般小型機體系設計最多都可以支持一百個以上的IO通道卡,可以提供足夠的帶寬將處理結果從網絡發送出去或者保存到磁盤,同時還能夠及時接受新任務。幾乎沒有哪個PC插了10塊以上的IO卡,當業務量大的時候,即使CPU忙得開,IO也處理不過來。
并不是隨隨便便就可以增加處理卡數量的,IO控制器、總線帶寬制約了可以插接的IO卡、內存和CPU的數量。因此小型機往往采用特殊的技術,來實現近乎瘋狂的擴展能力。與之對比,PC和PC服務器則更多地考慮兼容性問題,可以插接各種第三方的接口卡,看重種類而不是數量,因此在接口上就不能采用很特殊的技術,要大眾化,要兼容,性能自然大打折扣。這些兼容卡也使得硬件設備和操作系統更難以保證穩定可靠。通常小型機的接口卡種類也不算少,但與PC相比,則幾乎都是各自生產自己的接口卡(或者OEM某些知名廠商產品),經過整體長時間測試后才能出廠,因此可靠性比較好。PC則不然,采用大家遵守同一標準的設計、生產方式生產,各自測試自己的穩定性,互連測試也以兼容性和性能為主,穩定性只要不太差,都可以接受。因此難免Windows經常藍屏,硬件死機(為了減少這種情況,建議只使用原廠的板卡),如果發現這些兼容問題都被推到微軟產品頭上,比爾蓋茨只能苦笑。
由于小型機性能、可靠性和擴展能力的原因,更多地被用在一些要求苛刻的商業環境里,例如銀行、通信的計費/賬務部門、生產流水線控制。在這些領域,要求7×24小時連續運行,單機達到全年99.9%以上的可用性(全年累計停機時間不超過50小時,包括計劃內的檢修和計劃外的設備故障),雙機達到99.99%以上(全年53分鐘以內的業務中斷時間)。
小型機與PC服務器相比,有許多不同點。表1-1簡要對比了這些區別(以IBM pSeries小型機服務器和xSeries PC服務器為例,并且對應指標選擇的是同系列中最高的,可能無法在同一臺服務器上實現)。
表1-1 IBM小型機IBM PC服務器對比

未來市場到底誰領風騷?我們前文提到的各種CPU的未來前景如何?現在還難以預料,也許是小型機繼續稱霸,也許是PC服務器挑戰成功,但作者更相信是一種介于兩者之間,集兩者優勢于一身的新生命體,小型機的概念會越來越模糊,惠普公司運行Windows 2003 Data Center 64位版操作系統,使用IA-64芯片的Superdome服務器就是這樣的一個例子。IBM由于其市場策略,尚沒有讓pSeries小型機運行Windows的計劃,也沒有讓AIX跑在x86/IA64架構的計劃,預計一兩年之后,IBM將完成四大系列中三大系列(p, i, z)的統一,無疑要考慮x系列的最終大統一問題,到時候會發生什么我們只能拭目以待。在IBM小型機最新的操作系統AIX v6.1上提供了AVE(Advanced Virtualization Environment)功能,將可以直接運行x86 Linux程序,這似乎透露了一點信息:IBM不會給Windows在小型機上留有一線生機,但對Linux卻網開一面。
圖1-17是當今幾款主流的Unix服務器所用的CPU的未來發展路線圖,有興趣的朋友可以訪問這些CPU/服務器生產商的網站,了解他們的發展策略。
① DCM Dual Core Module雙核結構
② DCP Dual Core Processor雙核處理器
③ SMI Synochous Memory Interface同步內存訪問接口

圖1-17 幾款主流CPU發展路線圖
每個廠商面對未來市場走向都會一臉迷茫,無一例外,即使他們每個都信誓旦旦不遺余力地鼓吹自己預測和決策的正確性的同時,每個廠商都在自己偷偷安排后路。IBM也是如此,因此有了Monterey計劃,這是IBM在小型機領域何去何從的重要轉折點。
Monterey計劃
微軟曾經算計了IBM,使用緩兵之計,拿Windows打死了OS/2。此次IBM偷得此計,轉身送給Intel/Hp的IA64聯盟,又加以發揮,暗渡陳倉回敬了微軟一拳,讓微軟進軍服務器領域整整晚了5年。
不知是未卜先知還是早有預謀,Monterey(蒙特列爾,加拿大一座著名城市)這個名字背后就有諸多故事。最著名的1976年蒙特利爾奧運會預算1億多美元,卻花費了24億美元,虧空10多億美元,這筆債務直到去年(2007年)才還清!在當時,蒙特利爾這座僅僅擁有50萬人口的小城市,建造了可以容納5萬人的奧運主體育館,奧運結束之后,她還有后招去吸引如此之多的觀眾、游客去填充它么?
1998年是多事之秋,在這一年,IBM的POWER系列芯片還沒有走上正軌,而Intel卻如日中天。有傳言說Intel沒有干掉AMD,讓其一息尚存是是為了避免美國反壟斷法騷擾,Pentium芯片正實如其名地在奔騰中橫掃市場。絕對壟斷了PC市場之后,高端UNIX服務器市場無疑是利潤豐厚的一大塊肥肉。同一年,PC暴發戶Compaq收購了DEC,IBM的小型機尚不成氣候,大部分的UNIX服務器產品都是OEM自法國布爾(Bull)公司。HP已經皈依了Intel旗下,IA64的名號誰人不知,大有未來3年之后,高端CPU市場只有IA64,別人都是陪襯的架勢。在這種潮流下,IBM自知難以抵擋,既然“硬”的不行,就千萬別重蹈覆轍,讓微軟借勢上馬,以PC操作系統為立足點,挺進服務器操作系統。
IBM的策略很簡單:用自己AIX操作系統的優勢,去占據IA64硬件平臺。而比IBM面臨更大威脅的是SCO——這個只有軟件操作系統,沒有硬件平臺的公司。所以Monterey計劃由此兩家公司發起,絕非偶然。
Monterey計劃的目標是以IBM的AIX和SCO的Unixware為基礎,開發出滿足中高端商業服務器市場的超級OS,能夠支持IA-32,IA-64架構的CPU,是運行在IA-64上的UNIX,而不是運行在IA-64上的Windows。以IBM的名號,Monterey還糾集了Acer, Bull, CETIA, Compaq, ICL, Samsung, Sequent, Unisys,當然Intel和SCO也在其中。
按照圖1-18中所規劃的時間表,到2001年,Monterey這個新的操作系統就會取代AIX,變成一個全新的超級OS,去和Windows死拼,而IBM的Power CPU,也許就此終結。HP就是如此,他賭上了IA-64,同時放棄了HP-UX,而轉身去擁抱Windows,3年之后,IA-64和Windows NT的拙劣市場表現,讓HP不得不重新起用自己的子弟兵,給PA-RISC芯片和HP-UX續命,但在IT市場,3年的時間已經太久了。
IBM卻沒有把全部賭注都壓到Monterey和IA-64上,也許此計劃都算不上是給自己留的一條退路,真實的目的是IBM在玩弄緩兵之計,因為在1998年同年,IBM研制成功了POWER 3,終于可以說趕上了RISC芯片設計第一陣營的隊伍,而幾個月后發布的銅芯片技術,則使IBM能夠在未來3年中繼續加速,最終用POWER 4/5奪回了高端CPU設計領域的霸主地位。

圖1-18 Monterey計劃時間表
當IBM的POWER 4發布的時候,再也不需要Monterey這個怪胎,Monterey已經完成歷史使命,無疾而終,被市場遺忘。IBM此時則又舉起另一桿大旗——Linux,AIX 5L應運而生。AIX 5L的意思就是AIX第5版,同時提供了Linux界面、管理方式和API支持。
由于Monterey確實支持IA-64,也有計劃把IA-32(x86)納入支持范圍,因此現在還有不少人認為IBM曾經開發過跑在x86架構上的AIX,其實這個IA-64版本都沒有在市場上發布(其實IBM曾經在2001年賣出了32套),只有一些軟件開發商收到過用于預開發、測試的軟件包。另外在AIX 3版本的時候,還曾經可以安裝在x86的PC上,但在此之后,就沒有任何一個版本的AIX可以安裝在非POWER系列CPU的計算機上了。
如果當初IBM是真心實意在搞Monterey計劃,拿這個計劃可以算作IBM歷史上最不成功的企劃之一了,不但項目最終被放棄,由于和SCO的合作,還被SCO投訴其非法使用了SCO版權的Unix系統代碼用于以后AIX的開發,惹來一場官司。