官术网_书友最值得收藏!

未來十年,誰擁有芯片,誰就將制勝于更長遠的未來

任何智能發展都離不開硬件基礎。除了現在人們熟知的CPU(中央處理器)、GPU(圖形處理器)、FPGA(現場可編程門陣列)、專用加速器等智能計算的硬件基礎外,一些硬件架構技術也在不斷加速發展。例如英特爾公司最近推出的Loihi神經擬態芯片(Neuromorphic Research Test Chip),就是模仿人腦神經元的構造、連接方式和工作方式設計實現的。神經擬態計算從人腦的信息處理機制中獲得靈感,來構建人工智能系統。Loihi是目前最先進的神經擬態計算處理器,它采用英特爾領先的14納米工藝制成,集成度高,在60平方毫米的芯片上有13萬個神經元和1.3億個神經突觸(見圖1-5)。它能達到什么效果呢?Loihi支持多種脈沖神經網絡架構,可以在很低的功耗下工作(這一點和人腦非常相似)。最重要的是,它具有可編程學習能力,能夠在線自主訓練,并且支持多種學習算法,包括監督學習、非監督學習、增強學習等。Loihi的能效比通用處理器高1000倍。目前,一塊小芯片能使13萬個神經元互相連接。英特爾公司在2019年7月宣布,包含64塊Loihi研究芯片、代號為“Pohoiki Beach”的800萬神經元神經擬態系統已經可以供廣大研究人員使用。

圖1-5 Loihi芯片和64芯片神經擬態系統

那么未來十年,智能計算會發展到什么程度呢?我大膽地預測一下。假設未來芯片的晶體管密度按照摩爾定律的速度發展——10納米、7納米、5納米,十年之內一定會超越5納米,那么晶體管密度至少會提高8倍。然后,我們還可以用3D芯片制造技術,在一顆芯片內封裝多層內核。假設十年后,通過3D芯片技術可以讓計算密度再提高64倍,我們便可以像Pohoiki Beach一樣設計多芯片互聯的系統;假設十年后,我們可以互聯1000塊芯片,那么這樣的系統尺寸會做到多大呢?可能比我們現在用的桌面型打印機還要小。這樣的系統可以容納670億個神經元,已經很接近人腦的神經元量級了!

當我們展望下一個十年或者更長遠的未來時,隨著人工智能應用變得愈加廣泛和深入,僅靠一種架構的AI芯片是不能解決各種問題的。同時,隨著創新速度越來越快,設備種類越來越多,其要求的迭代速度也越來越快,我們不會再有一個獨立的平臺(例如20世紀90年代到2000年的PC,2005年到現在的手機)。傳統的異構計算已經不能滿足日益發展的人工智能計算需求,我們正在邁入超異構計算時代。

異構計算在20世紀80年代就已出現,它是指在完成一個任務時,采用一種以上的硬件架構設計,把它們組合在一起。組合方式主要包括:一體化SoC(系統級芯片),它的專用性最強、能耗最低,性能也很好,能效比非常高,但只有應用范圍很廣時,投入產出比才會更高;分體式板卡,它的優勢在于靈活,可以在需要的時候隨意組合,但板與板之間連接的功耗、帶寬速度都要大打折扣。

超異構將提供更多的靈活性和更快的技術應用周期,推動計算創新發展。它包含三大要素:多架構、多功能芯片,多節點和先進封裝技術,統一的異構計算軟件。在多架構、多功能芯片方面,有標量、矢量、矩陣、空間等多種計算架構。例如,CPU是標量架構,GPU是矢量架構,深度神經網絡的專用加速芯片是矩陣架構,FPGA是空間架構。在多節點和先進封裝技術方面,傳統的封裝就是把芯片平鋪在一起,這種方式存在一些缺點:一是增加了面積,二是芯片之間的連通帶寬還需要加速。2.5D和3D封裝的出現解決了這些問題,不只是把計算芯片和內存連接起來,還能把計算芯片互相連接,并像高樓一樣分成幾層堆起來,這就是先進封裝技術。同一個異構系統中需要使用多種架構的芯片來完成計算任務,而對于開發者來說,掌握多種架構的軟件優化技巧比較困難。統一的異構計算應用程序接口(API)可以解決這個問題,它利用預先研發的軟件庫來封裝不同種類的硬件架構,從而為軟件開發者提供統一的編程接口,降低開發難度并提高效率。未來的人工智能芯片會將這些技術綜合使用,獲得性價比、能耗比最優的智能計算方案。

主站蜘蛛池模板: 太谷县| 牟定县| 白水县| 海原县| 濮阳县| 乐都县| 广宁县| 广东省| 镇坪县| 新巴尔虎左旗| 日土县| 大宁县| 盘山县| 霍州市| 南皮县| 彰武县| 德格县| 永福县| 岐山县| 南郑县| 荃湾区| 航空| 潞城市| 新沂市| 松滋市| 甘南县| 永丰县| 二连浩特市| 中江县| 浏阳市| 青田县| 合水县| 芦溪县| 海伦市| 怀集县| 教育| 深圳市| 克东县| 德安县| 大足县| 肇庆市|