- 企業開源實踐之旅:基于紅帽客戶的開源建設實踐案例
- 劉翔 任衛海等編著
- 900字
- 2024-04-15 11:51:25
1.4.4 基礎設施
近些年,大型企業數據中心隨著對開放平臺算力需求的大幅增長,已經開始從購買虛擬化、超融合、IaaS平臺的基礎設施構建模式發展到基于開源平臺來搭建基礎設施。容器技術的突破不僅改變了應用的運行模式,也改變了數據中心的部署和維護模式。在容器技術之前,虛擬化幫助IT部門解決了如何切分和復用一臺大型設備,并使軟件堆棧可以脫離具體硬件環境,但并沒有改變應用的形態,也無法將開放平臺的算力整合為一個更大的可用資源。隨著容器和云原生應用使服務變得標準,使其可以在對業務完全透明的情況下穿越服務器的物理環境邊界運行在其他可用的硬件資源上,并且能夠做到按需彈性擴縮容。隨著更多的細粒度的服務運行在云基礎設施上,網絡開銷成為制約服務細分的障礙,但是隨著DPU的運用,開放平臺跨硬件邊界的網絡調用開銷問題將得到大幅的改善。依托開源軟件建立起來的基礎設施漸漸具備了與大型機和小型機比肩的能力。
基于開源軟件的基礎設施服務也是最近被熱議的內容,Tim O′Reilly表示,在開源的云時代,開發者分享代碼的動力是讓別人運行自己的程序,從而提供一份源代碼。但這件事的必要性已經慢慢消失了。O′Reilly的內容戰略副總裁Mike Loukides以Meta開源的大語言模型OPT-175B為例,解釋了在基礎設施領域發生的變化。OPT-175B的源代碼雖然很容易下載,但你手頭的硬件卻無法對其進行訓練,甚至對于大學或其他的研究機構來說,OPT-175B都過于龐大。另外,即使是有足夠計算資源的谷歌和OpenAI,也無法輕易復刻OPT-175B,因為OPT-175B與Meta自己的基礎設施(包括定制硬件)聯系過于緊密,很難被移植到其他地方。Meta并沒有想要隱瞞有關OPT-175B的內容,但構建類似的基礎設施真的很難。即使是對于那些有資金和技術的人來說,最終也無法構建出一套相同的基礎設施。
2022年全球前三云廠商——微軟、亞馬遜、谷歌分別實現了26.5%、29.4%、37.3%的云業務營收增長,云-企業軟件-AI計算三條輪動的業務線幫助云巨頭們建立起一個相互拉動的業務模式,在云業務上降低算力成本并提高計算效率成為其制勝法寶,企業軟件貢獻了超高的毛利率,而AI計算服務化是目前各家爭奪的戰略制高點,也將成為接下來云業務中競爭最激烈的戰場。這種已經無法自建的基礎設施能力對于企業來說,也是未來進行IT架構設計時需要思考和應對的問題。