- 云計算和大數據服務:技術架構、運營管理與智能實踐
- 陳赤榕等
- 2221字
- 2023-09-26 15:57:03
2.3 云服務對技術團隊帶來的挑戰
云服務對技術團隊帶來的挑戰可以歸納為以下幾點,如圖2-2所示。

圖2-2 云服務對技術團隊帶來的挑戰
(1)服務特性(Service Features)。
通用性和個性化對服務實現的挑戰,云服務實現不針對特定的客戶應用,在“云”的支撐下可以構造出千變萬化的應用,同一個“云”可以同時支撐不同的應用運行。這要求產品設計和開發要很好地處理通用性和個性化的需求之間的平衡。
(2)可靠性(Service Availability)。
云計算服務往往服務眾多客戶,遍布全球,需要提供24小時不間斷服務,需要提供99.99%或更高的服務可用性。
(3)可擴展性(Scalability)。
“云”的規模可以動態伸縮,滿足應用和用戶規模增長的需要。這要求平臺在構建時就滿足可隨時擴展的要求。
(4)可管理性(Manageability)。
運營商的大規模數據中心的管理,比如Google云中心已經擁有100多萬臺服務器,亞可遜、IBM、微軟、雅虎等的云中心均擁有幾十萬臺服務器。企業私有云一般擁有數百上千臺服務器。這些都需要平臺的可管理性。
(5)成本效益(Cost Efficiency)。
IaaS、PaaS、SaaS的建設需要大量的投入,這需要云服務提供商在設計和建立階段,就要以成本效益為重要的考量。
2.3.1 對研發團隊的挑戰
提到云計算,大家首先會想到Google File System、MapReduce、BigTable、Hadoop、NoSQL等技術,技術會對研發團隊帶來挑戰。但是,這不是研發團隊的唯一挑戰,如何結合這些技術,實現自己的商務意義上的云服務,應對來自市場對云服務的根本要求,從傳統軟件開發,轉向云服務軟件開發,才是研發團隊面臨的最大挑戰。
本質上講,云服務是將傳統企業IT服務互聯網化,通過集中規模效應及引入新的服務模式,降低企業IT開銷,云服務,無論是SaaS、PaaS還是IaaS,對于研發,都會面對多租戶、大容量、高可用、海量數據以及高安全性的挑戰。
面對多租戶環境,研發團隊會面對標準化與個性化功能問題,固有的軟件配置方式與多租戶的個性化配置有著本質差別,同時,軟件功能靈活性要求比傳統IT軟件要高很多。而多租戶也帶來了服務站點、個性化用戶體驗等一系列新的要求,對服務軟件開發提出了挑戰。
傳統企業級IT軟件,同時在線使用的是企業內部人員,根據企業的工作時間,中斷服務維護是常見的方式,而對于云服務,服務于以百萬計的企業,服務中斷結果往往是災難性的,這樣對系統可靠性的要求就顯著提高了,如何實現高可靠性是對研發和技術運營的一個更大的挑戰。
多租戶和大用戶量是云服務的基本特征,云服務以規模效應替代企業傳統IT服務,只有在大規模情形下,才能降低成本,而大用戶量意味著高并發及海量數據,如何提升計算能力、存儲能力,降低服務成本,穩定一致地支持大容量及海量數據是研發團隊面對的另一個挑戰。
云服務平臺架構如何應對這些挑戰,將在技術架構部分詳細講解。
2.3.2 對技術運營團隊的挑戰
如前面所講,云服務需要面對多用戶及高可靠的需求,這些都對運營團隊帶來了不小的挑戰。
首先,傳統IT運營,處理問題是面對一個企業,使用模式相對單一,問題容易定位,而云服務系統,使用企業的模式千差萬別,面對不同功能配置、不同流程的問題,處理要復雜很多。
其次是用量問題,系統在不停地增加不同行業、不同地域的用戶,對系統、網絡、存儲的使用是極端不均衡的,如何應對瞬間壓力上升時,對網絡、存儲及計算能力產生的沖擊,如何預測并控制這些峰值出現,做好應對準備,都是技術運營的巨大挑戰。
除了這些因素外,多用戶系統將一部分配置工作交給客戶管理,根據用戶站點進行配置是這些配置的一個特點,這些原來由運維團隊完成的配置由用戶來完成,就不可避免地提升了系統維護的難度,如何應對客戶配置對系統的沖擊,也是運營團隊的挑戰之一。
最后,高可用性、7×24小時不間斷服務、日常維護、升級等,都要求在服務不中斷的方式下完成,同時對任何一個故障,都要能夠有相應應對,保障服務不中斷,這成為運營團隊的巨大挑戰。
2.3.3 對服務質量控制團隊的挑戰
服務質量控制(Service Quality Control)團隊通常包含兩個基礎部分,一個是質控分析團隊(Quality Analysis),另一個是質控實施團隊(Quality Control)。這兩個團隊在云服務的場景下,都面臨極大的挑戰。
第一,多用戶環境明顯有別于一般的應用軟件系統。在設計階段的質量分析和實施階段的質量檢測,其實施思路和手段有極大的不同。舉個例子,多用戶環境可能要求在IaaS某些組件失效的情況下具備熱數據遷移功能,而這個要求在一般應用服務系統中是根本不可能出現的情況。
第二,云服務的基礎資源管理和大規模并發處理要求,比一般應用服務體系的壓力及穩定性要求高得多。在分析和檢測手段上,模擬客戶端訪問流量和壓力測試結果復盤,也要求質控團隊有更多、更強的測試設備、測試資源。那么設計、管理、采購、維護及更新這些測試資源,本身也是極其耗費精力的事情。比如,測試一個承載20 000用戶的PaaS平臺,就要想辦法找到能夠模擬并發20 000用戶流量帶寬的網絡設備,很明顯這樣的設備并不存在,那么必須使用多個設備在同一時段進行并發訪問,對這個并發訪問程序的設計、測試方案的規劃就有很高的技術要求。
第三,云服務的產線問題回放(Production Replay)是極難復現的操作。在一般應用服務中,產線問題復現,可能需要幾個操作就可以了。但是在多用戶及大規模集群環境下,不同的用戶,不同的配置環境、操作系統及中間件等,復現場景對質控團隊來說是個難以完成的任務。
第四,云服務的回歸驗證。和第三點一樣,即便修復了某些問題,想要在產線環境下完成問題的驗證,也充滿著各種不確定性。
當然,上述種種問題在實踐中也都有解決方案,這些解決方案各自有各自的代價。在云服務的質量工程和服務質量管理章節,將對此部分內容作充分的講解。
- SQL Server 2008數據庫應用技術(第二版)
- Modern Programming: Object Oriented Programming and Best Practices
- 揭秘云計算與大數據
- Remote Usability Testing
- Hadoop 3.x大數據開發實戰
- Hands-On Mathematics for Deep Learning
- Power BI商業數據分析完全自學教程
- gnuplot Cookbook
- 企業級容器云架構開發指南
- 區塊鏈技術應用與實踐案例
- MySQL數據庫技術與應用
- Access 2016數據庫應用基礎
- 數據中臺實戰:手把手教你搭建數據中臺
- Oracle 11g數據庫管理與開發基礎教程
- 數據分析方法及應用:基于SPSS和EXCEL環境