1.4 大數據解決方案
目前很多企業都提供了大數據解決方案,典型有Cloudera、Hortonworks、MapR和FusionInsight等,下面分別介紹。
1.Cloudera
在Hadoop生態系統中,規模最大、知名度最高的是Cloudera,它既是公司的名字,也代表Hadoop的一種解決方案。Cloudera可以為開源Hadoop提供支持,同時將數據處理框架延伸到一個全面的“企業數據中心”范疇,這個數據中心可以作為管理企業所有數據的中心點,它可以作為目標數據倉庫、高效的數據平臺、或現有數據倉庫的ETL來源。
2.Hortonworks
Hortonworks數據管理解決方案使組織可以實施下一代現代化數據架構。Hortonworks是基于Apache Hadoop開發的,可以從云的邊緣以及內部來對數據資產進行管理,無論數據是靜態還是動態的。Hortonworks數據平面服務(DPS)可以輕松地配置和操作分布式數據系統(不管是數據科學、自助服務分析,還是數據倉儲優化)。由于治理功能是內置的,并且基于開放源碼技術(如Apache Atlas),所以Hortonworks DPS用戶可以輕松訪問防火墻、公有云(或兩者的組合)背后的可信數據(無論類型或來源如何),這使得組織能夠從源到目標獲得受信任的沿襲。Hortonworks Data Flow (HDF)能夠收集、組織、整理和傳送來自于全聯網(設備、傳感器、點擊流、日志文件等)的實時數據。Hortonworks Data Platform(HDP)能夠用于創建安全的企業數據池,為企業提供信息分析,實現快速創新和實時深入了解業務動態。
3.MapR
MapR是一個比現有Hadoop分布式文件系統還要快三倍的產品,并且也是開源的。MapR配備了快照,并號稱不會出現單節點故障,且與現有HDFS的API兼容,因此非常容易替換原有的系統。MapR使Hadoop變為一個速度更快、可靠性更高、更易于管理、使用更加方便的分布式計算服務和存儲平臺,并擴大了Hadoop的使用范圍和方式。MapR包含了開源社區的許多流行工具和功能,例如HBase、Hive以及和Apache Hadoop兼容的API。
4.華為FusionInsight
華為FusionInsight大數據平臺,能夠幫助企業快速構建海量數據信息處理系統,通過對企業內部和外部的巨量信息數據實時與非實時的分析挖掘,發現全新價值點和企業商機。FusionInsight是完全開放的大數據平臺,可運行在開放的X86架構服務器上,它以海量數據處理引擎和實時數據處理引擎為核心,并針對金融和運營商等數據密集型行業的運行維護及應用開發等需求,打造了敏捷、智慧、可信的平臺軟件和建模中間件,讓企業可以更快、更準、更穩地從各類繁雜無序的海量數據中發現價值。
基于華為對電信運營商網絡和業務的長期專注和深刻理解,FusionInsight大數據平臺還集成了企業知識引擎和實時決策支持中心等能力。企業級的實時知識引擎是電信運營商大數據解決方案的核心,數據在這里經過分析和挖掘形成真正有價值的知識。實時決策中心是事件適配和策略生成的核心,數據在這里經過適配生成對應的策略,滿足特定場景的決策需求。豐富的知識庫和分析套件工具、全方位企業實時知識引擎和決策中心,能夠幫助運營商在瞬息萬變的數字商業環境中快速決策,實現敏捷的商業成功。開發者可以在華為FusionInsight大數據平臺上,基于大數據的各類商業應用場景,比如增強型BI、客戶智能和數據開放,為金融、運營商等客戶實現數據的價值——效率提升和收入提升。
FusionInsight解決方案由四個子產品FusionInsight HD、FusionInsight MPPDB、FusionInsight Miner、FusionInsight Farmer和一個操作運維系統FusionInsight Manager構成,如圖1.6所示。

圖1.6 FusionInsight的構成
? FusionInsight HD:企業級的大數據處理環境,是一個分布式數據處理系統,對外提供大容量的數據存儲、分析查詢和實時流式數據處理分析能力。
? FusionInsight MPPDB:企業級的大規模并行處理關系型數據庫。FusionInsight MPPDB采用MPP(Massive Parallel Processing)架構,支持行存儲和列存儲,提供PB(Petabyte,250字節)級別數據量的處理能力。
? FusionInsight Miner:企業級的數據分析平臺,基于華為FusionInsight HD的分布式存儲和并行計算技術,提供從海量數據中挖掘出價值信息的能力。
? FusionInsight Farmer:企業級的大數據應用容器,為企業業務提供統一開發、運行和管理的平臺。
? FusionInsight Manager:企業級大數據的操作運維系統,提供高可靠、安全、容錯、易用的集群管理能力,支持大規模集群的安裝部署、監控、告警、用戶管理、權限管理、審計、服務管理、健康檢查、問題定位、升級和補丁等功能。
5.云上大數據解決方案
云上大數據解決方案主要有阿里云與亞馬遜云。
阿里云創立于2009年,是全球領先的云計算及人工智能科技公司,致力于以在線公共服務的方式,提供安全、可靠的計算和數據處理能力,讓計算和人工智能成為普惠科技。
阿里云為制造、金融、政務、交通、醫療、電信、能源等眾多領域的企業提供服務,包括中國聯通、12306、中石化、中石油、飛利浦、華大基因等大型企業客戶,以及微博、知乎、錘子科技等明星互聯網公司。甚至在天貓雙11全球狂歡節、12306春運購票等極富挑戰的應用場景中,阿里云保持著良好的運行紀錄。
亞馬遜云(Amazon Web Services,AWS)是亞馬遜提供的專業云計算服務,于2006年推出,以Web服務的形式向企業提供IT基礎設施服務,通常稱為云計算,其中一個優勢是能夠根據業務發展需要以較低可變成本來替代前期基礎設施的大量投入。
亞馬遜云提供服務包括:亞馬遜彈性計算網云(Amazon EC2)、亞馬遜簡單儲存服務(Amazon S3)、亞馬遜簡單數據庫(Amazon SimpleDB)、亞馬遜簡單隊列服務(Amazon Simple Queue Service)以及Amazon CloudFront等。
- R Machine Learning By Example
- Hands-On Machine Learning with TensorFlow.js
- 80x86/Pentium微型計算機原理及應用
- WordPress Theme Development Beginner's Guide(Third Edition)
- 愛犯錯的智能體
- 工業機器人運動仿真編程實踐:基于Android和OpenGL
- PostgreSQL 10 Administration Cookbook
- 分數階系統分析與控制研究
- 中國戰略性新興產業研究與發展·智能制造裝備
- MATLAB-Simulink系統仿真超級學習手冊
- 簡明學中文版Flash動畫制作
- 電氣控制及Micro800 PLC程序設計
- EJB JPA數據庫持久層開發實踐詳解
- 開放自動化系統應用與實戰:基于標準建模語言IEC 61499
- 工廠電氣控制設備