- Greenplum:從大數據戰略到實現
- 馮雷
- 855字
- 2019-10-10 18:57:07
本書內容組織方式
Greenplum經過15年的精心打磨,成為出色的開源MPP數據庫和數據處理基礎平臺,已應用于銀行、保險、證券、電信、物流、安保、零售、能源和廣告等行業。我們希望本書能給已經建立或者準備建立大數據平臺的企業決策者、架構師、開發人員、數據工程師、數據科學家和數據庫管理員帶來幫助,也希望從事大數據科研工作的教育工作者和學生能從中受益。
本書分為四個部分。
● 第一部分介紹大數據戰略。其中,第1章將分享作者對于ABC(人工智能、大數據和云計算)之間關系的理解以及對人和人工智能的思考。第2章將介紹進取型企業為什么需要大數據戰略以及如何建立大數據戰略。
● 第二部分介紹大數據平臺。其中,第3章將以數據平臺演進歷史和未來趨勢為主題,描述三次整合的背景及影響,介紹選擇大數據平臺需要考慮的因素,以及為什么Greenplum是理想的大數據平臺。第4章為Greenplum數據庫快速入門指南。第5章將介紹Greenplum架構的主要特點和核心引擎。第6章將介紹數據加載、數據聯邦和數據虛擬化。第7章將介紹Greenplum的資源管理以及對混合負載的支持。
● 第三部分介紹機器學習與數據分析。其中,第8章介紹Greenplum的各種過程化編程語言(用戶自定義函數),用戶可以使用Python、R、Java等語言實現用戶自定義函數,還可以通過容器化技術實現自定義函數的安全性和隔離性。第9章將介紹Greenplum內建的機器學習庫MADlib,數據科學家可以使用內建的50多種機器學習算法基于SQL對數據進行高級分析,并介紹如何擴展MADlib以實現新算法。第10章和第11章將分別介紹Greenplum如何對文本數據和時空數據(GIS)進行存儲、計算和分析。
第12章將介紹Greenplum豐富的圖計算能力。
● 第四部分介紹運維管理和數據遷移。其中,第13章將介紹各種監控和管理工具及相關企業級產品。第14章介紹數據庫備份、恢復和遷移。第15章和第16章將分別介紹如何從Oracle和Teradata遷移到Greenplum。
限于作者學識,本書難免有疏漏之處,懇請同行和各位讀者批判指正,我們將不勝感激。您可以通過數字化三部曲的官網(DigitX.cn)或Greenplum中文官方社區(greenplum.cn)給我們留言并了解Greenplum的技術信息、獲得著作的相關學習資源。
馮雷
Pivotal中國常務董事兼研發中心總經理
姚延棟
Pivotal中國研發中心副總裁
- PyTorch深度學習實戰:從新手小白到數據科學家
- 大規模數據分析和建模:基于Spark與R
- Python數據分析入門:從數據獲取到可視化
- 企業大數據系統構建實戰:技術、架構、實施與應用
- 文本挖掘:基于R語言的整潔工具
- INSTANT Cytoscape Complex Network Analysis How-to
- 企業級數據與AI項目成功之道
- 高維數據分析預處理技術
- Oracle RAC日記
- Augmented Reality using Appcelerator Titanium Starter
- Oracle 11g+ASP.NET數據庫系統開發案例教程
- 數據庫應用系統技術
- MySQL技術內幕:InnoDB存儲引擎
- 大數據時代系列(套裝9冊)
- 數據中臺實戰:手把手教你搭建數據中臺