內容提要
本書系統、全面地介紹了大數據技術的基礎知識,期望讀者通過對本書的學習和實踐了解大數據技術的概貌,掌握Hadoop生態圈大數據技術中最為基礎和關鍵的知識。本書主要內容包括大數據概述、大數據軟件基礎、大數據存儲技術、MapReduce分布式編程、數據采集與預處理、數據倉庫與聯機分析處理、大數據分析與挖掘技術、Spark分布式內存計算框架、數據可視化技術、大數據安全。
本書可作為數據科學與大數據、軟件工程、計算機科學與技術等專業的大數據概論課程的教材,也可供大數據工程技術人員閱讀使用。
本書系統、全面地介紹了大數據技術的基礎知識,期望讀者通過對本書的學習和實踐了解大數據技術的概貌,掌握Hadoop生態圈大數據技術中最為基礎和關鍵的知識。本書主要內容包括大數據概述、大數據軟件基礎、大數據存儲技術、MapReduce分布式編程、數據采集與預處理、數據倉庫與聯機分析處理、大數據分析與挖掘技術、Spark分布式內存計算框架、數據可視化技術、大數據安全。
本書可作為數據科學與大數據、軟件工程、計算機科學與技術等專業的大數據概論課程的教材,也可供大數據工程技術人員閱讀使用。