- Spark大數據分析實戰
- 張偉洋
- 306字
- 2021-03-26 22:18:35
內容簡介
本書基于Spark 2.4.x新版本編寫,從Spark核心編程語言Scala講起,涵蓋當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章講解Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解Spark的主要組件、集群架構原理、集群環境搭建以及Spark應用程序的提交和運行;第3~9章講解離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理,同時包括常用Shell命令、API操作、內核源碼剖析,并通過多個實際案例講解各個框架的具體應用以及與Hadoop生態系統框架Hive、HBase、Kafka的整合操作。
本書內容豐富,以實操案例為主,理論為輔,可作為Spark新手的入門書,也可作為大數據開發人員和從業者的學習用書,還可以作為培訓機構或大中專院校的教學用書。