- Spark大數(shù)據(jù)分析實戰(zhàn)
- 張偉洋
- 289字
- 2021-03-26 22:18:36
本書內(nèi)容特色
本書基于Spark 2.4.x新版本編寫,作為Spark的入門書,知識面比較廣,涵蓋當前整個Spark生態(tài)系統(tǒng)主流的大數(shù)據(jù)開發(fā)技術。本書內(nèi)容豐富,以實操案例為主,理論為輔,一步一步手把手對常用的Spark離線計算以及實時計算等系統(tǒng)進行講解。
全書共9章,第1章講解Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解Spark的主要組件、集群架構原理、集群環(huán)境搭建以及Spark應用程序的提交和運行;第3~9章講解離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理,同時包括常用的Shell命令、API操作、內(nèi)核源碼剖析,并通過多個實際案例講解各個框架的具體應用以及與Hadoop生態(tài)系統(tǒng)框架Hive、HBase、Kafka的整合操作。
推薦閱讀
- Java Data Science Cookbook
- Game Development with Swift
- 文本挖掘:基于R語言的整潔工具
- MySQL從入門到精通(第3版)
- 數(shù)據(jù)結構與算法(C語言版)
- UDK iOS Game Development Beginner's Guide
- SQL優(yōu)化最佳實踐:構建高效率Oracle數(shù)據(jù)庫的方法與技巧
- SQL應用及誤區(qū)分析
- Google Cloud Platform for Developers
- Expert Python Programming(Third Edition)
- 改進的群智能算法及其應用
- 云工作時代:科技進化必將帶來的新工作方式
- 成功之路:ORACLE 11g學習筆記
- 數(shù)據(jù)挖掘與數(shù)據(jù)化運營實戰(zhàn):思路、方法、技巧與應用
- 21天學通SQL Server