官术网_书友最值得收藏!

本書內(nèi)容特色

本書基于Spark 2.4.x新版本編寫,作為Spark的入門書,知識面比較廣,涵蓋當前整個Spark生態(tài)系統(tǒng)主流的大數(shù)據(jù)開發(fā)技術。本書內(nèi)容豐富,以實操案例為主,理論為輔,一步一步手把手對常用的Spark離線計算以及實時計算等系統(tǒng)進行講解。

全書共9章,第1章講解Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解Spark的主要組件、集群架構原理、集群環(huán)境搭建以及Spark應用程序的提交和運行;第3~9章講解離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理,同時包括常用的Shell命令、API操作、內(nèi)核源碼剖析,并通過多個實際案例講解各個框架的具體應用以及與Hadoop生態(tài)系統(tǒng)框架Hive、HBase、Kafka的整合操作。

主站蜘蛛池模板: 湖口县| 庆城县| 达尔| 钦州市| 衡水市| 兴仁县| 花莲市| 包头市| 新巴尔虎右旗| 广安市| 大洼县| 乐陵市| 河东区| 梁山县| 城步| 始兴县| 固镇县| 柳江县| 铜鼓县| 西吉县| 洱源县| 晋州市| 岚皋县| 凤冈县| 乌鲁木齐县| 紫云| 林州市| 上林县| 本溪市| 大渡口区| 基隆市| 长子县| 孝昌县| 博罗县| 驻马店市| 曲靖市| 明光市| 巴彦淖尔市| 苍梧县| 峡江县| 汤原县|