官术网_书友最值得收藏!

內容簡介

本書基于Spark 2.4.x新版本編寫,從Spark核心編程語言Scala講起,涵蓋當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章講解Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解Spark的主要組件、集群架構原理、集群環境搭建以及Spark應用程序的提交和運行;第3~9章講解離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理,同時包括常用Shell命令、API操作、內核源碼剖析,并通過多個實際案例講解各個框架的具體應用以及與Hadoop生態系統框架Hive、HBase、Kafka的整合操作。

本書內容豐富,以實操案例為主,理論為輔,可作為Spark新手的入門書,也可作為大數據開發人員和從業者的學習用書,還可以作為培訓機構或大中專院校的教學用書。

主站蜘蛛池模板: 绍兴市| 师宗县| 惠安县| 尼勒克县| 蒙山县| 荃湾区| 焦作市| 清水县| 张家川| 资兴市| 泾川县| 漳州市| 宜城市| 古浪县| 博客| 赣榆县| 宜章县| 淮阳县| 建阳市| 建湖县| 甘南县| 诸城市| 云龙县| 吴旗县| 榆中县| 岑溪市| 宁德市| 通辽市| 梨树县| 项城市| 深泽县| 区。| 天全县| 无极县| 德庆县| 灌云县| 淮阳县| 拉孜县| 桃源县| 商都县| 南川市|