官术网_书友最值得收藏!

內容簡介

Spark SQL是Spark大數據框架的一部分,支持使用標準SQL查詢和HiveQL來讀寫數據,可用于結構化數據處理,并可以執行類似SQL的Spark數據查詢,有助于開發人員更快地創建和運行Spark程序。

全書分為4篇,共9章,第一篇講解了Spark SQL發展歷史和開發環境搭建。第二篇講解了Spark SQL實例,使得讀者掌握Spark SQL的入門操作,了解Spark RDD、DataFrame和DataSet,并熟悉DataFrame各種操作。第三篇講解了基于WiFi探針的商業大數據分析項目,實例中包含數據采集、預處理、存儲、利用Spark SQL挖掘數據,一步一步帶領讀者學習Spark SQL強大的數據挖掘功能。第四篇講解了Spark SQL優化的知識。

本書適合Spark初學者、Spark數據分析人員以及Spark程序開發人員,也適合高校和培訓學校相關專業的師生教學參考。

主站蜘蛛池模板: 本溪市| 永善县| 华容县| 金寨县| 通州区| 封丘县| 兴宁市| 贞丰县| 湟中县| 二连浩特市| 崇信县| 安乡县| 永定县| 金山区| 陈巴尔虎旗| 二连浩特市| 斗六市| 定边县| 五河县| 南雄市| 上栗县| 梁平县| 秦安县| 阿拉善左旗| 延津县| 乐清市| 乐都县| 廉江市| 罗定市| 凤庆县| 南木林县| 洛浦县| 襄城县| 大石桥市| 淳安县| 客服| 措勤县| 通山县| 通州区| 宁津县| 吴川市|