官术网_书友最值得收藏!

內容提要

本書以Python作為開發語言,系統介紹PySpark開發環境搭建流程及基于PySpark進行大數據分析的相關知識。本書條理清晰、重點突出,理論敘述循序漸進、由淺入深。本書共7章,第1~5章包括PySpark大數據分析概述、PySpark安裝配置、基于PySpark的DataFrame操作、基于PySpark的流式數據處理、基于PySpark的機器學習庫,內容介紹注重理論與實踐相結合,通過典型示例強化PySpark在大數據分析中的實際應用;第6、7章通過基于PySpark的網絡招聘信息的職業類型劃分和基于PySpark 的信用貸款風險分析兩個完整的案例實戰,結合前5章的PySpark編程知識,實現完整的大數據分析過程。本書大部分章包含實訓和課后習題,讀者通過練習和操作實踐,能夠鞏固所學的內容。

本書可作為高校數據科學或大數據相關專業的教材,也可作為機器學習愛好者的自學用書。

主站蜘蛛池模板: 安化县| 张家川| 乌兰浩特市| 凌海市| 太原市| 略阳县| 德庆县| 格尔木市| 闸北区| 调兵山市| 镇远县| 霍城县| 宣化县| 乌拉特中旗| 织金县| 丁青县| 光山县| 兴安县| 渭源县| 淮滨县| 扎鲁特旗| 富源县| 南开区| 白河县| 建瓯市| 区。| 西乌珠穆沁旗| 郓城县| 全椒县| 和龙市| 水富县| 策勒县| 辉县市| 上蔡县| 绵阳市| 元氏县| 辽阳市| 柞水县| 阿巴嘎旗| 通海县| 柳林县|