- PySpark大數據分析與應用
- 戴剛 張良均主編
- 315字
- 2025-01-07 16:58:53
內容提要
本書以Python作為開發語言,系統介紹PySpark開發環境搭建流程及基于PySpark進行大數據分析的相關知識。本書條理清晰、重點突出,理論敘述循序漸進、由淺入深。本書共7章,第1~5章包括PySpark大數據分析概述、PySpark安裝配置、基于PySpark的DataFrame操作、基于PySpark的流式數據處理、基于PySpark的機器學習庫,內容介紹注重理論與實踐相結合,通過典型示例強化PySpark在大數據分析中的實際應用;第6、7章通過基于PySpark的網絡招聘信息的職業類型劃分和基于PySpark 的信用貸款風險分析兩個完整的案例實戰,結合前5章的PySpark編程知識,實現完整的大數據分析過程。本書大部分章包含實訓和課后習題,讀者通過練習和操作實踐,能夠鞏固所學的內容。
本書可作為高校數據科學或大數據相關專業的教材,也可作為機器學習愛好者的自學用書。
推薦閱讀
- Word 2010中文版完全自學手冊
- Unity 5.x Game AI Programming Cookbook
- SQL Server 2012數據庫技術與應用(微課版)
- R數據科學實戰:工具詳解與案例分析(鮮讀版)
- 商業分析思維與實踐:用數據分析解決商業問題
- 大數據:規劃、實施、運維
- 深入淺出MySQL:數據庫開發、優化與管理維護(第2版)
- 3D計算機視覺:原理、算法及應用
- Creating Dynamic UIs with Android Fragments(Second Edition)
- Starling Game Development Essentials
- 智能數據時代:企業大數據戰略與實戰
- Oracle數據庫管理、開發與實踐
- SQL Server 2008寶典(第2版)
- 云工作時代:科技進化必將帶來的新工作方式
- 數據挖掘算法實踐與案例詳解