官术网_书友最值得收藏!

前言

FOREWORD

著大數據時代的到來,數據已成為重要的生產要素,滲透到各行各業,也逐漸成了企業核心競爭力的一部分。因此,對企業而言,不僅需要知道如何管理數據,更需要知道如何構建分析系統,挖掘數據規律,解讀數據價值。企業如果要通過對數據的有效管控和分析,做出科學、合理的決策,就需要大量的大數據分析人員發現企業所需的數據與信息,運用數據分析方法的思想,科學地建立數據挖掘模型,挖掘其規律和價值,為企業的戰略決策和運營管理提供強有力的支撐。此外,隨著大數據與人工智能已上升為國家戰略,國內諸多高校都開設了大數據相關專業,大數據應用型人才的培養迫在眉睫。大數據應用型人才不僅需要掌握理論知識,還需要具備理論聯系實際的分析與決策能力,才能滿足企業對數據分析人才的需求。

PySpark作為Spark的Python編程接口,繼承了Python語言表達力強、開發效率高的特點,成為越來越多的數據分析團隊、數據分析師進行數據分析時選擇的工具。目前市面上關于 PySpark 在大數據應用方面的圖書不多,同時能夠結合實際案例,從提出問題到需求分析,再到設計分析和編程實踐,完整展示 PySpark 大數據分析的相關圖書更少。本書全面貫徹黨的二十大精神,以社會主義核心價值觀為引領,傳承中華優秀傳統文化,將團結就是力量、去偽存真的科學探索精神、實事求是的科學態度融到PySpark大數據分析技術的學習中,并通過理論結合實踐,運用該技術解決實際場景中的大數據分析問題,培養學生大數據思維,為加快發展新質生產力,建設網絡強國、數字中國而服務。

本書特色

1.理論敘述由淺入深、循序漸進,表達通俗易懂。本書從基本概念入手,介紹相關的基礎理論,再通過應用示例介紹如何運用具體方法解決實際問題。

2.強化基礎,突出知識的應用性。結合高校教學特點和學生的情況,突出PySpark大數據分析的重點內容,強調 PySpark 在實際問題中的應用性,充分體現理論知識與應用的緊密結合。

3.從實踐出發,重點突出可操作性。本書從構建 PySpark 的開發環境入手,詳細介紹單機模式的PySpark開發環境搭建(基于Windows系統搭建,搭建過程簡單、易于操作)和分布式模式的PySpark開發環境搭建(基于Linux系統搭建,貼近實際應用場景,處理高效),幫助學生構建可操作的實踐環境,實踐本書的內容。本書大部分章附有實訓和課后習題,便于學生進行上機實驗,鞏固所學知識,真正理解并應用所學知識。

4.通過典型案例完整展示PySpark大數據分析的過程,強化知識的實際應用。本書最后兩章介紹兩個案例,以應用為導向,從需求分析入手,再設計解決方案,最終幫助學生運用所學知識實現PySpark大數據分析過程。

5.體現思想育人。本書不僅注重培養學生分析和處理數據的能力,以及運用數據分析理論與方法解決實際問題的實踐能力;同時注重課程內容與思想教育的有機融合,在潛移默化中引領學生樹立正確的三觀和踐行社會主義核心價值觀,成為堅持正確政治方向的“四有青年”。

本書適用對象

● 開設大數據分析課程的高校師生。

● 大數據開發技術人員。

● 學習PySpark大數據分析的愛好者。

代碼下載及問題反饋

為了幫助讀者更好地使用本書,本書提供配套的原始數據文件、程序代碼,以及PPT 課件、教學大綱、教學進度表和教案等教學資源,讀者可以從泰迪云教材網站上免費下載,也可登錄人郵教育社區(www.ryjiaoyu.com)下載。同時歡迎讀者加入“人郵大數據教師服務群”(QQ群:669819871)進行交流探討。

由于編者水平有限,書中難免出現一些疏漏和不足之處。如果讀者有更多的寶貴意見和建議,歡迎在“泰迪學社”微信公眾號(TipDataMining)回復“圖書反饋”進行反饋。更多本系列教材的信息可以在泰迪云教材網站上查閱。

編者

2023年11月

泰迪云教材

主站蜘蛛池模板: 虹口区| 长宁县| 闸北区| 夏河县| 拜泉县| 郴州市| 乌苏市| 乐昌市| 屯门区| 集贤县| 南开区| 太仆寺旗| 中江县| 平安县| 措美县| 芒康县| 临沧市| 唐河县| 英山县| 田阳县| 彭山县| 怀集县| 石家庄市| 临西县| 湾仔区| 遂溪县| 汾阳市| 乃东县| 三穗县| 常宁市| 手游| 大理市| 鄱阳县| 哈巴河县| 宁陵县| 榆林市| 泰和县| 双柏县| 如皋市| 蒙山县| 鄂伦春自治旗|