- 大數據分析處理(慕課版)
- 郭永洪 賀萌主編
- 1207字
- 2024-04-23 17:42:51
前言
FOREWORD
當前,全球已經進入“數字經濟”時代,數據的價值愈發凸顯,大數據作為一個新興的技術產業正逐步融入我國經濟發展的各個領域。近年來,數字化趨勢下的新一代信息技術與實體經濟深度融合,成為推動經濟發展的新引擎,數據成為驅動經濟發展的重要新型生產要素,對整個社會產生顯著、深刻的影響。2020年,《中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見》將數據作為一種新型生產要素,與傳統生產要素并列,明確提出加快培育數據要素市場,主要措施包括推進政府數據開放共享、提升社會數據資源價值、加強數據資源整合和安全保護。近年來,越來越多的行業決策開始從業務驅動向數據驅動轉變,要促進行業的發展需要大量的掌握數據分析處理技術的人員。
為加快推進黨的二十大精神進教材、進課堂、進頭腦,編寫本書時編者將“立德樹人”有機融入其中,豐富本書內容。黨的二十大報告指出:“堅持創新在我國現代化建設全局中的核心地位。”本書是“中國特色高水平高職學校和專業建設計劃”項目中軟件技術(軟件與大數據技術)專業群教材建設成果之一,依托已建成的在線共享課程“大數據分析處理”數字化資源,構建書證融通、立體化新形態教材。編寫本書時根據《數據應用開發與服務(Python)職業技能等級標準》,將大數據分析處理行業的新技術、新規范、新標準融入教材;參考企業對大數據分析處理相關崗位人員的任職要求規劃教材內容。本書采用理論與實踐相結合的方式講解大數據分析處理的基礎知識和實現技術。全書共13個單元,內容包括大數據分析概述、numpy科學計算基礎、pandas統計分析基礎、數據讀取與寫入、數據質量與數據清洗、數據合并與數據轉換、數據分組與數據聚合、scikit-learn機器學習、使用統計圖表展示數據、某地區電力公司用戶付費行為預測、《你好,舊時光》文本挖掘分析、基于大數據可視化的城市通勤特征分析研究、上市公司新聞情感與股票價格的關系。單元1~單元9由學習目標、相關知識、任務實現、素養拓展、單元小結、課后習題組成,單元10~單元13是4個綜合案例,由項目目標、相關背景知識、任務實現、項目總結、項目實踐組成。本書內容有機融入大數據分析處理知識點和技能點,由淺入深、循序漸進,通過課后習題檢測學生所學知識,通過課堂實踐和項目實踐進一步提升學生實踐技能。
本書編寫組成員具有豐富的課程建設經驗和教材編寫經驗。郭永洪和賀萌是本書的主編,負責編寫、統稿、審稿和定稿,賀寧、曹昊、丁慧、許秋熹參與本書編寫。具體編寫分工為:單元1、單元2、單元9、單元10和單元11由賀萌編寫,單元3由賀寧編寫,單元4、單元12和單元13由郭永洪編寫,單元5和單元7由曹昊編寫,單元6由丁慧編寫,單元8由許秋熹編寫。
本書編寫時得到南京青橙科技有限公司的大力支持,高級工程師解冰和張金君對本書中的任務設計及技術實現給予充分的指導,提出許多寶貴意見,在此表示衷心感謝。此外,由于編者水平有限,書中難免有疏漏和不足之處,懇請廣大讀者批評指正。
編者
2023年9月