- Python數據挖掘:入門、進階與實用案例分析
- 盧滔 張良均等
- 1737字
- 2023-11-13 15:04:51
前言
為什么要寫這本書
大數據競賽是企業和數據人才之間一座新的橋梁,將數據、技術、人才和各領域應用有機融合,進而促進技術創新、人才價值提升、數字經濟與各領域發展。“泰迪杯”數據分析技能賽和“泰迪杯”數據挖掘挑戰賽(統稱“泰迪杯”競賽)面向全國高等院校在校生及相關愛好者,是基于數據挖掘技術解決各行業的實際問題的群眾性科技活動。“泰迪杯”競賽迄今已成功舉辦15屆,累計參賽高校1500余所,累計參賽人數近10萬。舉辦“泰迪杯”競賽的目的在于:以賽促學,提高學生學習數據挖掘的積極性及解決實際相關問題的綜合能力;以賽促教,推動數據挖掘技術在高校的推廣和應用;以賽促研,為高校相關智力資源轉化為推進國家大數據戰略的生產力提供合作平臺。
本書基于“泰迪杯”競賽中的經典賽題,由淺入深地講解數據挖掘方法,帶領讀者了解各個領域的業務知識,進而將數據挖掘、Python語言技術和行業知識三者有機融入,最大化提升讀者對數據挖掘的理解和實踐能力。
本書特色
本書從實踐出發,結合“泰迪杯”競賽官方推出的賽題,按照賽題的難易程度進行排序,由淺入深地介紹數據挖掘技術在商務、教育、交通、傳媒、電力、旅游、制造業等行業的應用。因此,圖書的編排以解決某個應用的挖掘目標為前提,緊密地貼合實際業務場景和需求;每一個實戰案例的講解都是從案例的背景和目標入手,從了解案例需求到一步步拆解任務,最終解決業務問題,讓讀者獲得真實的數據挖掘學習與實踐環境,更快、更好地掌握數據挖掘知識,積累經驗。為方便讀者輕松地獲取一個真實的實驗環境,本書使用大家熟知的Python語言對樣本數據進行處理和挖掘建模。
本書提供配套原始數據文件、Python程序代碼等資源,讀者可以從泰迪云教材網站(https://book.tipdm.org/)免費下載。
本書適用對象
? 對數據分析、數據挖掘、深度學習的實踐及競賽感興趣的人員。
? 開設數據挖掘課程的高校的教師和學生。
? 數據挖掘開發人員。
? 進行數據挖掘應用研究的科研人員。
? 關注高級數據分析的人員。
如何閱讀本書
本書共14章,分五篇:基礎篇、入門篇、進階篇、高階篇和拓展篇。基礎篇介紹了數據挖掘的基本原理,以及使用Python進行數據挖掘所需的編程基礎。入門篇、進階篇、高階篇介紹了幾個真實案例,通過對案例進行深入淺出的剖析,使讀者在不知不覺中獲得數據挖掘項目經驗,同時快速領悟看似難懂的數據挖掘理論。拓展篇介紹了一個開源數據挖掘建模平臺,通過平臺去編程、拖曳式操作,向讀者展示平臺流程化等特點,使讀者加深對數據挖掘流程的理解。
基礎篇(第1、2章):第1章的主要內容是數據挖掘概述,第2章對數據挖掘建模所需的Python語言基礎知識進行了簡明扼要的說明。
入門篇(第3~5章):選取“泰迪杯”數據分析技能賽的3道賽題,運用簡單的數據分析技術剖析數據信息,挖掘業務現象,解決業務問題。
進階篇(第6~9章):選取“泰迪杯”數據挖掘挑戰賽的4道賽題,運用數據挖掘技術構建相關的分析模型,更理性、快捷地進行預測和分析。
高階篇(第10~13章):選取“泰迪杯”數據挖掘挑戰賽的4道賽題,運用深度學習技術訓練網絡和構建模型,實現智能化、自動化的事物識別與檢測。
拓展篇(第14章):重點講解了TipDM大數據挖掘建模平臺的使用方法,先介紹了平臺每個模塊的功能,再以自動售貨機銷售數據分析為例,介紹如何使用平臺快速搭建數據分析與挖掘工程,展示平臺去編程、平臺流程化的特點。
勘誤和支持
我們已經盡最大努力避免在文本和代碼中出現錯誤,但是由于水平有限,編寫時間倉促,書中難免存在一些疏漏和不足的地方。如果你有更多的寶貴意見,歡迎在泰迪學社微信公眾號(TipDataMining)上回復“圖書反饋”進行反饋。本系列圖書的更多信息可以在泰迪云教材網站(https://book.tipdm.org/)上查閱。
致謝
在圖書編寫過程中,我們得到了相關企事業單位多位專家的大力支持!在此謹向天津大學邊馥萍、復旦大學蔡志杰、北京大學鄧明華、中國科學院方海濤、中山大學馮國燦、信息工程大學韓中庚、汕頭大學郝志峰、中山大學任傳賢、佛山科技學院戎海武、中山大學王其如、汕頭大學韋才敏、國防科技大學吳孟達、韓山師范學院肖剛、北京工業大學薛毅、華南師范大學薛云、重慶大學楊虎、華南師范大學楊坦、廣東泰迪智能科技股份有限公司張尚佳、廣州海數華據科技發展有限公司鄭海兵等專家(按專家姓名拼音字母排列)致以深深的謝意。
張良均
2023年3月于廣州