舉報

會員
Python數據分析入門:從數據獲取到可視化
最新章節:
參考文獻
本書作為數據分析的入門圖書,以Python語言為基礎,介紹了數據分析的整個流程。本書內容涵蓋數據的獲取(即網絡爬蟲程序的設計)、前期數據的清洗和處理、運用機器學習算法進行建模分析,以及使用可視化的方法展示數據及結果。首先,書中不會涉及過于高級的語法,不過還是希望讀者有一定的語法基礎,這樣可以更好地理解本書的內容。其次,本書重點在于應用Python來完成一些數據分析和數據處理的工作,即如何使用Python來完成工作而非專注于Python語言語法等原理的講解。本書的目的是讓初學者不論對數據分析流程本身還是Python語言,都能有一個十分直觀的感受,為以后的深入學習打下基礎。最后,讀者不必須按順序通讀本書,因為各個章節層次比較分明,可以根據興趣或者需要來自行安排。例如第5章介紹了一些實戰的小項目,有趣且難度不大,大家可以在學習前面內容之余來閱讀這部分內容。
目錄(89章)
倒序
- 封面
- 版權信息
- 前言
- 本書的主要內容
- 本書的讀者對象
- 測試環境及代碼
- 聯系作者
- 致謝
- 讀者服務
- 1 準備
- 1.1 開發環境搭建
- 1.1.1 在Ubuntu系統下搭建Python集成開發環境
- 1.1.2 在Windows系統下搭建Python集成開發環境
- 1.1.3 三種安裝第三方庫的方法
- 1.2 Python基礎語法介紹
- 1.2.1 if__name__=='__main__'
- 1.2.2 列表解析式
- 1.2.3 裝飾器
- 1.2.4 遞歸函數
- 1.2.5 面向對象
- 1.3 The Zen of Python
- 參考文獻
- 2 數據的獲取
- 2.1 爬蟲簡介
- 2.2 數據抓取實踐
- 2.2.1 請求網頁數據
- 2.2.2 網頁解析
- 2.2.3 數據的存儲
- 2.3 爬蟲進階
- 2.3.1 異常處理
- 2.3.2 robots.txt
- 2.3.3 動態UA
- 2.3.4 代理IP
- 2.3.5 編碼檢測
- 2.3.6 正則表達式入門
- 2.3.7 模擬登錄
- 2.3.8 驗證碼問題
- 2.3.9 動態加載內容的獲取
- 2.3.10 多線程與多進程
- 2.4 爬蟲總結
- 參考文獻
- 3 數據的存取與清洗
- 3.1 數據存取
- 3.1.1 基本文件操作
- 3.1.2 CSV文件的存取
- 3.1.3 JSON文件的存取
- 3.1.4 XLSX文件的存取
- 3.1.5 MySQL數據庫文件的存取
- 3.2 NumPy
- 3.2.1 NumPy簡介
- 3.2.2 NumPy基本操作
- 3.3 pandas
- 3.3.1 pandas簡介
- 3.3.2 Series與DataFrame的使用
- 3.3.3 布爾值數組與函數應用
- 3.4 數據的清洗
- 3.4.1 編碼問題
- 3.4.2 缺失值的檢測與處理
- 3.4.3 去除異常值
- 3.4.4 去除重復值與冗余信息
- 3.4.5 注意事項
- 參考文獻
- 4 數據的分析及可視化
- 4.1 探索性數據分析
- 4.1.1 基本流程
- 4.1.2 數據降維
- 4.2 機器學習入門
- 4.2.1 機器學習簡介
- 4.2.2 決策樹——機器學習算法的應用
- 4.3 手動實現KNN算法
- 4.3.1 特例——最鄰近分類器
- 4.3.2 KNN算法的完整實現
- 4.4 數據可視化
- 4.4.1 高質量作圖工具——matplotlib
- 4.4.2 快速作圖工具——pandas與matplotlib
- 4.4.3 簡捷作圖工具——seaborn與matplotlib
- 4.4.4 詞云圖
- 參考文獻
- 5 Python與生活
- 5.1 定制一個新聞提醒服務
- 5.1.1 新聞數據的抓取
- 5.1.2 實現郵件發送功能
- 5.1.3 定時執行及本地日志記錄
- 5.2 Python與數學
- 5.2.1 估計π值
- 5.2.2 三門問題
- 5.2.3 解決LP與QP問題(選讀)
- 5.3 QQ群聊天記錄數據分析
- 參考文獻 更新時間:2019-10-21 12:09:36
推薦閱讀
- 數據庫基礎教程(SQL Server平臺)
- 大數據技術基礎
- 從零開始學Hadoop大數據分析(視頻教學版)
- Mastering Ninject for Dependency Injection
- 分布式數據庫系統:大數據時代新型數據庫技術(第3版)
- 數據驅動:從方法到實踐
- 城市計算
- gnuplot Cookbook
- 智慧的云計算
- 新手學會計(2013-2014實戰升級版)
- 大數據數學基礎(R語言描述)
- Access數據庫開發從入門到精通
- R Machine Learning Essentials
- 數據指標體系:構建方法與應用實踐
- 算法設計與分析
- 云工作時代:科技進化必將帶來的新工作方式
- 數據挖掘與機器學習-WEKA應用技術與實踐(第二版)
- 大數據隱私保護技術與治理機制研究
- 數據庫基礎與應用
- 一本書讀懂區塊鏈(第2版)
- 大數據網絡傳播模型和算法
- 全球智庫評價報告(2015)
- 元宇宙基石:Web3.0與分布式存儲
- 大數據SQL優化:原理與實踐
- 數據要素化時代的數據治理
- 零基礎輕松學MySQL 5.7
- 企業級大數據平臺構建:架構與實現
- 國產高分衛星遙感數據在自然資源調查中的應用實踐:以甘肅、寧夏為例
- 信息檢索導論
- SQL語言與關系數據庫