舉報

會員
Python數據分析入門與實戰
最新章節:
13.4.3 高斯混合模型
本書從數據分析的基本概念和Python的基礎語法講起,然后逐步深入到Python數據分析的編程技術方面,并結合實戰重點講解了如何使用主流Python數據分析庫進行數據分析,讓讀者快速掌握Python的編程基礎知識,并對Python數據分析有更加深入的理解。本書分為13章,涵蓋的主要內容有數據分析概述、Python的特點和編程基礎、NumPy數組的基礎和進階用法、Pandas數據處理和數據分析、數據的導入導出、數據可視化,以及Python網絡爬蟲和Scikit-learn機器學習的入門知識。本書內容豐富,語言簡潔、通俗易懂,實用性強,還包含實戰案例,特別適合Python的初學者和自學者,以及缺乏編程經驗的數據分析從業人員閱讀,也適合對數據分析編程感興趣的愛好者閱讀。
- 13.4.3 高斯混合模型 更新時間:2023-06-21 18:29:28
- 13.4.2 主成分分析(PCA)
- 13.4.1 K-means聚類算法
- 13.4 無監督學習
- 13.3.4 隨機森林
- 13.3.3 支持向量機
- 13.3.2 最近鄰算法
- 13.3.1 線性模型
- 13.3 監督學習
- 13.2.3 正態化
- 13.2.2 歸一化
- 13.2.1 標準化
- 13.2 數據預處理
- 13.1 選擇合適的機器學習模型
- 第13章 Scikit-learn機器學習
- 12.3.5 數據管道
- 12.3.4 定義數據對象
- 12.3.3 數據選擇器
- 12.3.2 編寫爬蟲
- 12.3.1 搭建工程項目
- 12.3 Scrapy庫
- 12.2.3 連接超時
- 12.2.2 處理登錄請求
- 12.2.1 最基本的數據抓取
- 12.2 數據抓取
- 12.1 Robots協議
- 第12章 Python網絡爬蟲
- 11.4.2 分層透視表
- 11.4.1 數據集整合
- 11.4 透視表分析
- 11.3.2 協方差和相關系數
- 11.3.1 數據聯合
- 11.3 關聯分析
- 11.2.3 分組統計
- 11.2.2 聚合統計
- 11.2.1 描述性統計
- 11.2 統計分析
- 11.1.3 時間窗函數
- 11.1.2 生成時間區間數據
- 11.1.1 導入時間序列
- 11.1 時間序列分析
- 第11章 實戰:數據分析
- 10.5 數據導出
- 10.4 數據過濾
- 10.3.3 生成時間序列
- 10.3.2 分層索引
- 10.3.1 數據類型轉換
- 10.3 數據轉換
- 10.2.3 無效數據
- 10.2.2 缺失數據
- 10.2.1 冗余數據
- 10.2 數據清洗
- 10.1.3 數據合并
- 10.1.2 數據讀取
- 10.1.1 數據描述
- 10.1 數據導入
- 第10章 實戰:數據預處理
- 9.2.4 散點圖
- 9.2.3 直方圖和密度圖
- 9.2.2 柱狀圖
- 9.2.1 折線圖
- 9.2 Pandas繪圖接口
- 9.1.4 圖例
- 9.1.3 坐標軸
- 9.1.2 圖形樣式
- 9.1.1 繪圖面板
- 9.1 Matplotlib繪圖的基礎設置
- 第9章 數據可視化
- 8.5.4 讀取數據庫
- 8.5.3 JSON數據格式
- 8.5.2 Excel數據格式
- 8.5.1 分隔文本格式
- 8.5 Pandas數據對象的導入導出
- 8.4.2 數據庫API
- 8.4.1 關系數據庫
- 8.4 數據庫
- 8.3.2 XML和HTML格式
- 8.3.1 JSON格式
- 8.3 網絡數據
- 8.2.2 導出數據到電子表格
- 8.2.1 從電子表格導入數據
- 8.2 Excel數據
- 8.1.2 導出數據到文本
- 8.1.1 從文本導入數據
- 8.1 文本數據
- 第8章 數據的導入導出
- 7.5.3 時間序列的數據訪問
- 7.5.2 時間序列的索引
- 7.5.1 時間數據的類型
- 7.5 時間序列
- 7.4.3 透視表的進階用法
- 7.4.2 定制透視表
- 7.4.1 透視表和分組對象
- 7.4 數據透視表
- 7.3.5 基于分組的數據轉換
- 7.3.4 過濾分組數據
- 7.3.3 分組聚合
- 7.3.2 分組鍵
- 7.3.1 分組對象
- 7.3 數據分組
- 7.2.3 基于行索引的分組聚合
- 7.2.2 靈活的聚合函數
- 7.2.1 基礎的聚合操作
- 7.2 數據聚合
- 7.1.4 Series和DataFrame之間的運算
- 7.1.3 索引對齊
- 7.1.2 索引保留
- 7.1.1 Pandas中的通用函數
- 7.1 Pandas中的數組運算
- 第7章 Pandas:數據分析
- 6.5.4 重新排列分層索引
- 6.5.3 多層級切片
- 6.5.2 分層索引的構建方法
- 6.5.1 分層索引:從一維到多維
- 6.5 分層索引
- 6.4.4 merge函數
- 6.4.3 join函數
- 6.4.2 concat函數
- 6.4.1 append函數
- 6.4 數據集合并
- 6.3.3 對缺失值的操作
- 6.3.2 Pandas中的缺失數據
- 6.3.1 表示缺失數據的策略
- 6.3 處理缺失數bb據
- 6.2.2 DataFrame中的數據選取
- 6.2.1 Series中的數據選取
- 6.2 數據索引和選取
- 6.1.3 索引對象
- 6.1.2 DataFrame對象
- 6.1.1 Series對象
- 6.1 Pandas數據結構
- 第6章 Pandas:數據處理
- 5.6.3 記錄數組
- 5.6.2 結構化數組的索引訪問
- 5.6.1 結構化數組的創建
- 5.6 結構化數組
- 5.5.3 分區排序
- 5.5.2 間接排序
- 5.5.1 直接排序
- 5.5 數組排序
- 5.4.3 索引組合
- 5.4.2 Fancy索引
- 5.4.1 布爾索引
- 5.4 數組的高級索引
- 5.3.3 where參數
- 5.3.2 where函數
- 5.3.1 布爾表達式
- 5.3 數組形式的條件判斷
- 5.2.3 定義新的通用函數
- 5.2.2 通用函數的實例方法
- 5.2.1 初識通用函數
- 5.2 通用函數
- 5.1.3 廣播的規則
- 5.1.2 靈活的廣播機制
- 5.1.1 快速的矢量化計算
- 5.1 NumPy的高效運算
- 第5章 NumPy數組:進階篇
- 4.8.6 多維數組的聚合
- 4.8.5 邏輯統計函數
- 4.8.4 中位數和百分位數
- 4.8.3 最大值和最小值
- 4.8.2 均值和標準差
- 4.8.1 求和與乘積
- 4.8 聚合統計
- 4.7.4 三角和反三角函數
- 4.7.3 指數和對數
- 4.7.2 絕對值
- 4.7.1 算術運算
- 4.7 數組運算
- 4.6.5 矩陣分解
- 4.6.4 數值特征和特征值
- 4.6.3 逆矩陣和共軛矩陣
- 4.6.2 矩陣乘法
- 4.6.1 矩陣對象
- 4.6 矩陣運算
- 4.5.5 數組拆分
- 4.5.4 數組合并:堆疊
- 4.5.3 數組合并:拼接
- 4.5.2 軸變換
- 4.5.1 數組重塑
- 4.5 數組變換
- 4.4.4 復制數組
- 4.4.3 刪除數組元素
- 4.4.2 插入數組元素
- 4.4.1 更新數組元素
- 4.4 數組更新
- 4.3.3 索引切片
- 4.3.2 數組切片
- 4.3.1 基礎索引
- 4.3 數組訪問
- 4.2.6 隨機數組
- 4.2.5 等差數組
- 4.2.4 空數組
- 4.2.3 對角矩陣
- 4.2.2 填充數組
- 4.2.1 通用的創建方式
- 4.2 創建數組
- 4.1.2 數據類型
- 4.1.1 對象屬性
- 4.1 數組對象
- 第4章 NumPy數組:基礎篇
- 3.9.2 讀寫文件
- 3.9.1 打開和關閉文件
- 3.9 文件操作
- 3.8.4 類的方法調用
- 3.8.3 類的屬性訪問
- 3.8.2 類的實例化
- 3.8.1 類定義
- 3.8 類
- 3.7.3 lambda函數
- 3.7.2 函數調用
- 3.7.1 函數定義
- 3.7 函數
- 3.6.3 break和continue關鍵字
- 3.6.2 循環語句
- 3.6.1 條件語句
- 3.6 控制流
- 3.5.4 字典
- 3.5.3 列表
- 3.5.2 元組
- 3.5.1 集合
- 3.5 內置的數據結構
- 3.4.4 字符串
- 3.4.3 數值類型
- 3.4.2 布爾型
- 3.4.1 變量賦值
- 3.4 變量和數據類型
- 3.3.4 關鍵字
- 3.3.3 標識符
- 3.3.2 注釋
- 3.3.1 縮進
- 3.3 基礎語法
- 3.2.2 運行IPython
- 3.2.1 Python解釋器
- 3.2 Hello World!
- 3.1.5 集成開發環境
- 3.1.4 安裝及更新Python庫
- 3.1.3 在GNU/Linux操作系統下安裝Python
- 3.1.2 在macOS下安裝Python
- 3.1.1 在Windows操作系統下安裝Python
- 3.1 安裝與配置
- 第3章 Python編程基礎
- 2.5.5 Scrapy
- 2.5.4 BeautifulSoup
- 2.5.3 html5lib
- 2.5.2 lxml
- 2.5.1 Request
- 2.5 網絡爬蟲的第三方庫
- 2.4.5 Scikit-learn
- 2.4.4 SciPy
- 2.4.3 Matplotlib
- 2.4.2 Pandas
- 2.4.1 NumPy
- 2.4 數據分析的第三方庫
- 2.3.3 豐富的第三方庫
- 2.3.2 黏合劑Python
- 2.3.1 自由的數據結構
- 2.3 Python在數據分析上的優勢
- 2.2.4 封裝與擴展性
- 2.2.3 解釋型語言
- 2.2.2 自由開放
- 2.2.1 簡單易學
- 2.2 了解Python的特點
- 2.1.2 Python 2和Python 3
- 2.1.1 Python的起源
- 2.1 關于Python
- 第2章 為什么選擇Python
- 1.7.3 Python
- 1.7.2 R語言
- 1.7.1 Microsoft Excel
- 1.7 數據分析工具
- 1.6 數據挖掘的標準流程(CRISP-DM模型)
- 1.5.5 象限分析法
- 1.5.4 漏斗分析法
- 1.5.3 預測分析法
- 1.5.2 對比分析法
- 1.5.1 公式拆解法
- 1.5 數據分析方法
- 1.4.3 探索性統計分析
- 1.4.2 推斷性統計分析
- 1.4.1 描述性統計分析
- 1.4 統計分析策略
- 1.3.2 線上收集
- 1.3.1 線下收集
- 1.3 數據收集
- 1.2 數據分析的基礎流程
- 1.1 數據分析的含義
- 第1章 數據分析概述
- 前言
- 內容提要
- 版權
- 版權信息
- 封面
- 封面
- 版權信息
- 版權
- 內容提要
- 前言
- 第1章 數據分析概述
- 1.1 數據分析的含義
- 1.2 數據分析的基礎流程
- 1.3 數據收集
- 1.3.1 線下收集
- 1.3.2 線上收集
- 1.4 統計分析策略
- 1.4.1 描述性統計分析
- 1.4.2 推斷性統計分析
- 1.4.3 探索性統計分析
- 1.5 數據分析方法
- 1.5.1 公式拆解法
- 1.5.2 對比分析法
- 1.5.3 預測分析法
- 1.5.4 漏斗分析法
- 1.5.5 象限分析法
- 1.6 數據挖掘的標準流程(CRISP-DM模型)
- 1.7 數據分析工具
- 1.7.1 Microsoft Excel
- 1.7.2 R語言
- 1.7.3 Python
- 第2章 為什么選擇Python
- 2.1 關于Python
- 2.1.1 Python的起源
- 2.1.2 Python 2和Python 3
- 2.2 了解Python的特點
- 2.2.1 簡單易學
- 2.2.2 自由開放
- 2.2.3 解釋型語言
- 2.2.4 封裝與擴展性
- 2.3 Python在數據分析上的優勢
- 2.3.1 自由的數據結構
- 2.3.2 黏合劑Python
- 2.3.3 豐富的第三方庫
- 2.4 數據分析的第三方庫
- 2.4.1 NumPy
- 2.4.2 Pandas
- 2.4.3 Matplotlib
- 2.4.4 SciPy
- 2.4.5 Scikit-learn
- 2.5 網絡爬蟲的第三方庫
- 2.5.1 Request
- 2.5.2 lxml
- 2.5.3 html5lib
- 2.5.4 BeautifulSoup
- 2.5.5 Scrapy
- 第3章 Python編程基礎
- 3.1 安裝與配置
- 3.1.1 在Windows操作系統下安裝Python
- 3.1.2 在macOS下安裝Python
- 3.1.3 在GNU/Linux操作系統下安裝Python
- 3.1.4 安裝及更新Python庫
- 3.1.5 集成開發環境
- 3.2 Hello World!
- 3.2.1 Python解釋器
- 3.2.2 運行IPython
- 3.3 基礎語法
- 3.3.1 縮進
- 3.3.2 注釋
- 3.3.3 標識符
- 3.3.4 關鍵字
- 3.4 變量和數據類型
- 3.4.1 變量賦值
- 3.4.2 布爾型
- 3.4.3 數值類型
- 3.4.4 字符串
- 3.5 內置的數據結構
- 3.5.1 集合
- 3.5.2 元組
- 3.5.3 列表
- 3.5.4 字典
- 3.6 控制流
- 3.6.1 條件語句
- 3.6.2 循環語句
- 3.6.3 break和continue關鍵字
- 3.7 函數
- 3.7.1 函數定義
- 3.7.2 函數調用
- 3.7.3 lambda函數
- 3.8 類
- 3.8.1 類定義
- 3.8.2 類的實例化
- 3.8.3 類的屬性訪問
- 3.8.4 類的方法調用
- 3.9 文件操作
- 3.9.1 打開和關閉文件
- 3.9.2 讀寫文件
- 第4章 NumPy數組:基礎篇
- 4.1 數組對象
- 4.1.1 對象屬性
- 4.1.2 數據類型
- 4.2 創建數組
- 4.2.1 通用的創建方式
- 4.2.2 填充數組
- 4.2.3 對角矩陣
- 4.2.4 空數組
- 4.2.5 等差數組
- 4.2.6 隨機數組
- 4.3 數組訪問
- 4.3.1 基礎索引
- 4.3.2 數組切片
- 4.3.3 索引切片
- 4.4 數組更新
- 4.4.1 更新數組元素
- 4.4.2 插入數組元素
- 4.4.3 刪除數組元素
- 4.4.4 復制數組
- 4.5 數組變換
- 4.5.1 數組重塑
- 4.5.2 軸變換
- 4.5.3 數組合并:拼接
- 4.5.4 數組合并:堆疊
- 4.5.5 數組拆分
- 4.6 矩陣運算
- 4.6.1 矩陣對象
- 4.6.2 矩陣乘法
- 4.6.3 逆矩陣和共軛矩陣
- 4.6.4 數值特征和特征值
- 4.6.5 矩陣分解
- 4.7 數組運算
- 4.7.1 算術運算
- 4.7.2 絕對值
- 4.7.3 指數和對數
- 4.7.4 三角和反三角函數
- 4.8 聚合統計
- 4.8.1 求和與乘積
- 4.8.2 均值和標準差
- 4.8.3 最大值和最小值
- 4.8.4 中位數和百分位數
- 4.8.5 邏輯統計函數
- 4.8.6 多維數組的聚合
- 第5章 NumPy數組:進階篇
- 5.1 NumPy的高效運算
- 5.1.1 快速的矢量化計算
- 5.1.2 靈活的廣播機制
- 5.1.3 廣播的規則
- 5.2 通用函數
- 5.2.1 初識通用函數
- 5.2.2 通用函數的實例方法
- 5.2.3 定義新的通用函數
- 5.3 數組形式的條件判斷
- 5.3.1 布爾表達式
- 5.3.2 where函數
- 5.3.3 where參數
- 5.4 數組的高級索引
- 5.4.1 布爾索引
- 5.4.2 Fancy索引
- 5.4.3 索引組合
- 5.5 數組排序
- 5.5.1 直接排序
- 5.5.2 間接排序
- 5.5.3 分區排序
- 5.6 結構化數組
- 5.6.1 結構化數組的創建
- 5.6.2 結構化數組的索引訪問
- 5.6.3 記錄數組
- 第6章 Pandas:數據處理
- 6.1 Pandas數據結構
- 6.1.1 Series對象
- 6.1.2 DataFrame對象
- 6.1.3 索引對象
- 6.2 數據索引和選取
- 6.2.1 Series中的數據選取
- 6.2.2 DataFrame中的數據選取
- 6.3 處理缺失數bb據
- 6.3.1 表示缺失數據的策略
- 6.3.2 Pandas中的缺失數據
- 6.3.3 對缺失值的操作
- 6.4 數據集合并
- 6.4.1 append函數
- 6.4.2 concat函數
- 6.4.3 join函數
- 6.4.4 merge函數
- 6.5 分層索引
- 6.5.1 分層索引:從一維到多維
- 6.5.2 分層索引的構建方法
- 6.5.3 多層級切片
- 6.5.4 重新排列分層索引
- 第7章 Pandas:數據分析
- 7.1 Pandas中的數組運算
- 7.1.1 Pandas中的通用函數
- 7.1.2 索引保留
- 7.1.3 索引對齊
- 7.1.4 Series和DataFrame之間的運算
- 7.2 數據聚合
- 7.2.1 基礎的聚合操作
- 7.2.2 靈活的聚合函數
- 7.2.3 基于行索引的分組聚合
- 7.3 數據分組
- 7.3.1 分組對象
- 7.3.2 分組鍵
- 7.3.3 分組聚合
- 7.3.4 過濾分組數據
- 7.3.5 基于分組的數據轉換
- 7.4 數據透視表
- 7.4.1 透視表和分組對象
- 7.4.2 定制透視表
- 7.4.3 透視表的進階用法
- 7.5 時間序列
- 7.5.1 時間數據的類型
- 7.5.2 時間序列的索引
- 7.5.3 時間序列的數據訪問
- 第8章 數據的導入導出
- 8.1 文本數據
- 8.1.1 從文本導入數據
- 8.1.2 導出數據到文本
- 8.2 Excel數據
- 8.2.1 從電子表格導入數據
- 8.2.2 導出數據到電子表格
- 8.3 網絡數據
- 8.3.1 JSON格式
- 8.3.2 XML和HTML格式
- 8.4 數據庫
- 8.4.1 關系數據庫
- 8.4.2 數據庫API
- 8.5 Pandas數據對象的導入導出
- 8.5.1 分隔文本格式
- 8.5.2 Excel數據格式
- 8.5.3 JSON數據格式
- 8.5.4 讀取數據庫
- 第9章 數據可視化
- 9.1 Matplotlib繪圖的基礎設置
- 9.1.1 繪圖面板
- 9.1.2 圖形樣式
- 9.1.3 坐標軸
- 9.1.4 圖例
- 9.2 Pandas繪圖接口
- 9.2.1 折線圖
- 9.2.2 柱狀圖
- 9.2.3 直方圖和密度圖
- 9.2.4 散點圖
- 第10章 實戰:數據預處理
- 10.1 數據導入
- 10.1.1 數據描述
- 10.1.2 數據讀取
- 10.1.3 數據合并
- 10.2 數據清洗
- 10.2.1 冗余數據
- 10.2.2 缺失數據
- 10.2.3 無效數據
- 10.3 數據轉換
- 10.3.1 數據類型轉換
- 10.3.2 分層索引
- 10.3.3 生成時間序列
- 10.4 數據過濾
- 10.5 數據導出
- 第11章 實戰:數據分析
- 11.1 時間序列分析
- 11.1.1 導入時間序列
- 11.1.2 生成時間區間數據
- 11.1.3 時間窗函數
- 11.2 統計分析
- 11.2.1 描述性統計
- 11.2.2 聚合統計
- 11.2.3 分組統計
- 11.3 關聯分析
- 11.3.1 數據聯合
- 11.3.2 協方差和相關系數
- 11.4 透視表分析
- 11.4.1 數據集整合
- 11.4.2 分層透視表
- 第12章 Python網絡爬蟲
- 12.1 Robots協議
- 12.2 數據抓取
- 12.2.1 最基本的數據抓取
- 12.2.2 處理登錄請求
- 12.2.3 連接超時
- 12.3 Scrapy庫
- 12.3.1 搭建工程項目
- 12.3.2 編寫爬蟲
- 12.3.3 數據選擇器
- 12.3.4 定義數據對象
- 12.3.5 數據管道
- 第13章 Scikit-learn機器學習
- 13.1 選擇合適的機器學習模型
- 13.2 數據預處理
- 13.2.1 標準化
- 13.2.2 歸一化
- 13.2.3 正態化
- 13.3 監督學習
- 13.3.1 線性模型
- 13.3.2 最近鄰算法
- 13.3.3 支持向量機
- 13.3.4 隨機森林
- 13.4 無監督學習
- 13.4.1 K-means聚類算法
- 13.4.2 主成分分析(PCA)
- 13.4.3 高斯混合模型 更新時間:2023-06-21 18:29:28