舉報

會員
Python數據分析實戰:從Excel輕松入門Pandas
最新章節:
10.4.6 將匯總結果分發到不同工作表
本書從零開始系統講解了使用Pandas導入Excel數據,然后使用Pandas技術對數據做整理和分析,最后導出為不同形式的Excel文件。完整實現了數據的導入、處理、輸出的處理流程。全書共10章。第1章為Pandas數據處理環境的搭建,第2章為使用Pandas對Excel數據讀取與保存,第3章介紹與Pandas底層數據相關的NumPy庫,第4章介紹了Pandas中DataFrame表格的增、刪、改、查等常用操作,第5章介紹了對Series與DataFrame兩種數據的運算、分支、遍歷等處理,第6章介紹了字符串的各種清洗技術,第7章介紹時間戳與時間差數據的處理,第8章介紹Pandas中分層索引及與索引相關的操作,第9章介紹了對數據的分組處理及做數據透視表處理,第10章介紹了表格的數據結構轉換,以及多表讀取與保存。書中包含相應示例,不僅可以學會理論知識還可以靈活應用。
最新章節
- 10.4.6 將匯總結果分發到不同工作表
- 10.4.5 跨表查詢后再聚合匯總
- 10.4.4 多工作表合并與聚合處理
- 10.4.3 特殊的縱向表格拼接
- 10.4.2 工資條制作
- 10.4.1 多個工作表數據合并
品牌:清華大學
上架時間:2023-08-10 16:11:31
出版社:清華大學出版社
本書數字版權由清華大學提供,并由其授權上海閱文信息技術有限公司制作發行
- 10.4.6 將匯總結果分發到不同工作表 更新時間:2023-08-10 16:24:35
- 10.4.5 跨表查詢后再聚合匯總
- 10.4.4 多工作表合并與聚合處理
- 10.4.3 特殊的縱向表格拼接
- 10.4.2 工資條制作
- 10.4.1 多個工作表數據合并
- 10.4 鞏固案例
- 10.3.2 批量保存
- 10.3.1 批量讀取
- 10.3 表格數據存取
- 10.2.4 表格橫向拼接(進階)
- 10.2.3 表格橫向拼接(初級)
- 10.2.2 表格縱向拼接(進階)
- 10.2.1 表格縱向拼接(初級)
- 10.2 表格縱橫拼接
- 10.1.2 將行索引數據轉換成列索引數據
- 10.1.1 列索引數據轉換成行索引數據
- 10.1 表格方向轉換
- 第10章 表格轉換技術
- 9.3.5 將數據透視表拆分為Excel文件
- 9.3.4 分組批量拆分表格到Excel文件
- 9.3.3 提取各分組下的唯一值
- 9.3.2 按條件篩選各分組的記錄
- 9.3.1 提取各分組的前兩名記錄
- 9.3 鞏固案例
- 9.2.9 數據透視表的行和列總計設置
- 9.2.8 數據透視表缺失值處理
- 9.2.7 跟列數據長度相同的數組做分組
- 9.2.6 行索引和列索引分組聚合
- 9.2.5 指定列做指定聚合
- 9.2.4 多列執行多種聚合
- 9.2.3 單列執行多種聚合
- 9.2.2 多列執行單種聚合
- 9.2.1 指定索引方向分組聚合
- 9.2 數據透視表
- 9.1.5 高級分組
- 9.1.4 過濾
- 9.1.3 轉換
- 9.1.2 聚合
- 9.1.1 分組
- 9.1 分組處理
- 第9章 數據匯總技術
- 8.8.3 根據分數返回等級設置索引
- 8.8.2 對文本型數字月份排序
- 8.8.1 篩選出下半年總銷量大于上半年的記錄
- 8.8 鞏固案例
- 8.7.5 索引刪除
- 8.7.4 索引層級交換
- 8.7.3 索引排序
- 8.7.2 索引重置
- 8.7.1 索引重命名
- 8.7 索引的修改
- 8.6.6 篩選索引
- 8.6.5 選擇指定級別數據
- 8.6.4 選擇多行多列
- 8.6.3 選擇單值
- 8.6.2 選擇單列
- 8.6.1 選擇單行
- 8.6 分層索引切片
- 8.5.2 行索引設置為列數據
- 8.5.1 列數據設置為行索引
- 8.5 行索引與列數據的相互轉換
- 8.4 文件導入導出時分層索引設置
- 8.3 分層索引設置的4種方法
- 8.2.2 DataFrame的分層索引設置
- 8.2.1 Series的分層索引設置
- 8.2 分層索引的設置
- 8.1.2 DataFrame索引
- 8.1.1 Series索引
- 8.1 Pandas索引
- 第8章 高級索引技術
- 7.3.4 根據借書起始時間及租借天數計算歸還日期
- 7.3.3 根據開始時間到結束時間的時長計算金額
- 7.3.2 將不規范日期整理為標準日期
- 7.3.1 根據出生日期計算年齡
- 7.3 鞏固案例
- 7.2.4 時間差偏移
- 7.2.3 時間差信息獲取
- 7.2.2 時間差序列
- 7.2.1 單個時間差
- 7.2 時間差
- 7.1.4 時間戳信息獲取
- 7.1.3 時間戳轉換
- 7.1.2 時間戳序列
- 7.1.1 單個時間戳
- 7.1 時間戳
- 第7章 日期和時間處理技術
- 6.14.6 對文本中的多科目成績排序
- 6.14.5 提取不重復名單
- 6.14.4 提取文本型單價后與數量做求和統計
- 6.14.3 給關鍵信息加掩碼
- 6.14.2 兩表查詢合并應用
- 6.14.1 篩選出分數中至少有3個大于或等于90分的記錄
- 6.14 鞏固案例
- 6.13 擴展
- 6.12.2 Series數據與其他數據合并
- 6.12.1 Series數據自身元素合并
- 6.12 合并
- 6.11.3 自定義排序
- 6.11.2 多列排序
- 6.11.1 單列排序
- 6.11 排序
- 6.10.2 重復項刪除
- 6.10.1 重復項判斷
- 6.10 去重
- 6.9.2 字符填充
- 6.9.1 元素填充
- 6.9 填充
- 6.8 修剪
- 6.7 重復
- 6.6 長度
- 6.5.3 實例應用
- 6.5.2 DataFrame表格替換
- 6.5.1 Series數據替換
- 6.5 替換
- 6.4.4 實例應用
- 6.4.3 查找數據
- 6.4.2 查找判斷
- 6.4.1 查找位置
- 6.4 查找
- 6.3.3 實例應用
- 6.3.2 將數據提取到行方向
- 6.3.1 將數據提取到列方向
- 6.3 提取
- 6.2.5 實例應用
- 6.2.4 拆為表格
- 6.2.3 拆分次數
- 6.2.2 正則拆分
- 6.2.1 普通拆分
- 6.2 拆分
- 6.1.3 正則表達式編寫規則
- 6.1.2 正則表達式處理函數
- 6.1.1 正則表達式的導入與創建
- 6.1 正則
- 第6章 字符串清洗技術
- 5.5.5 統計每個人所有考試科目的最優科目
- 5.5.4 統計每個人各科目總分之和的排名
- 5.5.3 篩選出成績表中各科目的和大于或等于300的記錄
- 5.5.2 篩選出成績表中各科目均大于或等于100的記錄
- 5.5.1 根據不同蔬菜的采購數量統計每天采購金額
- 5.5 鞏固案例
- 5.4.4 排名統計
- 5.4.3 極值統計
- 5.4.2 邏輯統計
- 5.4.1 聚合統計
- 5.4 數據統計處理
- 5.3.3 遍歷DataFrame元素(applymap())
- 5.3.2 遍歷DataFrame行和列(apply())
- 5.3.1 遍歷Series元素(map())
- 5.3 數據遍歷處理
- 5.2.2 條件判斷處理2(np.where())
- 5.2.1 條件判斷處理1(mask()與where())
- 5.2 數據分支判斷
- 5.1.7 數據運算時的對齊特性
- 5.1.6 DataFrame與Series運算
- 5.1.5 DataFrame與DataFrame運算
- 5.1.4 Series與Series運算
- 5.1.3 DataFrame與單值運算
- 5.1.2 Series與單值的運算
- 5.1.1 運算符與運算函數
- 5.1 數據運算處理
- 第5章 數據處理基礎
- 4.6 鞏固案例
- 4.5 表格數據的修改
- 4.4.3 刪除有缺失值的行和列
- 4.4.2 刪除列
- 4.4.1 刪除行
- 4.4 刪除表格的行和列
- 4.3.2 添加列
- 4.3.1 添加行
- 4.3 添加表格的行和列
- 4.2.4 iloc切片法
- 4.2.3 loc切片法
- 4.2.2 篩選法
- 4.2.1 切片法
- 4.2 表格的切片選擇
- 4.1.2 表格屬性修改
- 4.1.1 表格屬性的獲取
- 4.1 表格屬性獲取與修改
- 第4章 表格管理技術
- 3.6.3 使用Python字典創建DataFrame表格
- 3.6.2 使用Python列表創建DataFrame表格
- 3.6.1 使用NumPy數組創建DataFrame表格
- 3.6 DataFrame表格的創建
- 3.5 Series數據的創建
- 3.4.2 數組合并
- 3.4.1 數組維度轉換
- 3.4 NumPy數組維度轉換
- 3.3.3 重復值處理
- 3.3.2 缺失值處理
- 3.3.1 類型轉換
- 3.3 NumPy數組的預處理
- 3.2.4 轉換數組
- 3.2.3 隨機數組
- 3.2.2 序列數組
- 3.2.1 普通數組
- 3.2 NumPy數組的創建與轉換
- 3.1 NumPy的定義
- 第3章 NumPy數據處理基石
- 2.5.2 Series數據結構
- 2.5.1 DataFrame數據結構
- 2.5 Pandas中表格的結構
- 2.4 保存為CSV文件格式
- 2.3 保存為Excel文件格式
- 2.2 讀取CSV文件數據
- 2.1 讀取Excel文件數據
- 第2章 Pandas中數據的存取
- 1.2.6 函數
- 1.2.5 控制語句
- 1.2.4 數據結構
- 1.2.3 代碼縮進
- 1.2.2 注釋
- 1.2.1 變量
- 1.2 Python基礎操作
- 1.1.2 程序編寫工具Jupyter Notebook
- 1.1.1 安裝Python發行版本Anaconda
- 1.1 Pandas環境配置
- 第1章 Pandas數據處理環境搭建
- 前言PREFACE
- 作者簡介
- 內容簡介
- 版權信息
- 封面
- 封面
- 版權信息
- 內容簡介
- 作者簡介
- 前言PREFACE
- 第1章 Pandas數據處理環境搭建
- 1.1 Pandas環境配置
- 1.1.1 安裝Python發行版本Anaconda
- 1.1.2 程序編寫工具Jupyter Notebook
- 1.2 Python基礎操作
- 1.2.1 變量
- 1.2.2 注釋
- 1.2.3 代碼縮進
- 1.2.4 數據結構
- 1.2.5 控制語句
- 1.2.6 函數
- 第2章 Pandas中數據的存取
- 2.1 讀取Excel文件數據
- 2.2 讀取CSV文件數據
- 2.3 保存為Excel文件格式
- 2.4 保存為CSV文件格式
- 2.5 Pandas中表格的結構
- 2.5.1 DataFrame數據結構
- 2.5.2 Series數據結構
- 第3章 NumPy數據處理基石
- 3.1 NumPy的定義
- 3.2 NumPy數組的創建與轉換
- 3.2.1 普通數組
- 3.2.2 序列數組
- 3.2.3 隨機數組
- 3.2.4 轉換數組
- 3.3 NumPy數組的預處理
- 3.3.1 類型轉換
- 3.3.2 缺失值處理
- 3.3.3 重復值處理
- 3.4 NumPy數組維度轉換
- 3.4.1 數組維度轉換
- 3.4.2 數組合并
- 3.5 Series數據的創建
- 3.6 DataFrame表格的創建
- 3.6.1 使用NumPy數組創建DataFrame表格
- 3.6.2 使用Python列表創建DataFrame表格
- 3.6.3 使用Python字典創建DataFrame表格
- 第4章 表格管理技術
- 4.1 表格屬性獲取與修改
- 4.1.1 表格屬性的獲取
- 4.1.2 表格屬性修改
- 4.2 表格的切片選擇
- 4.2.1 切片法
- 4.2.2 篩選法
- 4.2.3 loc切片法
- 4.2.4 iloc切片法
- 4.3 添加表格的行和列
- 4.3.1 添加行
- 4.3.2 添加列
- 4.4 刪除表格的行和列
- 4.4.1 刪除行
- 4.4.2 刪除列
- 4.4.3 刪除有缺失值的行和列
- 4.5 表格數據的修改
- 4.6 鞏固案例
- 第5章 數據處理基礎
- 5.1 數據運算處理
- 5.1.1 運算符與運算函數
- 5.1.2 Series與單值的運算
- 5.1.3 DataFrame與單值運算
- 5.1.4 Series與Series運算
- 5.1.5 DataFrame與DataFrame運算
- 5.1.6 DataFrame與Series運算
- 5.1.7 數據運算時的對齊特性
- 5.2 數據分支判斷
- 5.2.1 條件判斷處理1(mask()與where())
- 5.2.2 條件判斷處理2(np.where())
- 5.3 數據遍歷處理
- 5.3.1 遍歷Series元素(map())
- 5.3.2 遍歷DataFrame行和列(apply())
- 5.3.3 遍歷DataFrame元素(applymap())
- 5.4 數據統計處理
- 5.4.1 聚合統計
- 5.4.2 邏輯統計
- 5.4.3 極值統計
- 5.4.4 排名統計
- 5.5 鞏固案例
- 5.5.1 根據不同蔬菜的采購數量統計每天采購金額
- 5.5.2 篩選出成績表中各科目均大于或等于100的記錄
- 5.5.3 篩選出成績表中各科目的和大于或等于300的記錄
- 5.5.4 統計每個人各科目總分之和的排名
- 5.5.5 統計每個人所有考試科目的最優科目
- 第6章 字符串清洗技術
- 6.1 正則
- 6.1.1 正則表達式的導入與創建
- 6.1.2 正則表達式處理函數
- 6.1.3 正則表達式編寫規則
- 6.2 拆分
- 6.2.1 普通拆分
- 6.2.2 正則拆分
- 6.2.3 拆分次數
- 6.2.4 拆為表格
- 6.2.5 實例應用
- 6.3 提取
- 6.3.1 將數據提取到列方向
- 6.3.2 將數據提取到行方向
- 6.3.3 實例應用
- 6.4 查找
- 6.4.1 查找位置
- 6.4.2 查找判斷
- 6.4.3 查找數據
- 6.4.4 實例應用
- 6.5 替換
- 6.5.1 Series數據替換
- 6.5.2 DataFrame表格替換
- 6.5.3 實例應用
- 6.6 長度
- 6.7 重復
- 6.8 修剪
- 6.9 填充
- 6.9.1 元素填充
- 6.9.2 字符填充
- 6.10 去重
- 6.10.1 重復項判斷
- 6.10.2 重復項刪除
- 6.11 排序
- 6.11.1 單列排序
- 6.11.2 多列排序
- 6.11.3 自定義排序
- 6.12 合并
- 6.12.1 Series數據自身元素合并
- 6.12.2 Series數據與其他數據合并
- 6.13 擴展
- 6.14 鞏固案例
- 6.14.1 篩選出分數中至少有3個大于或等于90分的記錄
- 6.14.2 兩表查詢合并應用
- 6.14.3 給關鍵信息加掩碼
- 6.14.4 提取文本型單價后與數量做求和統計
- 6.14.5 提取不重復名單
- 6.14.6 對文本中的多科目成績排序
- 第7章 日期和時間處理技術
- 7.1 時間戳
- 7.1.1 單個時間戳
- 7.1.2 時間戳序列
- 7.1.3 時間戳轉換
- 7.1.4 時間戳信息獲取
- 7.2 時間差
- 7.2.1 單個時間差
- 7.2.2 時間差序列
- 7.2.3 時間差信息獲取
- 7.2.4 時間差偏移
- 7.3 鞏固案例
- 7.3.1 根據出生日期計算年齡
- 7.3.2 將不規范日期整理為標準日期
- 7.3.3 根據開始時間到結束時間的時長計算金額
- 7.3.4 根據借書起始時間及租借天數計算歸還日期
- 第8章 高級索引技術
- 8.1 Pandas索引
- 8.1.1 Series索引
- 8.1.2 DataFrame索引
- 8.2 分層索引的設置
- 8.2.1 Series的分層索引設置
- 8.2.2 DataFrame的分層索引設置
- 8.3 分層索引設置的4種方法
- 8.4 文件導入導出時分層索引設置
- 8.5 行索引與列數據的相互轉換
- 8.5.1 列數據設置為行索引
- 8.5.2 行索引設置為列數據
- 8.6 分層索引切片
- 8.6.1 選擇單行
- 8.6.2 選擇單列
- 8.6.3 選擇單值
- 8.6.4 選擇多行多列
- 8.6.5 選擇指定級別數據
- 8.6.6 篩選索引
- 8.7 索引的修改
- 8.7.1 索引重命名
- 8.7.2 索引重置
- 8.7.3 索引排序
- 8.7.4 索引層級交換
- 8.7.5 索引刪除
- 8.8 鞏固案例
- 8.8.1 篩選出下半年總銷量大于上半年的記錄
- 8.8.2 對文本型數字月份排序
- 8.8.3 根據分數返回等級設置索引
- 第9章 數據匯總技術
- 9.1 分組處理
- 9.1.1 分組
- 9.1.2 聚合
- 9.1.3 轉換
- 9.1.4 過濾
- 9.1.5 高級分組
- 9.2 數據透視表
- 9.2.1 指定索引方向分組聚合
- 9.2.2 多列執行單種聚合
- 9.2.3 單列執行多種聚合
- 9.2.4 多列執行多種聚合
- 9.2.5 指定列做指定聚合
- 9.2.6 行索引和列索引分組聚合
- 9.2.7 跟列數據長度相同的數組做分組
- 9.2.8 數據透視表缺失值處理
- 9.2.9 數據透視表的行和列總計設置
- 9.3 鞏固案例
- 9.3.1 提取各分組的前兩名記錄
- 9.3.2 按條件篩選各分組的記錄
- 9.3.3 提取各分組下的唯一值
- 9.3.4 分組批量拆分表格到Excel文件
- 9.3.5 將數據透視表拆分為Excel文件
- 第10章 表格轉換技術
- 10.1 表格方向轉換
- 10.1.1 列索引數據轉換成行索引數據
- 10.1.2 將行索引數據轉換成列索引數據
- 10.2 表格縱橫拼接
- 10.2.1 表格縱向拼接(初級)
- 10.2.2 表格縱向拼接(進階)
- 10.2.3 表格橫向拼接(初級)
- 10.2.4 表格橫向拼接(進階)
- 10.3 表格數據存取
- 10.3.1 批量讀取
- 10.3.2 批量保存
- 10.4 鞏固案例
- 10.4.1 多個工作表數據合并
- 10.4.2 工資條制作
- 10.4.3 特殊的縱向表格拼接
- 10.4.4 多工作表合并與聚合處理
- 10.4.5 跨表查詢后再聚合匯總
- 10.4.6 將匯總結果分發到不同工作表 更新時間:2023-08-10 16:24:35