- 對比Excel,輕松學習Python數據分析(入職數據分析師系列)
- 張俊紅
- 611字
- 2019-09-19 16:30:48
3.2 DataFrame 表格型數據結構
3.2.1 DataFrame是什么
Series是由一組數據與一組索引(行索引)組成的數據結構,而DataFrame是由一組數據與一對索引(行索引和列索引)組成的表格型數據結構。之所以叫表格型數據結構,是因為DataFrame的數據形式和Excel的數據存儲形式很相近,接下來的章節主要圍繞DataFrame這種表格型數據結構展開。下面就是一個簡單的DataFrame數據結構。

上面這種數據結構和Excel的數據結構很像,既有行索引又有列索引,由行索引和列索引確定唯一值。如果把上面這種結構用Excel表展示如下表所示。

3.2.2 創建一個DataFrame
創建DataFrame使用的方法是pd.DataFrame(),通過給DataFrame()方法傳入不同的對象即可實現。
傳入一個列表
傳入一個列表的實現如下所示。

只傳入一個單一列表時,該列表的值會顯示成一列,且行和列都是從0開始的默認索引。
傳入一個嵌套列表

當傳入一個嵌套列表時,會根據嵌套列表數顯示成多列數據,行、列索引同樣是從0開始的默認索引。列表里面嵌套的列表也可以換成元組。

指定行、列索引
如果只給DataFrame()方法傳入列表,DataFrame()方法的行、列索引都是默認值,則可以通過設置columns參數自定義列索引,設置index參數自定義行索引。

傳入一個字典
傳入一個字典的實現如下所示。

直接以字典的形式傳入DataFrame時,字典的key值就相當于列索引,這個時候如果沒有設置行索引,行索引還是使用從0開始的默認索引,同樣可以使用index參數自定義行索引,代碼如下:

3.2.3 獲取DataFrame的行、列索引
利用columns方法獲取DataFrame的列索引。

利用index方法獲取DataFrame的行索引。

3.2.4 獲取DataFrame的值
獲取DataFrame的值就是獲取DataFrame中的某些行或列,有關行、列的選擇在第6章會有詳細講解。
推薦閱讀
- Hands-On Data Structures and Algorithms with Rust
- 從零開始學Hadoop大數據分析(視頻教學版)
- Neural Network Programming with TensorFlow
- OracleDBA實戰攻略:運維管理、診斷優化、高可用與最佳實踐
- 大數據治理與安全:從理論到開源實踐
- 視覺大數據智能分析算法實戰
- Augmented Reality using Appcelerator Titanium Starter
- 大數據數學基礎(Python語言描述)
- Expert Python Programming(Third Edition)
- Oracle 11g數據庫管理員指南
- 區塊鏈應用開發指南:業務場景剖析與實戰
- 數字化轉型方法論:落地路徑與數據中臺
- SQL Server 2012 數據庫教程(第3版)
- SQL Server 2012數據庫技術及應用(第4版)
- 信息技術導論