官术网_书友最值得收藏!

3.2 DataFrame 表格型數據結構

3.2.1 DataFrame是什么

Series是由一組數據與一組索引(行索引)組成的數據結構,而DataFrame是由一組數據與一對索引(行索引和列索引)組成的表格型數據結構。之所以叫表格型數據結構,是因為DataFrame的數據形式和Excel的數據存儲形式很相近,接下來的章節主要圍繞DataFrame這種表格型數據結構展開。下面就是一個簡單的DataFrame數據結構。

上面這種數據結構和Excel的數據結構很像,既有行索引又有列索引,由行索引和列索引確定唯一值。如果把上面這種結構用Excel表展示如下表所示。

3.2.2 創建一個DataFrame

創建DataFrame使用的方法是pd.DataFrame(),通過給DataFrame()方法傳入不同的對象即可實現。

傳入一個列表

傳入一個列表的實現如下所示。

只傳入一個單一列表時,該列表的值會顯示成一列,且行和列都是從0開始的默認索引。

傳入一個嵌套列表

當傳入一個嵌套列表時,會根據嵌套列表數顯示成多列數據,行、列索引同樣是從0開始的默認索引。列表里面嵌套的列表也可以換成元組。

指定行、列索引

如果只給DataFrame()方法傳入列表,DataFrame()方法的行、列索引都是默認值,則可以通過設置columns參數自定義列索引,設置index參數自定義行索引。

傳入一個字典

傳入一個字典的實現如下所示。

直接以字典的形式傳入DataFrame時,字典的key值就相當于列索引,這個時候如果沒有設置行索引,行索引還是使用從0開始的默認索引,同樣可以使用index參數自定義行索引,代碼如下:

3.2.3 獲取DataFrame的行、列索引

利用columns方法獲取DataFrame的列索引。

利用index方法獲取DataFrame的行索引。

3.2.4 獲取DataFrame的值

獲取DataFrame的值就是獲取DataFrame中的某些行或列,有關行、列的選擇在第6章會有詳細講解。

主站蜘蛛池模板: 枣强县| 三门县| 延川县| 土默特左旗| 东海县| 西华县| 罗田县| 香格里拉县| 北票市| 德惠市| 锡林浩特市| 微山县| 偃师市| 铜鼓县| 台安县| 武义县| 长子县| 洛阳市| 阳高县| 西贡区| 九龙县| 江源县| 唐海县| 深圳市| 井冈山市| 福清市| 疏勒县| 临沧市| 霍山县| 龙南县| 五常市| 洱源县| 宁城县| 普陀区| 龙川县| 普兰县| 台江县| 环江| 襄汾县| 云和县| 廊坊市|