- Python廣告數據挖掘與分析實戰
- 楊游云 周健
- 213字
- 2021-04-02 14:21:22
3.2 數據預處理工具:Pandas
Pandas是一個基于NumPy的開源Python數據分析庫,在數據準備、數據清洗、數據分析工作中會經常用到。Pandas提供了兩個主要數據結構:序列(Series)和數據框(DataFrame)。其中,Series類似于NumPy中的一維數組,DataFrame類似于NumPy中的二維數組。我們可以通過Pandas方便地進行各類數據的讀取,包括Excel、csv、txt文件,MySQL、Oracle等數據庫文件,還可以通過Pandas進行數據的增刪改查、合并、重塑、分組、統計分析等操作。如果你熟悉Excel,建議你認真學習本節內容,了解如何在Python中實現Excel的相應操作等。