- Python廣告數據挖掘與分析實戰
- 楊游云 周健
- 557字
- 2021-04-02 14:21:19
3.1 數據基礎運算工具:NumPy
NumPy是Python中用于科學計算的基礎軟件包,包含多維數組對象、多種派生對象(如矩陣)以及用于快速操作數組的函數的API。除此之外,它還提供線性代數運算、隨機數生成以及傅里葉變換等功能。NumPy的核心是ndarray對象,它封裝了Python原生的同數據類型的N維數組,為了保證其優良性能,其中許多操作都是在本地編譯后執行的。
NumPy數組和標準Python Array(數組)之間有幾個重要的區別。
·NumPy數組在創建時具有固定的大小,與Python的原生數組對象(可以動態增長)不同,更改ndarray的大小將創建一個新數組并刪除原來的數組。
·NumPy數組中的元素都需要具有相同的數據類型,因此各元素在內存中的大小相同。但需要注意的是,當Python原生數組里包含了NumPy對象時,可以存在元素大小不同的數組。
·NumPy數組有助于對大量數據進行高級數學和其他類型的操作。一般來說,這些操作的執行效率更高,比使用Python原生數組所需的代碼更少。
目前,越來越多基于Python的科學軟件包使用了NumPy數組,雖然這些工具通常都支持將Python的原生數組作為參數,但它們在處理之前還是會將輸入的數組轉換為NumPy數組,而且輸出通常也是NumPy數組。換句話說,為了更高效地使用基于Python的科學計算工具,只知道如何使用Python的原生數組類型是不夠的,還需要知道如何使用NumPy數組。
在廣告數據分析挖掘中,使用NumPy工具包進行數據運算的場景非常多。下面我們先簡單認識一下Python中常見的數據結構。
推薦閱讀