- Python廣告數據挖掘與分析實戰
- 楊游云 周健
- 309字
- 2021-04-02 14:21:18
2.4.1 Pearson相關系數
Pearson相關系數是研究數值變量之間線性相關性的。若兩個數值變量之間是非線性關系,則要求兩變量數據的間距相同或來自同一個正態分布中,所以并不是所有的數值型變量都可以用Pearson相關系數來表示兩個變量之間的相關關系。
一般來說,變量之間的線性相關性分為三種:正相關、負相關、不相關。正相關是指若一個變量往一個方向變化,則與之相關的變量也會沿著同一個方向變化。負相關是指若一個變量往一個方向變化,則與之相關的變量會沿著相反的方向變化。不相關是指無論其中一個變量如何變化,均與另一個變量無關。
相關性強弱一般用符號r來表示,正負號表示變量之間相關性的正負關系,其中:
·0≤|r|<0.3表示弱相關;
·0.3≤|r|<0.5表示中等相關;
·0.5≤|r|≤1.0表示強相關。