- Python機(jī)器學(xué)習(xí)算法與應(yīng)用
- 鄧立國
- 1139字
- 2020-11-23 14:57:12
2.1.3 數(shù)據(jù)分布偏態(tài)與峰度的測定
偏態(tài)和峰度就是對這些分布特征的描述:偏度是對數(shù)據(jù)分布在偏移方向和程度所做的進(jìn)一步描述;峰度是對數(shù)據(jù)分布的扁平程度所做的描述。偏斜程度的描述用偏態(tài)系數(shù),扁平程度的描述用峰度系數(shù)。
1.動(dòng)差法
動(dòng)差又稱矩,原是物理學(xué)上用以表示力與力臂對重心關(guān)系的術(shù)語,這個(gè)關(guān)系和統(tǒng)計(jì)學(xué)中變量與權(quán)數(shù)對平均數(shù)的關(guān)系在性質(zhì)上很類似,所以統(tǒng)計(jì)學(xué)也用動(dòng)差來說明頻數(shù)分布的性質(zhì)。
一般地說,取變量的a值為中點(diǎn),所有變量值與a之差的K次方的平均數(shù)稱為變量X關(guān)于a的K階動(dòng)差。用式子表示即為:

(2.31)
當(dāng)a=0時(shí),即變量以原點(diǎn)為中心,上式稱為K階原點(diǎn)動(dòng)差,用大寫英文字母M表示。
一階原點(diǎn)動(dòng)差:

(2.32)
二階原點(diǎn)動(dòng)差:

(2.33)
三階原點(diǎn)動(dòng)差:

(2.34)
當(dāng)時(shí),即變量以算術(shù)平均數(shù)為中心,上式稱為K階中心動(dòng)差,用小寫英文字母m表示。
一階中心動(dòng)差:

(2.35)
二階中心動(dòng)差:

(2.36)
三階中心動(dòng)差:

(2.37)
2.偏態(tài)及其測度
偏態(tài)是對分布偏斜方向及程度的度量。從前面的內(nèi)容中我們已經(jīng)知道,頻數(shù)分布有對稱的,有不對稱的(偏態(tài)的)。在偏態(tài)的分布中,又有兩種不同的形態(tài),即左偏和右偏。我們可以利用眾數(shù)、中位數(shù)和算術(shù)平均數(shù)之間的關(guān)系判斷分布是左偏還是右偏,但要度量分布偏斜的程度,就需要計(jì)算偏態(tài)系數(shù)了。
采用動(dòng)差法計(jì)算偏態(tài)系數(shù)是用變量的三階中心動(dòng)差m3與進(jìn)行對比,計(jì)算公式為:

(2.38)
當(dāng)分布對稱時(shí),變量的三階中心動(dòng)差m3由于離差三次方后正負(fù)相互抵消而取得0值,所以a=0;當(dāng)分布不對稱時(shí),正負(fù)離差不能抵消,就形成正的或負(fù)的三階中心動(dòng)差m3。當(dāng)m3為正值時(shí),表示正偏離差值比負(fù)偏離差值要大,可以判斷為正偏或右偏;反之,當(dāng)m3為負(fù)值時(shí),表示負(fù)偏離差值比正偏離差值要大,可以判斷為負(fù)偏或左偏。|m3|越大,表示偏斜的程度就越大。由于三階中心動(dòng)差m3含有計(jì)量單位,為消除計(jì)量單位的影響,就用去除m3,使其轉(zhuǎn)化為相對數(shù)。同樣的, a的絕對值越大,表示偏斜的程度就越大。
3.峰度及其測度
峰度是用來衡量分布的集中程度或分布曲線的尖峭程度的指標(biāo)。計(jì)算公式如下:

(2.39)
分布曲線的尖峭程度與偶數(shù)階中心動(dòng)差的數(shù)值大小有直接的關(guān)系,m2是方差,于是就以四階中心動(dòng)差m4來度量分布曲線的尖峭程度。m4是一個(gè)絕對數(shù),含有計(jì)量單位,為消除計(jì)量單位的影響,將m4除以,就得到無量綱的相對數(shù)。衡量分布的集中程度或分布曲線的尖峭程度往往是以正態(tài)分布的峰度作為比較標(biāo)準(zhǔn)的。在正態(tài)分布條件下,m4/σ4=3,將各種不同分布的尖峭程度與正態(tài)分布比較。
當(dāng)峰度a4>3時(shí),表示分布的形狀比正態(tài)分布更瘦更高,意味著分布比正態(tài)分布更集中在平均數(shù)周圍,這樣的分布稱為尖峰分布,如圖2.1(a);當(dāng)a4=3時(shí),分布為正態(tài)分布;當(dāng)a4<3時(shí),表示分布比正態(tài)分布更扁平,意味著分布比正態(tài)分布更分散,這樣的分布稱為扁平分布,如圖2.1(b)所示。

圖2.1 尖峰與平峰分布示意圖
- Beginning Java Data Structures and Algorithms
- C語言程序設(shè)計(jì)(第3版)
- Java 9 Concurrency Cookbook(Second Edition)
- Leap Motion Development Essentials
- 算法精粹:經(jīng)典計(jì)算機(jī)科學(xué)問題的Java實(shí)現(xiàn)
- Selenium Design Patterns and Best Practices
- FreeSWITCH 1.6 Cookbook
- 精通Linux(第2版)
- Hands-On Full Stack Development with Go
- PySide 6/PyQt 6快速開發(fā)與實(shí)戰(zhàn)
- Kotlin極簡教程
- Java程序設(shè)計(jì)與項(xiàng)目案例教程
- AMP:Building Accelerated Mobile Pages
- 現(xiàn)代CPU性能分析與優(yōu)化
- AutoCAD基礎(chǔ)教程