官术网_书友最值得收藏!

2.3 數(shù)據(jù)的集中趨勢

集中趨勢在統(tǒng)計(jì)學(xué)中是指一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點(diǎn)所在的位置。集中趨勢測度就是尋找數(shù)據(jù)水平的代表值或中心值。在數(shù)據(jù)量大的情況下,就需要有一些確切的指標(biāo)來表明其整體狀態(tài)。這些指標(biāo)最常見的就是平均數(shù)、分位數(shù)和眾數(shù)。本節(jié)從各種指標(biāo)適用的數(shù)據(jù)類型角度,介紹幾種常用的數(shù)據(jù)集中趨勢的度量指標(biāo)。

2.3.1 平均數(shù)

平均數(shù)是描述定量數(shù)據(jù)的集中趨勢,是最常用的一種測度值。它主要適用于定量數(shù)據(jù),而不適用于定性數(shù)據(jù)。根據(jù)所掌握數(shù)據(jù)的不同,平均數(shù)有不同的計(jì)算形式和計(jì)算公式,主要包括簡單算術(shù)平均數(shù)、加權(quán)算法平均數(shù)和幾何算法平均數(shù)等。在進(jìn)行數(shù)據(jù)分析時(shí),簡單算術(shù)平均數(shù)使用較為廣泛,本書著重介紹簡單算術(shù)平均數(shù),以下簡稱平均數(shù)。

一個(gè)數(shù)列的平均數(shù)等于它們的和除以它們所含個(gè)數(shù),記為。公式如下:

例如,數(shù)據(jù)9,1,2,2,0共有5項(xiàng),首項(xiàng)為9,其平均數(shù)是

平均數(shù)是概括數(shù)據(jù)的一個(gè)強(qiáng)有力的指標(biāo),它通過消除極端數(shù)據(jù)的差異將大量的數(shù)據(jù)濃縮成一個(gè)數(shù)來概括,可以較好地實(shí)現(xiàn)數(shù)據(jù)集中趨勢的度量,但這種過度的濃縮使其存在容易受極端值影響的缺點(diǎn)。

下面我們通過一個(gè)例子來進(jìn)一步深入了解平均數(shù)。設(shè)有一個(gè)數(shù)列:1,2,2,3,這個(gè)數(shù)列的直方圖(見圖2.10)關(guān)于平均數(shù)2對(duì)稱,直方圖面積的50%在平均數(shù)2的左邊,50%在平均數(shù)2的右邊。

圖2.10 數(shù)列直方圖

改變數(shù)列中最后一個(gè)數(shù)的值,假設(shè)由3變?yōu)?或7,下面觀察平均數(shù)的變化情況,如圖2.11所示。

圖2.11 直方圖變化過程

由于每個(gè)數(shù)的頻率為0.25,因此最后一個(gè)數(shù)的改變,不會(huì)改變?cè)摂?shù)的頻率,但由于數(shù)據(jù)的取值變化了,使得平均數(shù)也發(fā)生了變化。從圖2.11中可以看出,平均數(shù)隨著極端值的變化而變化,而且有向極端值靠近的趨勢,因此平均數(shù)容易受極端值影響。為了消除極端值對(duì)平均數(shù)的影響也可根據(jù)實(shí)際情況去掉極端值,例如在歌手大獎(jiǎng)賽中,去掉評(píng)委的一個(gè)最高分和一個(gè)最低分,然后再計(jì)算其平均數(shù),就是為了消除極端值對(duì)歌手得分的影響。

2.3.2 分位數(shù)

分位數(shù)是一種比較常用的數(shù)據(jù)探索性分析的指標(biāo),它的適用范圍較廣,既適合順序數(shù)據(jù),也適合定量數(shù)據(jù)。它是指介于最大值和最小值之間的一個(gè)數(shù)值,它使得數(shù)據(jù)的一部分觀察值小于或等于它,另一部分觀察值大于或等于它。常見的分位數(shù)有百分位數(shù)、四分位數(shù)和中位數(shù)等。

百分位數(shù)是一個(gè)位置指標(biāo),用Xp%表示。對(duì)一列數(shù)據(jù)來說,它表示在按照升序排列的數(shù)列中,其左側(cè)(即小于Xp%側(cè))的觀察個(gè)數(shù)在整個(gè)樣本中所占的百分比為p%,其右側(cè)(即大于Xp%側(cè))的觀察個(gè)數(shù)在整個(gè)樣本中所占的百分比為(100-p)%。

四分位數(shù),是一種特殊的百分位數(shù),它不受極端值的影響。在統(tǒng)計(jì)學(xué)中,把所有數(shù)值由小到大排列并分成四等份,處于三個(gè)分割點(diǎn)位置的數(shù)字就是四分位數(shù)。第一四分位數(shù)(Q1),又稱“較小四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字。第二四分位數(shù)(Q2),又稱“中位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。第三四分位數(shù)(Q3),又稱“較大四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字,如圖2.12所示。

圖2.12 四分位數(shù)示意圖

中位數(shù),是一種特殊的四分位數(shù),一組數(shù)據(jù)按大小順序排列后,處在數(shù)列中點(diǎn)位置的數(shù)值,則被稱為中位數(shù)。中位數(shù)從中間的一個(gè)點(diǎn)將全部數(shù)據(jù)分為兩個(gè)部分。它不受極端值的影響,既適合順序數(shù)據(jù),也適合定量數(shù)據(jù)。

中位數(shù)將全部數(shù)據(jù)等分成兩部分,每部分包含50%的數(shù)據(jù),一部分?jǐn)?shù)據(jù)比中位數(shù)大,另一部分則比中位數(shù)小。中位數(shù)主要用于測試順序數(shù)據(jù)的集中趨勢,當(dāng)然也適用于作為定量數(shù)據(jù)的集中趨勢,但不適用于分類數(shù)據(jù)。和平均數(shù)一樣,一個(gè)數(shù)列中只有一個(gè)中位數(shù)。將一組n個(gè)數(shù)據(jù)從小到大排序后,可以計(jì)算中位數(shù),中位數(shù)的計(jì)算分兩種情況:

(1)當(dāng)n為奇數(shù)時(shí),中位數(shù)等于第(n+1)/2個(gè)數(shù)對(duì)應(yīng)的值。

(2)當(dāng)n為偶數(shù)時(shí),中位數(shù)等于第n/2個(gè)和第(n/2)+1個(gè)數(shù)的平均值。

例2.1 在某城市中隨機(jī)抽取5個(gè)家庭,調(diào)查得到每個(gè)家庭的人均月收入數(shù)據(jù)(單位:元)如下,計(jì)算人均月收入的中位數(shù)。

3000 1500 3400 2400 4500

解:先將上面的數(shù)據(jù)排序,結(jié)果如下。

1500 2400 3000 3400 4500

n=5為奇數(shù),中位數(shù)位置=(5+1)÷2=3,即中位數(shù)為序列中第三個(gè)位置的數(shù)的取值,即中位數(shù)=3000(元)。

下面再看一看當(dāng)數(shù)據(jù)個(gè)數(shù)為偶數(shù)時(shí)又該怎樣計(jì)算中位數(shù)。假定我們抽取了6個(gè)家庭,每個(gè)家庭的人均月收入數(shù)據(jù)排序后為:

1500 2400 3000 3200 4000 4500

中位數(shù)第3個(gè)和第4個(gè)數(shù)的平均值,即為中位數(shù)。

Me=(3000+3200)÷2=3100

中位數(shù)是一個(gè)位置代表值,其特點(diǎn)是不受極端值的影響,在分析收入分配的數(shù)據(jù)時(shí)很有用。

2.3.3 眾數(shù)

眾數(shù)是描述分類數(shù)據(jù)的集中趨勢最常用的一種測度值,它主要適用于分類數(shù)據(jù),當(dāng)然也適用于順序數(shù)據(jù)及定量數(shù)據(jù)。一般只有在數(shù)據(jù)量較大的情況下,眾數(shù)才有意義。

眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。其主要特點(diǎn)是不受極端值影響,但在一組數(shù)據(jù)中不是只有一個(gè)眾數(shù),有可能有多個(gè)眾數(shù)或者沒有眾數(shù)。眾數(shù)的不唯一性在分布圖上表現(xiàn)為三種形態(tài),如圖2.13所示。

圖2.13 眾數(shù)的表現(xiàn)形態(tài)

例2.2 在某高校中隨機(jī)抽取9個(gè)男生,得到每個(gè)人的身高數(shù)據(jù)(cm)如下,計(jì)算男生身高的眾數(shù)。

180 175 171 171 171 162 178 170 170

解:身高出現(xiàn)次數(shù)最多的是171(cm),因此,眾數(shù)為171(cm)。

主站蜘蛛池模板: 中山市| 霍林郭勒市| 盘山县| 崇明县| 曲靖市| 武邑县| 张家港市| 绵竹市| 伊宁县| 龙江县| 陈巴尔虎旗| 平舆县| 南岸区| 定边县| 环江| 威宁| 英吉沙县| 抚顺县| 丰县| 延庆县| 西青区| 稻城县| 鹿泉市| 藁城市| 青川县| 武平县| 宝应县| 葵青区| 遂宁市| 塔河县| 易门县| 祁东县| 深泽县| 南乐县| 佛学| 茂名市| 恭城| 丹巴县| 托克托县| 三台县| 霍城县|