官术网_书友最值得收藏!

2.4 數(shù)據(jù)的離中趨勢

對一組數(shù)據(jù)特征的概括包括兩個方面,一方面是數(shù)據(jù)向某一中心值靠攏的程度,另一方面是表明該數(shù)據(jù)組的分布偏離中心值的程度,說明集中趨勢測度值對所概括的數(shù)據(jù)的代表性大小。因此,在運用集中趨勢測度值反映數(shù)據(jù)集中趨勢的同時,還要觀察數(shù)據(jù)的離中程度,即離中趨勢。

離中趨勢在統(tǒng)計學(xué)中是指一組數(shù)據(jù)在某一中心值分散的程度,它反映了各個數(shù)據(jù)遠離其中心點的程度,并且從另一個方面說明了集中趨勢測度值的代表程度。描述數(shù)據(jù)離散程度采用的測度值,根據(jù)所依據(jù)數(shù)據(jù)類型的不同主要有極差、分位距、平均差、方差、標準差和離散系數(shù)。

2.4.1 極差

極差(也叫全距)是一組數(shù)據(jù)中的最大值與最小值的差距。用公式表示為:

根據(jù)所掌握的資料不同,極差有兩種計算方法。

如果由未分組或單項分組資料計算極差,則只要用其中的最大值減去最小值即可求得。

如果統(tǒng)計數(shù)據(jù)已經(jīng)整理過,并形成組距數(shù)列,則極差的近似值為:

極差是測定離中趨勢的一種簡便方法,它能說明數(shù)據(jù)組中各數(shù)據(jù)值的最大變動范圍,但由于它是根據(jù)數(shù)據(jù)組的兩個極端值進行計算的,沒有考慮到中間變量值的變動情況,所以不能充分反映數(shù)據(jù)組所有各項數(shù)據(jù)的離中趨勢,只是一個比較粗糙的測定數(shù)據(jù)離中趨勢的指標。

在實際的應(yīng)用中,極差可用于粗略檢查產(chǎn)品質(zhì)量的穩(wěn)定性和進行質(zhì)量控制。因為在正常生產(chǎn)的條件下,產(chǎn)品質(zhì)量比較穩(wěn)定,誤差總是在一定范圍內(nèi)波動。如果有不正常情況,則誤差將會超出一定范圍。這樣,利用極差有助于及時發(fā)現(xiàn)問題,以便采取措施,保證產(chǎn)品質(zhì)量。

2.4.2 分位距

分位距是對全距的一種改進,它是從一組數(shù)據(jù)中剔除了一部分極端值之后重新計算的類似于全距的指標。常用的分位距有四分位距、八分位距和十分位距等,本書只介紹四分位距。四分位距是第三個四分位數(shù)減去第一個四分位數(shù)的差,即:

四分位距排除了數(shù)列兩端各25%單位標志值的影響,反映了數(shù)列中間部分各變量值的最大值與最小值的差距。

例2.3 已知有八個數(shù)字7,6,8,9,8,4,8,6,求這組數(shù)的四分位距。

首先,將其按從小到大的順序排列,即4,6,6,7,8,8,8,9,然后分成四等份,第一個四分位數(shù)位于第二、三個數(shù)字之間,取其平均數(shù)為(6+6)÷2=6,第二個四分位數(shù)為(7+8)÷2=7.5,第三個四分位數(shù)為(8+8)÷2=8,則這組數(shù)據(jù)的四分位距為8-6=2。

2.4.3 平均差

平均差是數(shù)據(jù)組中各數(shù)據(jù)值與其算術(shù)平均數(shù)離差絕對值的算術(shù)平均數(shù),常用符號“M.D”表示:

當變量數(shù)列是由沒有分組的數(shù)據(jù)組成或分組后每組的次數(shù)相等的數(shù)據(jù)組成時采用。

例2.4 設(shè)某車間有兩個班組,各有10名工人,其日產(chǎn)量如表2-3所示。

表2-3 兩組工人日產(chǎn)量數(shù)據(jù)表

甲組的平均值為:

乙組的平均值為:

則兩組工人日產(chǎn)量的平均差計算過程如表2-4所示。

表2-4 平均差計算表

兩組工人日產(chǎn)量的平均差為:

也就是說,在甲、乙兩組工人平均日產(chǎn)量相等(都是16件)的情況下,甲組的平均差(6件)大于乙組的平均差(3.6件),因而其變量值的離散程度比乙組大。

由于平均差是根據(jù)數(shù)列中所有數(shù)值計算出來的,受極端值影響較小,所以對整個統(tǒng)計數(shù)列的離中趨勢有較充分的代表性。

2.4.4 方差與標準差

方差是數(shù)據(jù)組中各數(shù)據(jù)值與其算術(shù)平均數(shù)離差平方的算術(shù)平均數(shù),用符號s2表示。方差的平方根就是標準差,用符號“s”表示。設(shè)有xi,x2,…,xnn個數(shù)組成一個數(shù)列,為數(shù)列的平均值,則該組數(shù)據(jù)的標準差公式為:

例2.5 繼續(xù)以例2.4的數(shù)據(jù)為例,則兩組工人日產(chǎn)量標準差計算如下(計算過程見表2-5)。

表2-5 標準差計算表

兩組工人日產(chǎn)量的標準差為:

也就是說,在甲、乙兩組工人平均日產(chǎn)量相等(都是16件)的情況下,甲組的標準差(7.40件)大于乙組(4.63件),因而其平均數(shù)的代表性比乙組小。

標準差的本質(zhì)與平均差基本相同,只是在數(shù)學(xué)處理方法上與平均差不同,平均差是用取絕對值的方法消除離差的正負號然后用算術(shù)平均的方法求出平均離差;而標準差是用平方的方法消除離差的正負號,然后對離差的平方計算算術(shù)平均數(shù),并開方求出標準差,這既克服了平均差計算中用絕對值取消離差正負號帶來的弊病,又增加了指標本身的“靈敏度”,這些優(yōu)點使它成為各種離中趨勢指標中最重要的一種。

標準差的性質(zhì):

(1)標準差度量了偏離平均數(shù)的大小。

(2)標準差是一類平均偏差。

(3)標準差指出了數(shù)列中的數(shù)離它們的平均數(shù)有多遠。數(shù)列大多數(shù)項離開平均數(shù)少于1個σ(標準差)范圍內(nèi),極少數(shù)項將離開2個或3個σ以上。一般來講,一個數(shù)列中約68%()的項在離平均數(shù)的1個σ范圍內(nèi),其余的32%離得較遠。約95%()的數(shù)據(jù)在距平均數(shù)的2個σ范圍內(nèi),其余的5%則遠離之,如圖2.14所示。

圖2.14 標準差圖示

2.4.5 離散系數(shù)

極差、平均差、標準差都是對數(shù)據(jù)的離中趨勢進行絕對或平均差異的測定。在通常情況下,它們都帶有計量單位,而且其離中趨勢大小與變量平均水平的高低有關(guān)。因此,要比較數(shù)據(jù)平均水平不同的兩組數(shù)據(jù)的離中程度的大小,就有必要計算它們的相對離中程度指標,即離散系數(shù)。常用的離散系數(shù)指標是標準差系數(shù)。

標準差系數(shù)是將一組數(shù)據(jù)的標準差與其算術(shù)平均數(shù)對比的結(jié)果,以測定其相對離中程度,常用符號“Vs”表示,其公式為:

例2.6 有甲、乙兩班同時參加統(tǒng)計學(xué)原理課程的測試,甲班的平均成績?yōu)?0分,標準差為9.0分,乙班的成績分組資料如下。

表2-6 乙班統(tǒng)計學(xué)原理課程的測試成績

比較甲、乙兩班哪個班的平均成績更有代表性?

解:計算如下所示。

表2-7 乙班測試成績的分析結(jié)果

注:此表為分組數(shù)據(jù),在取得數(shù)據(jù)時,已經(jīng)按成績進行了分組,f為學(xué)生人數(shù),有時候也叫權(quán)重。由于不知道某一分組中具體某個學(xué)生的成績,因此取組中值為代表,求各組的總成績xf

由于甲、乙兩班成績的平均值和標準差都不一樣,無法使用標準差來比較哪個班的成績波動大,因此必須使用離散系數(shù)來判斷。從計算中可以看出:VV,所以乙班的成績波動小一些,則其班級的平均成績更有代表性。

主站蜘蛛池模板: 崇州市| 潮安县| 和平县| 扎赉特旗| 平陆县| 会宁县| 郴州市| 灵台县| 凌源市| 汕尾市| 贡嘎县| 长乐市| 如东县| 澄江县| 青阳县| 陆川县| 穆棱市| 三明市| 湖州市| 社旗县| 年辖:市辖区| 高淳县| 嫩江县| 砀山县| 余干县| 武城县| 南城县| 高陵县| 额济纳旗| 长海县| 东光县| 西乡县| 常宁市| 林口县| 桂阳县| 饶河县| 萨嘎县| 高州市| 石首市| 鸡东县| 梅州市|