1.6 數據統計檢驗
1.6.1 離群數據的檢驗
在實驗中,一定條件下重復測定所得到的一組數據具有一定的分散性,這種分散性反映了隨機誤差的大小,但是可以認為這一組數據是來自同一正態的總體。當然,也無法排除實驗中由于各種因素的改變而產生系統誤差的可能,后者顯然不來源于前者的同一總體,結果產生了離群數據,或稱為異常值。為了進行離群數據的檢查,首先要確定判斷離群值的準則,然后再選擇合適的統計檢驗方法。
(1)判斷離群值的準則
確定一個合理的顯著性水平或概率水平為1%或5%。
①如果統計量的計算值≤5%的臨界值時,被檢驗的數據稱為統計上不顯著,不屬于離群數據,應該保留。
②如果統計量的計算值>5%的臨界值,而同時又≤1%臨界值,被檢驗數據稱為偏離值;對偏離值除非產生的原因很清楚,一般不予以剔除。
③如果統計量的計算值>1%的臨界值,被檢驗數據稱為離群值,應剔除。
以上1%和5%均為顯著性水平。
(2)檢驗離群值的方法
離群值的檢驗方法較多,如拉依達(laǔta)方法、肖維勒(Chauvent)方法、偏度峰度法、格拉布斯(Grubbs)法、狄克遜(Dixon)法、t檢驗法和Cochran法等。這里介紹3個常用的、被公認為是較好的方法,即Grubbs法、Dixon和t檢驗法。
①格拉布斯(Grubbs)法 Grubbs采用的統計量為:
(1-22)
式中,xd表示可能的離群值,一般為同一組數據中的最大值(Xmax)或最小值(Xmin);為所有被檢數據的平均值;s是包括可疑值在內的數據標準偏差。根據樣本容量n值,及確定的顯著性水平α(一般取0.01或0.05)。查Grubbs檢驗臨界值表,得到臨界值G(α,n),比較計算值G與表中查得的G(α,n),進行判斷。若G≥G(α,n),則xd為異常值舍去;若G<G(α,n),則xd不是異常值,應保留。Grubbs法判斷離群的異常值要依靠Grubbs檢驗臨界值表G(α,n)(見表1-29)。
表1-29 Grubbs檢驗臨界值表G(α,n)

②狄克遜(Dixon)法 Dixon法是應用極差比方法,經過簡化而可得到嚴密的結果。為了提高判斷效率,不同的測定次數應用不同的極差比。
具體步驟如下。
第一步:將樣本值在n次測量中按數值的大小順序排列為x1≤x2≤…≤xn,設x1或xn可能是離群值。
第二步:計算離群值與最鄰近數據的差值,除以全組數據的極差,其商為D值。以式(1-23)計算D值:

(1-23)
第三步:判斷,如果計算的D值,若D計算≥D臨界值,則表明x1或xn是離群值,應棄去;反之,就保留此數據。臨界值可以查Dixon檢驗法臨界值表(見表1-30)。
表1-30 Dixon檢驗法的臨界值表

不同的測定次數應用不同的極差比,其計算D值公式為下:
當3≤n≤7時,
當8≤n≤10時,
當11≤n≤13時,
當14≤n≤25時,
③t檢驗法
t檢驗法采用的統計量t為:
(1-24)
式中,xd為懷疑的離群值;為不包括離群值在內的(n-1)測定值的平均值;S為不包括離群值的測定值的標準偏差。
檢驗步驟:第一步是將懷疑是離群值的數據代入式(1-24)中,計算t值;
第二步是確定顯著性水平α與測定次數n,查t檢驗的臨界值Tα,n表1-31;
第三步為判斷,若t計算值>t臨界值,則將xd作為異常值棄去,若t計算值<t臨界值,則xd應保留。
表1-31 t檢驗的臨界值表Tα,n

上述介紹的Grubbs法、Dixon法和t檢驗法是比較嚴格的統計方法,在要求較精密的實驗中,可以選用其中兩種方法加以判別,以便合理地剔除異常值而保留正確值。剔除的異常值應是少量的和個別的測量值,否則應從實驗上尋找原因。以上三種方法既可以作為實驗室內平均值的異常值檢驗,又可以作為各實驗室間的平均值的異常值檢驗。
(3)檢驗離群值(異常值)注意事項
①在檢驗異常值之前,首先對測量的數據核查,若有的數據明顯是由于某種過失,如溶樣時樣品濺出,污染原因造成異常或測定時由于儀器不正常引起的異常,事先應將其舍去,再進行統計檢驗。
②因為檢驗異常值的統計方法均適用于來自正態分布總體的樣本,所以必須首先檢查確定總體是正態分布時才能使用,在分析實驗中,一般情況所測量的數據及隨機誤差屬于正態分布的,若樣本來自對數正態分布總體,應先將數據取對數,然后用對數樣本進行檢驗。
③以上三種檢驗法中,Grubbs法、t檢驗法大小樣本都適用,Dixon法僅適用于容量不大于25的樣本。
④在用統計檢驗法剔除異常值時,應注意異常值可能不止一個,應逐個判斷,逐個剔除。判斷從最大值開始,若是異常值,剔除后再判斷次大值,直到所判斷的不是異常值為止。
⑤經判斷確定異常后,通常的做法是不要輕易地舍去,首先應檢驗實驗過程是否存在問題,為穩妥起見,分析人員應對其重新測量,必要時從稱樣開始嚴格地進行每一步實驗。復查這個數據,若結果與前面相同,仍為異常,則排除實驗因素,進一步考核采樣及運輸過程是否有污染的因素,必要時,重新采樣再次測量,以做最后的判斷。
(4)實驗室間的離群值檢驗
不同的實驗室對同一個試樣測定,得到不同的平均值,通過統計檢驗的方法來判斷實驗室間是否存在離群值,當然,這個離群值就不是個別數據的離群,而是一組數據的離群。判斷方法如下。
第一步:將m個實驗室對同一試樣測定得到m個平均值將其按大小順序排列
第二步:對最小平均值和最大平均值
懷疑是否離群進行檢驗,按下式計算統計量
(1-25)
式中,、
分別為第1個實驗室和第m個實驗室測量數據的平均值;
為m個實驗室的總平均值;
為m個實驗室間平均值的標準差。
若測量次數相同時均為n次,實驗室間單次測定的標準偏差為
(1-26)
若測定次數不相同(n1≠n2≠…≠nm)時,則
(1-27)
式中,Si為第i個實驗室單次測量的標準偏差。實驗室間平均值測定的標準偏差為
(1-28)
第三步:判斷,由式(1-25)計算的統計量T值和從表1-32中查得的相應顯著水平α和m下的臨界值比較,若T1>Tα,m或Tm>Tα,m,則或
與其他實驗室平均值之間有顯著差異,應剔除第1個實驗室或第m個實驗室的一組數據;反之,則應保留。
表1-32 實驗室間離群值檢驗臨界值表

1.6.2 t檢驗法
在分析實驗中,一般只進行少數的幾次測定,是小樣本實驗,適用于小樣本的統計方法。t分布規律是小樣本的統計規律,當大樣本為正態總體時,小樣本的t分布也是屬于正態分布,可以計算樣本數據的平均值和樣本的標準偏差S,使用統計量t來進行平均值是否存在顯著差異的檢驗。用t檢驗可以對在有限次的測定中,兩種方法、兩個實驗室或兩個分析人員測定值是否存在顯著性差異,可以通過計算統計量t值,與相應的tα,f臨界值比較,即可做出判斷。
為了檢驗一個新的分析方法是否存在系統誤差,可以用已知含量的標準樣品進行對照分析,也可以應用國家規定的標準方法或應用經典的公認的測定方法進行對照實驗。如果兩者之間存在統計上的差異,就說明新方法有系統誤差;否則,說明新方法的誤差屬于偶然誤差或稱隨機誤差,新方法可靠。在實際工作中,如果測定數據精度高,兩個平均值相差又比較大,這種情況容易判斷。若有時兩組數據本身不很精密,但兩個平均值又相差不大,這種情況借助經驗是不易判斷的,借助于統計量t即可以解決。
(1)已知標準值的t檢驗。
如果已知標準值,或者由其他方法可以得到一個“真值”的結果,去檢驗一個新方法的平均值,這實際上是用標準試樣法檢驗樣本的平均值。標準樣品的值視為真值(μ),用新方法測定標樣n次,從樣本值計算平均值()和標準偏差(S),用t統計量式(1-18)來檢驗樣本
和標樣真值(μ)是否存在統計學上的差異。
t檢驗步驟如下:a.根據樣本值,計算平均值和標準偏差S;b.根據式(1-18)計算統計量t值;c.根據給定的顯著性水平α和測定次數n,查t分布表1-27,得到tα,f臨界值;d.比較計算的t值與tα,f臨界值的大小;e.
>tα,f為有顯著性差異,
<tα,f為無顯著性差異。
給定的顯著性水平α值為0.05和0.01兩個界限,作為t檢驗的兩個顯著性界限值,在統計中經常使用。
【例1-1】 用某種方法測定分析純氯化鈉中氯的百分含量。10次測定結果為60.64,60.63,60.67,60.66,60.70,60.71,60.75,60.70,60.61,60.70;并且已知“真值”為60.66%,問這種方法是否可靠?
解:根據樣本計算=60.68%,標準偏差S=0.044代入t公式中,則
查t分布表,當顯著性水平α為0.05時,自由度f=10-1=9時,查得t0.05(9)=2.26,由于t計算=1.43,t臨界值=2.26,1.43<2.26,判斷出樣本的平均值與“真值”含量之間沒有顯著性差異,故認為這種測定方法可靠。
(2)兩個平均值之間的t檢驗
判斷兩種方法,兩個實驗室,兩個分析人員測定值是否存在顯著性差異,使用的統計量為
(1-29)
(1-30)
式中,Sp為兩個樣本的組合偏差或稱合并標準差;、
分別為兩個樣本的各自平均值;x1i、x2i分別為每組數據的個別值;n1、n2分別為每組的測量次數。自由度f=n1+n2-2。
也可用下面形式的公式計算t。
(1-31)
(1-32)
式中,為合并樣本的方差;
、
分別為兩個樣本的方差。
【例1-2】 在一次實驗中,用等離子體-質譜法(ICP-MS)和火焰原子吸收法(FAAS),測定同一個土壤樣品的鋅含量(μg/g),兩組數據如下。
FAAS法:93.08,91.36,91.60,91.79,92.80,91.03,91.91
ICP-MS法:93.95,93.42,92.20,92.46,92.73,94.31,92.94,93.66,92.05
試用t檢驗法確定ICP-MS法是否存在系統誤差,
解:
查t分布表1-27,當顯著性水平α為0.05,f為14時t臨界值t0.05(14)=2.15,判斷出因為t計算=2.48,t0.05(14)=2.15,t計算>t臨界,所以兩者之間有顯著性差異,結果表示是兩種方法之間有顯著性差異,即ICP-MS法在這次測定中有系統誤差。
(3)具有多個試樣的t檢驗。
有時往往通過分析成分稍有變化的幾個不同試樣,與某種公認的方法相對照來試驗一個新方法,或者比較兩個實驗室采用相同方法對n個試樣測量結果的比較,常采用配對比較的方法,配對的特點就是數據要成對,配對試驗t檢驗法所用的統計量是
(1-33)
(1-34)
式中,是所有數據配對差的平均值;Sd為配對測定之差的標準偏差;Di是兩個實驗室(或兩種方法)對每個試樣測量結果的配對差(考慮正、負值)。
【例1-3】 利用氫化物發生-原子熒光光譜法測定土壤中砷的含量,來比較兩個實驗室的測定結果是否有顯著性差異(見表1-33)。
表1-33 配對數據

解:
=0.95
查t分布表1-27,當顯著性水平α為0.05,f=n-1=5時,;判斷,t計算=2.69,t臨界=2.57,t計算>t臨界,所以可以判斷兩個實驗室的測量結果存在著顯著性差異。
(4)t檢驗注意事項
t檢驗主要是以小樣本的資料為基礎,即在測定次數n較小的情況下使用,其前提是總體為正態分布,而且被比較各組的方差相同。在實際應用上是有偏差的,但兩樣本的方差不能相差太大,如果和
相差較大,則需要先檢驗兩組的方差的差別是否有顯著性,如差別有顯著性,需對t檢驗校正為t',來代替t檢驗。
兩樣本方差的差別是否有顯著性,如用統計是F檢驗
(1-35)
式中,、
分別為二樣本中較小方差和較大方差。計算F值,查F分布表,確定顯著性水平α兩樣本的自由度(n1-1,n2-1)時F臨界,比較F計算與F臨界的大小進行判斷,若F計算<F臨界,兩方差間無顯著性差異時,則t檢驗可以使用;若F計算>F臨界,兩方差有顯著性差異時,不能使用t檢驗,而用t'檢驗。t'統計量為:
(1-36)
式中,、
分別為兩樣本均數標準誤方差。
用下式計算近似的顯著臨界值:
(1-37)
(1-38)
然后將計算的t值與或
比較后進行判斷。
1.6.3 F檢驗法
方差檢驗中,兩個總體方差的檢驗即F檢驗,它的統計量見下式:
式中,、
分別為兩個樣本的方差,通常數值大的作分子,數值小的作分母;f1、f2分別為自由度,其中f1=n1-1,f2=n2-1。
F檢驗是用來檢驗兩個或兩個以上均數之間是否存在顯著性差異,即系統誤差。
F檢驗步驟如下。
(1)由樣本值x1,x2,…,xn;y1,y2,…,yn計算F值
(1-39)
(2)在給定的顯著性水平α和自由度f1、f2下查F分布表得到F的臨界值F(α,f1,f2)
(3)比較計算的F值和查表的臨界值F(α,f1,f2)的大小
若F計算>F臨界,表示兩個總體有顯著性差異;若F計算<F臨界,則無顯著性差異。
以上是兩個總體的方差檢驗,也就是兩個均數間的顯著性檢驗,可以用t檢驗,也可以用F檢驗。當檢驗兩個以上均數差別的顯著性時不能用t檢驗,只能用方差檢驗。
對于多個方差的檢驗,可用F檢驗法,檢驗一組方差中最大方差(S )和最小方差(S
)。如果兩者不存在顯著性差異,則處于兩者之間的方差也無顯著性差異,因此,可以認為整組方差來源于同一個總體。如果S
和S
之間有顯著性差異,則需要繼續地兩兩比較。