官术网_书友最值得收藏!

2.2 平均值一致性檢驗

2.2.1 概述

平均值一致性的檢驗是檢查分析結果的準確度,考察系統誤差對分析結果的影響。

分析測試中,測量值x是一個以概率取值的隨機變量,若x遵循正態分布Nμσ2),則n次測量的平均值遵循正態分布Nμσ2/n)。平均值是正態總體均值μ的無偏估計,若不同樣本來自同一總體,則不同樣本的平均值均為該總體均值μ的無偏估計值,都在總體均值μ附近波動。從統計上講,各樣本平均值的變動性都在其隨機誤差所允許的范圍內。反之,當各樣本平均值的變動性超過隨機誤差所允許的范圍,即平均值間出現了顯著性差異,說明它們之間除了隨機誤差外,還存在有明顯的系統誤差。因此,當樣本測量值計算的統計量落在統計上所允許的合理范圍內,就接受各平均值一致的假設;而當計算的統計量落在所允許的合理范圍外的拒絕域,則評定各平均值間存在顯著性差異。這就是平均值一致性檢驗的基本思想。

平均值一致性檢驗的基本步驟:

①根據所討論的問題做出檢驗的原假設H0和備擇假設H1,即確定檢驗的目標。

②根據所討論問題,計算或確定相應測量參數,如測量平均值、標準差、測量次數、自由度等。

③根據測量參數,計算相應的統計量。

④選擇顯著性水平α,確定統計檢驗的臨界值(單側或雙側),即確定統計量分布拒絕域的界限。

⑤比較統計量和臨界值,若統計量大于相應臨界值,統計量落入拒絕域,則在顯著性水平α下拒絕原假設H0,接受備擇假設H1;若統計量小于相應的臨界值,則在顯著性水平α下接受原假設H0

需要注意的是,平均值一致性檢驗的前提是被檢驗測量值間的方差是一致的。平均值一致性檢驗以隨機誤差作為比較標準,若被檢驗測量值間的方差有顯著性差異,隨機誤差過大,可能出現隨機誤差掩蓋系統誤差的情況,使檢驗的靈敏度降低,即降低一致性檢驗的功效。因此,有必要在平均值一致性檢驗前,先進行方差的齊性檢驗,在方差一致的基礎上再進行平均值一致性檢驗。

分析測試中隨機誤差的分布遵循正態分布或近似正態分布,可用正態分布的概率密度函數來描述大樣本測定的誤差分布。算術平均值遵循正態分布Nμσ2/n),或遵循標準正態分布N(0,1),由此可估計期望值μ落在某一區間的概率,或反過來可以在一定的概率下估計μ的區間大小。但是,通常分析測試都是小樣本試驗,小樣本試驗不能求得總體均值μ和總體標準差σ,而只能求得樣本的均值和樣本標準差s,如果直接用小樣本測量得到的標準差s代替σ進行μ的區間估計,偏差較大。因此,不適合用正態分布來處理小樣本的試驗數據,需要采用類似于正態分布的t分布來處理,可得到較為可靠的μ區間估計。

平均值一致性檢驗中,有兩種情況,一是正態總體的方差(σ2)已知,檢驗其平均值的一致性,稱為u檢驗;二是在方差(σ2)未知且為小樣本測定時,平均值遵循t分布,稱為t檢驗。

分析測試中多為小樣本測定,應用較多的是t檢驗。因此,在進行t檢驗前,有必要了解在正態分布情況下的t分布。

2.2.2 t分布

t分布是正態分布派生出來一個分布。

x1x2、…、xn是正態分布N(0,1)總體中的隨機樣本值,則統計量:

  (2-8)

遵循自由度ν=n-1的t分布,式中,是樣本的算術平均值;s是樣本的標準差。

t分布的概率密度函數為:

  (2-9)

  (2-10)

式中,Γ(ν)是伽馬函數。t分布密度函數只取決于自由度ν和統計量t值,統計量t服從自由度νt分布。圖2-3給出了不同自由度的t分布概率密度曲線。

圖2-3 不同自由度的t分布概率密度曲線

注: 伽馬函數,是常用函數值;當n為自然數時,Γ(n)=(n-1)!,如Γ(2)=1,Γ(3)=2,Γ(4)=6,Γ(5)=24,Γ(6)=120,…;Γ函數具有遞推性質:,如Γ,由此

分別來自正態分布Nμ1σ2/n1)與Nμ2σ2/n2),則遵循正態分布遵循標準正態分布N(0,1),則統計量:

  (2-11)

遵循自由度ν=n1+n2-2的t分布,式中,n1n2分別為的測量次數;為合并樣本標準差

  (2-12)

從以上論述可知,t分布有以下幾個特點:

①對稱性,t分布概率密度曲線以t=0為中心,左右兩側對稱,t=0時,曲線峰值最高,分布密度最大。

t分布概率密度曲線與自由度ν有關,ν愈小,t值愈分散,曲線兩側尾部更為伸展。t分布表示的是一簇不同ν值的曲線,在處有拐點。

t分布密度曲線都保持了正態分布曲線的形狀,當自由度ν逐漸增大,t分布曲線逐漸逼近于標準正態分布。當ν大于20時,t分布曲線與正態分布曲線十分近似,當ν→∞,t分布趨近于正態分布N(0,1)。而ν愈小,t分布與正態分布相差愈大。

t分布曲線下的總面積為1。自由度為νt分布,其離散度愈大,曲線兩端與t坐標軸接近愈慢,因而達到一定顯著性水平所需的t值愈大。因此,設定了顯著性水平,可確定相應自由度νt分布概率分布值。

由于概率密度曲線的對稱性,

表2-8分別給出了單側和雙側的t分布值。對同一顯著性水平,雙側的tα值等于單側的tα/2值。在用其概率分布進行平均值的一致性檢驗時,首先要確定的是采用單側檢驗還是雙側檢驗,并使用相應的t分布值。

隨機變量t出現在某一區間(tα/2t1-α/2)的概率

   Ptα/2<t<t1-α/2)=1-α

圖2-4給出了概率分布示意,概率P可由t分布表查出。例如,P=0.05,ν=10,由t分布表(表2-8)查得t=2.228,即>2.228的概率為5%,<2.228的概率為95%,即

圖2-4 t分布概率示意圖

由表2-8可以看出,當自由度ν較小時,t分布與正態分布相差較大。例如,當α=0.05時:ν=5,t=2.571;ν=20,t=2.086;ν=50,t=2.009;ν=200,t=1.972,與正態分布u0.05=1.960漸近。當ν→∞,t=1.96,這時t分布與正態分布是一致的。

表2-8 t分布表

2.2.3 u檢驗

在一些情況下,總體方差可以認為是已知的。例如,在生產穩定的情況下,產品質量在一定范圍內波動。日常分析測試中,測量值的變動性穩定在一個水平。在這種正常的生產或測試中,都可以用歷史的數據求得產品質量變動性的標準差σ,或測量值變動性的標準差σ。這樣,可以用標準差σ來檢查產品質量的波動,或檢驗測量值的變動性。在這種情況下,對總體均值的各種假設都可以用服從正態分布的Nμσ2)來檢驗,稱為u檢驗。

2.2.3.1 已知一正態總體的和均值μ0,檢驗待檢樣本的均值是否與原均值μ0一致

計算待檢樣本的均值,計算統計量u

  (2-13)

取顯著性水平α,采用雙側檢驗,查正態分布表uα/2,當u<uα/2,表示檢驗待檢樣本的均值μ0無顯著性差異。需注意的是,由于可能比μ0偏高或偏低,采用雙側檢驗,一側的顯著性水平為α/2。

同樣,如果已知一正態總體的方差和均值μ0,檢驗待檢樣本的均值是否顯著大于(或顯著小于)原均值μ0,亦可按式(2-13)計算統計量u,并與uα比較,注意此時是單側檢驗。

2.2.3.2 已知兩個正態總體方差相等并已知,檢驗兩個正態總體的均值是否一致

計算待檢樣本的均值和原樣本均值,計算統計量u

  (2-14)

α=0.05,查正態分布表,當ν→∞時,uα/2=1.96,若u<uα/2,表示檢驗待檢樣本的均值與原樣本均值無顯著性差異。

同樣,用計算統計量u,可檢驗一個正態總體的均值是否大于(或小于)另一個正態總體的均值,此時是單側檢驗。

在分析實踐中往往是小樣本測試,而采用標準物質的認定值亦是通過有限次測量確定的,其量值本身存在不確定度。因此,在分析測試中更多的是應用t檢驗進行測量值之間的比較和判斷。

2.2.4 t檢驗

分析測試中大致有三種t檢驗情況,一是測量平均值與給定值比較;二是兩個測量平均值的比較;三是比對試驗中兩組測量值的比較。

2.2.4.1 平均值與給定值的比較

樣本測量次數n,計算其均值、標準差s和統計量t

  (2-15)

取顯著性水平α,自由度ν=n-1,本情況為雙側檢驗,在t分布表查雙側檢驗臨界值,若,則認為μ0有顯著性差異。

在上述情況下,如果檢驗一個正態總體的均值是否不大于(或不小于)原正態總體的均值,取顯著性水平α,此時是單側檢驗,在t分布表查單側檢驗臨界值tαν,若ttαν,則不大于(或不小于)μ0;若,則大于(或小于)μ0

【例2-5】 用原子吸收光譜法測定某鐵礦石標準物質中的錳含量,5次測量值分別為0.258%、0.263%、0.272%、0.266%和0.264%,錳含量的認定值是0.260%,問測量值是否顯著大于認定值。

 計算測量值的平均值,標準差s=0.00508%,n=5,計算統計量

本例是單側檢驗,取α=0.05,t0.05,4=2.13,tt0.05,4,原子吸收光譜法測量值不大于認定值,分析結果與認定值無顯著系統誤差。

分析測試中往往對標準物質進行多次測量,以檢查測量結果的準確度,并評價方法的可靠性。但是,標準物質的認定值μ0本身是一個真值的最佳估計值,其置信區間為s0為定值的標準差,N為定值的數據組數,為認定值的標準不確定度,通常s0N在標準物質證書中都可以查到。嚴格而言,進行t檢驗時,還要考慮標準物質認定值的標準不確定度,則其統計量:

  (2-16)

式中,sn次測量結果的標準差。注意,此時的自由度要同時考慮標準物質的定值數據數,ν=n+N-2,統計量t與臨界值tα,(n+N-2)比較。

上例中,已知錳含量的定值標準差為0.004%,定值數據組數為8,則:

自由度ν=8+5-2=11,單側檢驗,t0.05,11=1.80,統計量小于臨界值,標準物質的測量結果不大于認定值,兩者無顯著系統誤差。

2.2.4.2 平均值的置信區間

根據統計量t的計算式,可改寫為:

  (2-17)

表示,真值μ0落在間的概率為1-α,即

隨機區間稱為μ0的置信區間,稱為置信限,稱為誤差限,又稱估計精度,(1-α)×100%稱為置信度。

置信區間隨不同置信度而不同。對同一測量結果,置信度愈大,置信區間愈寬。對同一置信度的兩個測量結果,置信區間愈小,表示測量結果精密度愈高(結果亦可能較正確)。對不同置信度的兩個測量結果,應先將其換算成相同置信度下的誤差限,再比較誤差限的大小,并對兩個結果進行判斷。

【例2-6】 有十個實驗室參與某不銹鋼標準物質中鉻的定值分析,各實驗室測定鉻量的平均值分別為:11.324%、11.342%、11.360%、11.378%、11.392%、11.403%、11.408%、11.415%、11.436%、11.465%,計算鉻量認定值的置信區間。

 計算實驗室間測量值的平均值=11.3923%,標準差s=0.0428%,n=10,ν=9,

取顯著性水平0.05,即置信度95%,t0.05,9=2.26(雙側),則標準物質中鉻含量的置信區間為:

可以認為該不銹鋼標準物質中鉻的認定值為11.39%,認定值的置信區間為11.36%~11.42%,有95%的把握認為鉻的真值落在11.36%~11.42%間。

注:在計算置信區間前,應先對各測量值進行統計檢驗,在無異常值或剔除異常值后再計算置信區間。

2.2.4.3 兩個正態總體均值的一致性檢驗

兩樣本的測量次數分別為n1n2,計算兩待檢樣本的均值和標準差s1s2,計算統計量:

  (2-18)

n1=n2=n,簡化為:

  (2-19)

取顯著性水平α,自由度ν=n1+n2-2,本情況為雙側檢驗,在t分布表查雙側檢驗臨界值tαν,比較ttαν,若t>tαν,則有顯著性差異。

在上述情況下,如果檢驗一個正態總體的均值()是否不大于(或不小于)另一個正態總體的均值(),此時是單側檢驗,在t分布表查單側檢驗臨界值tαν,比較ttαν,若ttαν,則不大于(或不小于);若t>tαν,則大于(或小于)

在小樣本均值進行比較時,要求兩個樣本的總體方差相同。因此,在進行t檢驗前,應首先檢驗兩樣本的方差是否有顯著性差異,即進行方差齊性檢驗(見2.3.4)。

【例2-7】 某制藥廠生產一種降壓新藥,為試驗降壓的療效,在血壓偏高的人群中隨機抽取20人進行療效試驗。在用藥前十天,連續測量其血壓,用藥一星期后,再連續測量十天,20人的血壓平均值分別為(單位為mmHg):

用藥前:165、150、162、158、148、160、145、148、155、160、155、145、162、140、152、162、145、148、162、155。

用藥后:155、148、160、150、145、152、142、140、145、150、150、145、155、138、150、145、140、145、150、148。

問該新藥對降血壓是否有顯著療效?

 按題意計算用藥前和用藥后血壓的平均值和標準差,得

用藥前:

用藥后:

經方差檢驗,兩標準差無顯著性差異,計算統計量:

取顯著性水平α=0.05,本例是單側檢驗,t0.05,38=1.68,t>t0.05,38,表明新藥對降血壓有顯著的療效。

注:本例也可采用2.2.4.4比對試驗方法進行檢驗(每一人用藥前后的血壓值為一對),結果亦表明新藥對降血壓有顯著的療效。

【例2-8】 今采用新工藝生產一批純鐵,用于紅外法測定碳、硫的助熔劑,并與原產品進行比較。在相同條件下測定新、老兩產品中碳、硫含量,測量結果如下:

碳分析結果,新產品:8μg/g、12μg/g、10μg/g、10μg/g、11μg/g、8μg/g、9μg/g、10μg/g

      原產品:13μg/g、16μg/g、14μg/g、13μg/g、12μg/g、9μg/g、10μg/g、13 μg/g

硫分析結果,新產品:8μg/g、11μg/g、8μg/g、9μg/g、6μg/g、8μg/g、10μg/g、7 μg/g

      原產品:10μg/g、11μg/g、9μg/g、7μg/g、13μg/g、8μg/g、12μg/g、8 μg/g

問新工藝生產純鐵的碳、硫含量是否顯著低于原產品。

 計算新產品和原產品的各測量值參數。

碳,新產品:

  原產品:

硫,新產品:

  原產品:

碳、硫測定中,

α=0.05,按題意是單側檢驗,t0.05,14=1.76,tC>t0.05,14,而tS<t0.05,14。由此,按新工藝生產的純鐵中碳含量顯著低于原產品,而硫含量雖比原產品低,但在統計上無顯著性差異。

2.2.4.4 比對試驗的t檢驗

分析測試中,通常以t檢驗對由同一方法得到的兩組測量數據進行比較(或與認定值比較),或用不同方法對同一樣品測試結果進行比較。有時試驗樣品量不多(不能進多次重復測量),上述t檢驗方法難以進行,這時可采用比對試驗進行t檢驗。

例如,采用兩種不同的分析方法對若干同品種的不同樣品進行比對試驗,比較兩種分析方法的測量結果是否有顯著性差異。設采用甲、乙兩種方法對若干樣品進行比對試驗,測量結果如表2-9所示。

表2-9 比對試驗測量結果

試驗中影響測量結果的變動性的有兩個因素,一是分析方法,二是樣品,兩因素交織在一起,不能采用上述t檢驗方法統計。在比對試驗中,每一對樣品是相同的,即排除了樣品變動性的因素,測量結果的變動性只反映兩分析方法間的差異。顯然,如果兩分析方法間無系統誤差,當測定無限多次時,兩分析方法間差值的平均值應為0,而在有限次測定中,兩分析方法間差值的平均值雖不一定為0,但與0之間應無顯著性差異。因此,比對試驗就是檢驗與0之間是否有顯著性差異。

①計算各對測量值的差值di,和差值di的平均值

②計算差值di的標準差sd和平均值的標準差

  (2-20)

  (2-21)

③計算統計量t

  (2-22)

式中,d0是零或給定值。

④取顯著性水平α,自由度ν=n-1,比較ttαν,如t>tαν,認為甲、乙兩種方法的測量結果存在顯著性差異。

【例2-9】 某實驗室試驗用三氯化鈦還原的無汞鹽滴定法欲代替經典的二氯化錫還原汞鹽滴定法測定鐵礦石中全鐵,為此選取11個鐵礦石樣品,用兩方法進行比對分析,測試結果如表2-10所示,試評價兩種分析方法測量結果是否有顯著性差異。

表2-10 兩方法測定鐵礦石分析結果的比對

 從表列數據,按比對試驗進行t檢驗,計算差值d的平均值,計算差值di的標準差sd=0.0883%,差值平均值的標準差

計算統計量

α=0.05,按題意,本例是雙側檢驗,t0.05,10=2.23,t<t0.05,10,檢驗結果表明,兩種分析方法的測量結果無顯著性差異。在分析中可以用無汞鹽的三氯化鈦還原滴定法測定鐵礦石的全鐵。從表列數據看,雖然無汞鹽法測量結果比汞鹽法平均偏高0.0336%,但由于分析方法本身的隨機誤差,從統計上并沒有表示兩者有顯著性差別。

如果不采用比對試驗的t檢驗方法,而用無汞鹽法的11個數據和汞鹽法的11個數據,分兩組進行統計比較,在數學上也可以計算其統計量。但是,由于樣本不同,每組統計的標準差包括了樣本的變動性,而且樣本本身的變動性遠大于方法的變動性,大大降低了檢驗的靈敏度。在這種情況下,采用比對t檢驗方法,以排除樣本變動性的影響。如果采用一個相同的樣本,對兩組的測量數據可以用上述2.2.4.3的方法進行檢驗。

因此,當所研究的因素的效應比其他因素的效應大得多時,或者其他效應可嚴格控制時,可采用分組試驗進行檢驗;而當其他因素的效應大于所研究的效應時,采用分組試驗是不合適的,應采用比對試驗的檢驗方法。

主站蜘蛛池模板: 荃湾区| 即墨市| 英吉沙县| 长治县| 六盘水市| 彰化市| 宁晋县| 巨鹿县| 松阳县| 尤溪县| 乐业县| 江源县| 潼关县| 古交市| 延川县| 宜城市| 陆河县| 桃园市| 青海省| 如东县| 新安县| 噶尔县| 台北市| 濮阳市| 松江区| 怀远县| 鸡西市| 淮南市| 福贡县| 靖江市| 全州县| 垫江县| 北碚区| 西华县| 沾益县| 洞头县| 新龙县| 平顺县| 沈阳市| 郎溪县| 汝南县|