官术网_书友最值得收藏!

1.4 正態(tài)分布的數(shù)字特征

隨機(jī)變量的正態(tài)分布及其概率密度中的兩個基本參數(shù)是均值μ和方差σ2,分別表示正態(tài)分布的中心位置和正態(tài)分布概率密度的形狀,或者說表示測量值的集中趨勢和其離散程度。確定了測量結(jié)果的μσ2,就可以了解總體分布并估計測量值落在某一區(qū)間的概率。因此,在分析測試中可以用μσ2來描述隨機(jī)變量分布的特征。

在實際測試中,只是對樣本進(jìn)行有限次的測量,不能得到μσ2。以下將討論如何用樣本均值和樣本方差s2來合理估計總體均值μ和總體方差σ2

1.4.1 數(shù)據(jù)集中位置的特征數(shù)

(1)平均值 設(shè)對同一量進(jìn)行n次獨立測量,測量值分別為x1x2、…、xn,測量中無系統(tǒng)誤差,則各隨機(jī)誤差可分別表示為:

……

由此,

由隨機(jī)誤差的抵償性,當(dāng)測量次數(shù)n無限增多時,δi→0,則

  (1-16)

式(1-16)表明,在消除系統(tǒng)誤差后,多次測量的平均值趨向于被測量的真值,是其真值的無偏估計,這就是平均值的原理。

從正態(tài)分布圖形可以看出,正態(tài)分布的密度函數(shù)曲線對于μ是對稱的,各測定值對μ的偏差有正有負(fù),而正、負(fù)偏差出現(xiàn)的機(jī)會相等,當(dāng)計算算術(shù)平均值后,一部分正、負(fù)誤差相抵消,因此用算術(shù)平均值x來估計μ值,其偏差最小,是最可信賴的值。

另外從測量值的概率分布也可導(dǎo)出平均值的最佳估計值。設(shè)一組等精度的測量(x1x2、…、xn)服從正態(tài)分布,則xi出現(xiàn)的概率為:

由于它們是獨立測量所得的值,這些測量值同時出現(xiàn)的概率為:

從統(tǒng)計學(xué)觀點看,一組數(shù)據(jù)的最佳估計值μ應(yīng)該是x出現(xiàn)概率最大的值。為使P最大,應(yīng)當(dāng)使指數(shù)項為最小,即

展開得:

  (1-17)

由此,一組數(shù)據(jù)的算術(shù)平均值是總體均值μ的無偏估計值。所謂無偏估計,是表示計算的算術(shù)平均值消除了測量的隨機(jī)誤差(但不是全部),其的殘差平方和最小,與總體均值μ十分接近(但不是沒有偏離,而是偏離最小)。

計算算術(shù)平均值時,以下幾種變換方式對計算是有用的:

①若對xi作變換,yi=xi+c,其中c是常數(shù),

則:

②若對xi作變換,yi=cxi,其中c是不為零的常數(shù),

則:

③若對xi作變換,,其中ab是不為零的常數(shù),

則:

(2)加權(quán)平均值 在實際測量中,不可能都在同一條件下進(jìn)行多次重復(fù)測量,或采用不同分析方法進(jìn)行測量,或在實驗室間采用不同(或相同)分析方法測量,各測量結(jié)果的精密度亦不可能一致。對這種不等精度的測量,在計算最終測量結(jié)果時,要考慮測量精密度對測量結(jié)果的影響。

在不等精度的測量中,由于精密度高的測量數(shù)據(jù)更為可靠,而精密度差的數(shù)據(jù)可靠性相對較差,在計算時將精密度高的數(shù)據(jù)賦予較大的支配權(quán),而精密度差的數(shù)據(jù)減小它的影響力,加權(quán)平均值是被測量的最佳估計值,它滿足最小二乘法原理。

設(shè)m組測量結(jié)果各自的平均值分別為、…、;測量次數(shù)分別為n1n2、…、nm;測量標(biāo)準(zhǔn)差分別為s1s2、…sm、。令wii測量結(jié)果的權(quán),,則最終測量結(jié)果的加權(quán)平均值為:

  (1-18)

加權(quán)平均值的標(biāo)準(zhǔn)差為:

  (1-19)

加權(quán)平均值具有以下特征:

①在不等精度測量中,加權(quán)平均值是出現(xiàn)概率最大的值。

②在不等精度測量中,加權(quán)平均值是總體均值μ的無偏估計。而在等精度測量中各測量值的權(quán)相同,w1=w2=…=wm,則加權(quán)平均值等于算術(shù)平均值。等精度測量只是不等精度測量的一種特例。

③在實際測試工作中,同一人在重復(fù)性條件下進(jìn)行多次測量,可以看作是等精度測量。不同實驗室在再現(xiàn)性條件下進(jìn)行測量,屬于不等精度測量,可采用加權(quán)平均值報告測量結(jié)果。

但是,如果再現(xiàn)性條件下各測量結(jié)果的精密度在統(tǒng)計上沒有顯示有顯著性差異,可認(rèn)為是等精度測量,通常還是以算術(shù)平均值計算其測量結(jié)果。

【例1-3】 某實驗室分別用ICP-AES、AAS和光度法測定某低合金鋼中的鎳含量,分別各進(jìn)行15次、10次、8次測量,測量結(jié)果分別為0.885%、0.877%和0.891%,其標(biāo)準(zhǔn)差分別為0.008%、0.021%和0.010%,計算鎳含量的測量值。

 由于各測量方法對鎳的測量是不等精度的,以其測量精度的方差為權(quán)進(jìn)行計算,于是

如果直接計算三個方法鎳含量的算術(shù)平均值,則=0.884%。在加權(quán)平均值中考慮了分析結(jié)果精密度的因素,對分析結(jié)果精密度高的值,給予較大的權(quán),其計算結(jié)果更傾向于精密度高的測量結(jié)果。

注:計算時,先對三組測量結(jié)果用柯克倫法檢驗其精密度一致性(見第2章2.3.5.1)。

(3) 中位值M 當(dāng)一組測量值不服從正態(tài)分布或只是近似正態(tài)分布時(存在偏峰或雙峰,對偏態(tài)分布或分布末端無確定數(shù)據(jù)資料情況,或測量數(shù)據(jù)分布情況不明),可用中位值來表示測量的最佳估計值。中位值又稱中位數(shù)。

將一組測量值按由小到大的順序排列,當(dāng)測量數(shù)是奇數(shù)時,位于中間位置的測量值為中位值,當(dāng)測量數(shù)是偶數(shù)時,位于中間相鄰兩位置測量值的平均值為中位值。

中位值估計不受特別大或特別小的值的影響,只受居中測量值波動的影響。當(dāng)測量值波動大時,中位值是比平均值更穩(wěn)健的統(tǒng)計量。例如,工資的抽樣調(diào)查,人群的工資分布往往是不對稱分布,低工資和較低工資的人群較集中,高工資人群雖少但工資高,區(qū)間跨度很大,通常用中位值來表示工資的集中趨勢,可認(rèn)為有一半人群的工資低于中位值工資。而當(dāng)用平均值表示時,將有一半多人的工資達(dá)不到平均工資。又如表1-1中分析者E的試驗數(shù)據(jù),由于其極大值(1.91%)偏離其他數(shù)據(jù)的分布,用中位值(1.82%)表示均值比用其平均值(1.83%)更能恰當(dāng)?shù)胤从硵?shù)據(jù)的集中趨勢。醫(yī)學(xué)上的體征指標(biāo)、傳染病的潛伏期等常用中位值表示其集中趨勢。實驗室間能力驗證的數(shù)據(jù)處理中,為避免極端值對統(tǒng)計結(jié)果的影響,多采用以中位值表征測量結(jié)果集中趨勢,以標(biāo)準(zhǔn)化四分位距表征分散性的穩(wěn)健統(tǒng)計方法。

對于遵循正態(tài)分布(對稱分布)的測試數(shù)據(jù),中位值與算術(shù)平均值是十分接近的。而數(shù)據(jù)分布偏峰愈嚴(yán)重,則其算術(shù)平均值和中位值相差愈大。

另外,對于一組測量值,還有用眾數(shù)、均方根平均值、幾何平均值、調(diào)和平均數(shù)來表示一組數(shù)據(jù)集中位置的特征數(shù),但在分析測試中不常用。

(4)眾數(shù)M0 在總體分布中,出現(xiàn)頻數(shù)最大的測量值,稱為眾數(shù)。在直方圖中,有時可能出現(xiàn)一個以上的眾數(shù)。

(5)均方根平均值u

  (1-20)

(6)幾何平均值G

  (1-21)

(7)調(diào)和平均值H

  (1-22)

按數(shù)理統(tǒng)計理論,由于受隨機(jī)誤差的影響,分析測量結(jié)果一般服從(或近似服從)正態(tài)分布,其算術(shù)平均值是測量結(jié)果的最佳估計值。

1.4.2 數(shù)據(jù)離散度的特征數(shù)

測量結(jié)果的離散度與其測量條件密切相關(guān)。在分析測試中通常用重復(fù)性和再現(xiàn)性來表示不同條件下的測量結(jié)果的精密度。

重復(fù)性和再現(xiàn)性是表征在兩種極端條件下測量結(jié)果的精密度。當(dāng)然,很多測試是在這兩種實驗條件的中間條件下進(jìn)行的,當(dāng)表達(dá)精密度時應(yīng)說明其測試的測量條件。通常將重復(fù)性和再現(xiàn)性表示為實驗室內(nèi)精密度和實驗室間精密度。

分析測試中精密度通常用以下幾種統(tǒng)計量表示:

(1)平均偏差和相對平均偏差 用同一方法對同一樣品進(jìn)行n次測定,測量值分別為x1x2、…、xn,測量值的平均值為,則平均偏差表示為各測量值與平均值偏差di的絕對值的平均值:

  (1-23)

某個測量值的偏差有正負(fù)號,但平均偏差不計正負(fù)號。用平均偏差表示精密度的方法簡單,但對大誤差的出現(xiàn)不敏感,數(shù)據(jù)處理中很少應(yīng)用。

(2)標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)偏差)和相對標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)差可以用多種方法計算,分析測試中最常用的是貝塞爾計算法。

①貝塞爾(Bessel)法。在正態(tài)分布情況下,總體的標(biāo)準(zhǔn)差表示為:

  (1-24)

式中,μ是被測量的真值,由于一般μ未知,無法求得總體標(biāo)準(zhǔn)差。

實際測量中測量次數(shù)是有限的,通常用樣本單次測量的標(biāo)準(zhǔn)偏差s表示σ的估計量。

設(shè)x1x2、…、xn是總體x的樣本,則樣本的標(biāo)準(zhǔn)差s可表示為:

  (1-25)

與此相對應(yīng)的樣本方差為:

  (1-26)

可以證明,s2是總體方差σ2的無偏估計量。在σ2的無偏估計量中,s2是最佳估計值。

將式(1-25)分子的平方項展開,可得

于是

  (1-27)

式(1-25)和式(1-27)通常稱為計算標(biāo)準(zhǔn)差的貝塞爾公式。

為了計算上的方便,經(jīng)變換式(1-27)也可表示為:

  (1-28)

【例1-4】 分析某保護(hù)渣中的二氧化硅,5次測量結(jié)果分別為31.2%、31.4%、31.9%、31.5%和31.6%,計算測量結(jié)果的標(biāo)準(zhǔn)差。

 計算得=31.5%,設(shè)a=31.5%,測量結(jié)果分別變換成-0.3%、-0.1%、0.4%、0.0%和0.1%,用變換公式(1-28)計算:

表1-6給出了隨機(jī)變量x的總體特征量和樣本估計量。

表1-6 隨機(jī)變量的總體特征量和樣本估計量

②合并樣本標(biāo)準(zhǔn)差。為提高測量的可靠性,有時對同一樣品同時進(jìn)行多組測量,計算合并樣本標(biāo)準(zhǔn)差。

設(shè)m個分析人員或?qū)嶒炇覍ν粯悠愤M(jìn)行m組測量,其結(jié)果分別為:

x11x12、…、x1n1,單次測量標(biāo)準(zhǔn)差s1,測量次數(shù)n1,平均值

x21x22、…、x2n2,單次測量標(biāo)準(zhǔn)差s2,測量次數(shù)n2,平均值

……

xm1xm2、…、xmnm,單次測量標(biāo)準(zhǔn)差sm,測量次數(shù)nm,平均值

則合并樣本標(biāo)準(zhǔn)差:

  (1-29)

其自由度為

當(dāng)每一組測量次數(shù)ni均為n時,

  (1-30)

其自由度ν=mn-1)。需注意的是,各測量列的標(biāo)準(zhǔn)差si不應(yīng)有顯著性差異(在統(tǒng)計上可以用柯克倫法檢驗各si的一致性)。

可以估計到,計算的合并樣本標(biāo)準(zhǔn)差在樣本的最小標(biāo)準(zhǔn)差和最大標(biāo)準(zhǔn)差之間。

合并樣本標(biāo)準(zhǔn)差的計算實質(zhì)上同屬于貝塞爾法。

合并樣本標(biāo)準(zhǔn)差可以統(tǒng)計一個實驗室數(shù)個分析人員的測試精密度,也可以統(tǒng)計多個實驗室的測試精密度,或利用實驗室歷次在重復(fù)性條件下的測量數(shù)據(jù)的測試精密度。在分析方法精密度協(xié)同試驗中采用合并樣本標(biāo)準(zhǔn)差計算實驗室內(nèi)的重復(fù)性標(biāo)準(zhǔn)差。

【例1-5】 有五個實驗室用ICP-AES法分析同一鋼樣中的鎳,每個實驗室獨立分析五次,測量結(jié)果見表1-7,計算測量結(jié)果的標(biāo)準(zhǔn)差。

表1-7 各實驗室測量鋼中鎳的結(jié)果

 首先求各實驗室測量的平均值和標(biāo)準(zhǔn)差si,一并列于表1-7,又各實驗室測量次數(shù)相同,n=5,計算合并樣本標(biāo)準(zhǔn)差:

圖1-7 平均值標(biāo)準(zhǔn)差與測量次數(shù)n的關(guān)系

③平均值的標(biāo)準(zhǔn)差。對于一組等精度的測量,其平均值為:

單次測量的標(biāo)準(zhǔn)差為σ,根據(jù)誤差的傳播定律:

在有限次測量情況下,以表示樣本平均值的標(biāo)準(zhǔn)差,則

  (1-31)

表1-8列出了不同測量次數(shù)的單次測量標(biāo)準(zhǔn)差與平均值標(biāo)準(zhǔn)差的關(guān)系。數(shù)據(jù)表明,雖然不同次數(shù)(n)測量得到的平均值()和標(biāo)準(zhǔn)差(s)都相同,而且測量結(jié)果的極差(R)也隨測量次數(shù)增加而增加,但平均值的標(biāo)準(zhǔn)差()卻隨之減小,測量的可靠性增加。計算表明,單次測量標(biāo)準(zhǔn)差不變時,平均值標(biāo)準(zhǔn)差與測量次數(shù)成反比。隨著測量次數(shù)的增加,一部分正、負(fù)隨機(jī)誤差相抵消,平均值的標(biāo)準(zhǔn)差減小,見圖1-7。但是,當(dāng)測量次數(shù)n>5時,平均值標(biāo)準(zhǔn)差減小較慢;n>10時,減小很慢。因此,不能僅用增加測量次數(shù)(同時增加測量成本)來提高測量精度,而應(yīng)輔以其他的改進(jìn)措施。當(dāng)n→∞,→0時,表示無數(shù)次測量的隨機(jī)誤差趨于零。

表1-8 單次測量標(biāo)準(zhǔn)差與平均值標(biāo)準(zhǔn)差的關(guān)系實例

在測量不確定度評定中,以平均值的標(biāo)準(zhǔn)差表示測量重復(fù)性的不確定度分量。

n個測量結(jié)果中取其中m個測量值,其平均值為,其平均值的標(biāo)準(zhǔn)差為:

  (1-32)

標(biāo)準(zhǔn)差還可以用以下幾種方法進(jìn)行近似計算。

④極差法。在重復(fù)性條件下,用測量結(jié)果的極差Rxmax-xmin)計算單次測量的標(biāo)準(zhǔn)差:

  (1-33)

極差法的極差系數(shù)C和自由度ν見表1-9。在n<25條件下,C。由于極差法計算時只用到兩個極值,可靠性不及貝塞爾法,通常在n=4~9時使用。

表1-9 極差系數(shù)C及自由度ν

根據(jù)例1-4的測量數(shù)據(jù),C=2.33,計算得

⑤最大偏差法。在重復(fù)性條件下對同一樣品進(jìn)行n次測定,計算其平均值,計算最大偏差的絕對值,則單次測定的標(biāo)準(zhǔn)差可由下式計算:

  (1-34)

式中,1/k'n是與測量次數(shù)有關(guān)的因素,見表1-10。

表1-10 最大偏差法因素

由例1-4測量數(shù)據(jù),平均值=31.5,最大值31.9,最大偏差=31.5-31.9=0.4,n=5,1/k'n=0.74,得s=0.4×0.74=0.30。

極差法和最大偏差法的計算比貝塞爾法方便,不用對諸多數(shù)據(jù)平方和開方。但是貝塞爾法利用了所有測量數(shù)據(jù)的信息,而且對測量值中較大的誤差比較敏感,計算的標(biāo)準(zhǔn)差的可靠性高。

⑥彼得斯(Peters)法。彼得斯法用各測量值偏差絕對值之和計算標(biāo)準(zhǔn)差:

  (1-35)

彼得斯計算法中反映了各測量值xi的信息,計算值有較高的可信度。

由例1-4,按彼得斯法計算得:

于是

此外,在眾多測量數(shù)據(jù)的計算中,為消除極端值對統(tǒng)計結(jié)果的影響,可采用穩(wěn)健統(tǒng)計方法,例如,用中位值、切尾平均值、文瑟平均值來表征測量數(shù)據(jù)的集中趨勢,用標(biāo)準(zhǔn)化四分位距、中位絕對偏差法表征測量數(shù)據(jù)的分散性。關(guān)于穩(wěn)健統(tǒng)計方法詳見第7章相關(guān)內(nèi)容。

⑦相對標(biāo)準(zhǔn)差。以標(biāo)準(zhǔn)差的相對百分?jǐn)?shù)表示,稱相對標(biāo)準(zhǔn)差,通常用RSD表示:

  (1-36)

相對標(biāo)準(zhǔn)差無量綱,用百分?jǐn)?shù)(%)表示,但實際表達(dá)時通常省去%符號。相對標(biāo)準(zhǔn)差亦稱變異系數(shù)(CV)。通常情況下,測量值的標(biāo)準(zhǔn)差隨其量值的增加而增加,而其相對標(biāo)準(zhǔn)差隨之減小。

(3) 標(biāo)準(zhǔn)差的可靠性 標(biāo)準(zhǔn)差s是總體標(biāo)準(zhǔn)差σ的一個估計值,由一系列測量值計算而得到,是一個隨機(jī)變量,有一定的變動性。度量標(biāo)準(zhǔn)差變動性的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差,表示標(biāo)準(zhǔn)差的精度。

標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差與測量次數(shù)有關(guān),經(jīng)推導(dǎo)得:

  (1-37)

在有限次的測定中:

  (1-38)

這種變動性隨測量次數(shù)的增加而減小,標(biāo)準(zhǔn)差s更可靠。對樣本標(biāo)準(zhǔn)差s的相對精密度可表示為:

  (1-39)

當(dāng)n=51時,可計算得:

結(jié)果表示,其時標(biāo)準(zhǔn)差的十位數(shù)已不確定了。通常在有限次的測量中,標(biāo)準(zhǔn)差取兩位有效數(shù)字已足夠了。表1-11表示了不同測量次數(shù)標(biāo)準(zhǔn)差的精度,即標(biāo)準(zhǔn)差的不可靠程度。

表1-11 標(biāo)準(zhǔn)差的不可靠程度

(4)或然誤差 或然誤差ρ指在一組測量值的誤差中,落在-ρ和+ρ范圍內(nèi)的誤差的個數(shù)與落在該區(qū)間范圍外的誤差個數(shù)相等。或者說,在所有的測量誤差中有一個誤差值,比它大的誤差與比它小的誤差出現(xiàn)的可能性恰好相等,這一誤差稱為或然誤差。

根據(jù)或然率理論,當(dāng)測量次數(shù)足夠大時,或然誤差和平均偏差與標(biāo)準(zhǔn)差有如下關(guān)系:

通常情況下,采用貝塞爾法公式計算標(biāo)準(zhǔn)差表示測量結(jié)果的離散程度。

主站蜘蛛池模板: 灵丘县| 河池市| 惠来县| 香格里拉县| 甘洛县| 许昌市| 莱芜市| 峨眉山市| 抚松县| 南充市| 汉中市| 疏勒县| 皮山县| 鹿邑县| 抚松县| 荆州市| 高邑县| 秀山| 遵义市| 东乡| 芮城县| 康定县| 和政县| 微山县| 区。| 阳江市| 灵武市| 库伦旗| 瓮安县| 来凤县| 衢州市| 临夏市| 永仁县| 梅州市| 博罗县| 翁牛特旗| 宜昌市| 德化县| 兴海县| 逊克县| 寻甸|