官术网_书友最值得收藏!

2.1 參數(shù)估計

如果想知道某所中學(xué)高三年級全體男生的平均身高,其實只要測定他們每個人的身高然后再取均值即可。但是若想知道中國成年男性的平均身高似乎就不那么簡單了,因為這個研究的對象群體實在過于龐大,要想獲得全體中國成年男性的身高數(shù)據(jù)顯然有點不切實際。這時一種可以想到的辦法就是對這個龐大的總體進行采樣,然后根據(jù)樣本參數(shù)來推斷總體參數(shù),于是便引出了參數(shù)估計(Parameter Estimation)的概念。參數(shù)估計就是用樣本統(tǒng)計量去估計總體參數(shù)的方法。例如,可以用樣本均值來估計總體均值,用樣本方差來估計總體方差。如果把總體參數(shù)(均值、方差等)籠統(tǒng)地用一個符號θ來表示,而用于估計總體參數(shù)的統(tǒng)計量用來表示,那么參數(shù)估計也就是用來估計θ的過程,其中也稱為是估計量(Estimator),而根據(jù)具體樣本計算得出的估計量數(shù)值就是估計值(Estimated Value)。

2.1.1 參數(shù)估計的基本原理

點估計(Point Estimate)是用樣本統(tǒng)計量的某個取值直接作為總體參數(shù)θ的估計值。比如,可以用樣本均值直接作為總體均值μ的估計值,用樣本比例p直接作為總體比例的估計值等等。這種方式的點估計也稱為矩估計,它的基本思路就是用樣本矩估計總體矩,用樣本矩的相應(yīng)函數(shù)來估計總體矩的函數(shù)。由大數(shù)定理可知,如果總體Xk階矩存在,那么樣本的k階矩以概率收斂到總體的k階矩,樣本矩的連續(xù)函數(shù)收斂到總體矩的連續(xù)函數(shù),這就暗示可以用樣本矩作為總體矩的估計量,這種用相應(yīng)的樣本矩去估計總體矩的估計方法就稱為矩估計法,這種方法最初是由英國統(tǒng)計學(xué)家卡爾·皮爾遜(Karl Pearson)提出的。

來看一個例子。2014年10月28日,為了紀念美國實驗醫(yī)學(xué)家、病毒學(xué)家喬納斯·愛德華·索爾克(Jonas Edward Salk)誕辰100周年,谷歌公司特別在其主頁上刊出了一幅如圖2-1所示的紀念畫。第二次世界大戰(zhàn)以后,由于缺乏有效的防控手段,脊髓灰質(zhì)炎逐漸成為美國公共健康的最大威脅之一。其中,1952年的大流行是美國歷史上最嚴重的爆發(fā)。那年報道的病例有58 000人,3145人死亡,另有21 269人致殘,且多數(shù)受害者是兒童。直到索爾克研制出首例安全有效的“脊髓灰質(zhì)炎疫苗”,曾經(jīng)讓人聞之色變的脊髓灰質(zhì)炎才開始得到有效的控制。

圖2-1 索爾克紀念畫

索爾克在驗證他發(fā)明的疫苗效果時,設(shè)計了一個隨機雙盲對照試驗,實驗結(jié)果是在全部200 745名接種了疫苗的兒童中,最后患上脊髓灰質(zhì)炎的一共有57例。那么采用點估計的辦法我們就可以推斷該疫苗的整體失效率大約為

或者在R中執(zhí)行下面的代碼來計算結(jié)果。

雖然在重復(fù)抽樣下,點估計的均值可以期望等于總體的均值,但由于樣本是隨機抽取的,由某一個具體樣本算出的估計值可能并不等同于總體均值。在用矩估計法對總體參數(shù)進行估計時,還應(yīng)該給出點估計值與總體參數(shù)真實值間的接近程度。通常我們會圍繞點估計值來構(gòu)造總體參數(shù)的一個區(qū)間,并用這個區(qū)間來度量真實值與估計值之間的接近程度,這就是區(qū)間估計。

區(qū)間估計(Interval Estimate)是在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,而這個區(qū)間通常是由樣本統(tǒng)計量加減估計誤差得到的。與點估計不同,進行區(qū)間估計時,根據(jù)樣本統(tǒng)計量的抽樣分布可以對樣本統(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量。

例如在以樣本均值估計總體均值的過程中,由樣本均值的抽樣分布知,在重復(fù)抽樣或無限總體抽樣的情況下,樣本均值的數(shù)學(xué)期望等于總體均值,即。回憶第1章曾經(jīng)給出過的一些結(jié)論,還可以知道,樣本均值的標準差等于,其中σ是總體的標準差,n是樣本容量。根據(jù)中央極限定理可知樣本均值的分布服從正態(tài)分布。這就意味著,樣本均值落在總體均值μ的兩側(cè)各一個抽樣標準差范圍內(nèi)的概率為0.6827;落在兩個抽樣標準差范圍內(nèi)的概率為0.9545;落在三個抽樣標準差范圍內(nèi)的概率是0.9973……下面是R中用于計算的代碼。

事實上,我們完全可以求出樣本均值落在總體均值兩側(cè)任何一個抽樣標準差范圍內(nèi)的概率。但實際估計時,情況卻是相反的。我們所知道的僅僅是樣本均值,而總體均值μ未知,也正是需要估計的。由于μ之間的距離是對稱的,如果某個樣本均值落在μ的兩個標準差范圍之內(nèi),反過來μ也就被包括在以為中心左右兩個標準差的范圍之內(nèi)。因此,大約有95%的樣本均值會落在μ的兩個標準差范圍內(nèi)。或者說,約有95%的樣本均值所構(gòu)造的兩個標準差區(qū)間會包括μ。圖2-2給出了區(qū)間估計的示意圖。

圖2-2 區(qū)間估計示意圖

在區(qū)間估計中,由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)之估計區(qū)間被稱為置信區(qū)間(Confidence Interval),而且如果將構(gòu)造置信區(qū)間的步驟重復(fù)多次,置信區(qū)間中所包含的總體參數(shù)真實值的次數(shù)之占比稱為置信水平,或置信度。在構(gòu)造置信區(qū)間時,可以使用希望的任意值作為置信水平。常用的置信水平和正態(tài)分布曲線下右側(cè)面積為α/2時的臨界值如表2-1所示。

表2-1 常用置信水平臨界值

2.1.2 單總體參數(shù)區(qū)間估計

1. 總體比例的區(qū)間估計

比例問題可以看做是一項滿足二項分布的試驗。例如在索爾克的隨機雙盲對照試驗中,實驗結(jié)果是在全部200 745名接種了疫苗的兒童中,最后患上脊髓灰質(zhì)炎的一共有57例。這就相當是做了200 745次獨立的伯努利試驗,每次試驗的結(jié)果必為兩種可能之一,要么是患病,要么是不患病。而且第1章中也講過,服從二項分布的隨機變量X~Bnp)以np為期望,以np(1-p)為方差。可以令樣本比例作為總體比例p的估計值,而且可以得知

同時還有

由此便已經(jīng)具備了進行區(qū)間估計的必備素材。

第一種進行區(qū)間估計的方法被稱為是Wald方法,它是一種近似方法。根據(jù)中央極限定理,當n足夠大時,將會有

在2.1.1節(jié)中也給出了標準正態(tài)分布中,95%置信水平下的臨界值,即1.96,即

Wald方法對上述結(jié)果做了經(jīng)一步的近似,即把根號下的p來代替,于是總體比例p在95%置信水平下的置信區(qū)間即為

以索爾克的隨機雙盲對照試驗為例,可以在R中使用下面的代碼來算得總體比例估計的置信區(qū)間。從輸出結(jié)果中可知,保留小數(shù)點后6位有效數(shù)字的置信區(qū)間為(0.000 210,0.000 358)。

Wald方法的基本原理是利用正態(tài)分布來對二項分布進行近似,與之相對的另外一種方法是Clopper-Pearson方法。該方法完全是基于二項分布的,所以它是一種更加確切的區(qū)間估計方法。在R中可以使用binom.test()函數(shù)來執(zhí)行Clopper-Pearson方法,下面給出示例代碼。

從以上輸出中可以得到,保留小數(shù)點后6位有效數(shù)字的95%置信水平下之區(qū)間估計結(jié)果為(0.000 215,0.000 369)。這一數(shù)值其實已經(jīng)與Wald方法所得結(jié)果非常相近了。

2. 總體均值的區(qū)間估計

在對總體均值進行區(qū)間估計時,需要分幾種情況來討論。首先若考慮的總體是正態(tài)分布且方差σ2已知,或總體不滿足正態(tài)分布但為大樣本(n≥30)時,樣本均值的抽樣分布均為正態(tài)分布,數(shù)學(xué)期望為總體均值μ,方差為σ2/n。而樣本均值經(jīng)過標準化以后的隨機變量服從標準正態(tài)分布,即

由此可知總體均值μ在1-α置信水平下的置信區(qū)間為

其中α是顯著水平,它是總體均值不包含在置信區(qū)間內(nèi)的概率;zα/2是標準正態(tài)分布曲線與橫軸圍成的面積等于α/2時的z值。

例如現(xiàn)在有一家生產(chǎn)袋裝食品的食品廠。按規(guī)定每袋食品的重量應(yīng)為100g。為對產(chǎn)品質(zhì)量進行監(jiān)測,質(zhì)檢部門從當天生產(chǎn)的一批食品中隨機抽取了25袋,并測得每袋的重量數(shù)據(jù)如表2-2所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標準差為10g。請計算該天每袋食品平均重量的置信區(qū)間,置信水平為95%。

表2-2 食品重量抽檢數(shù)據(jù)(質(zhì)量/g)

由于R中并沒有提供方差已知時置信區(qū)間的計算函數(shù),所以我們需要手動編寫一個函數(shù),代碼如下。

然后調(diào)用上述函數(shù)來計算置信區(qū)間,代碼如下。

結(jié)果表明該批食品平均重量95%的置信區(qū)間為(101.44,109.28)。

如果總體服從正態(tài)分布但σ2未知,或總體并不服從正態(tài)分布,只要是在大樣本條件下,都可以用樣本方差s2來代替總體方差σ2,此時總體均值在1-α置信水平下的置信區(qū)間為

其中需要注意的一點,也是第1章中著重討論的一點,即如果設(shè)X1X2,…,Xn是來自總體X的一個樣本,那么作為總體方差σ2之無偏估計的樣本方差公式為

此外,考慮總體是正態(tài)分布,但方差σ2未知且屬于小樣本(n<30)的情況,仍然需要用樣本方差s2來替代總體方差σ2。但此時樣本均值經(jīng)過標準化以后的隨機變量將服從自由度為(n-1)的t分布,即

這也是本書前面曾經(jīng)給出的一個定理。于是,我們就需要采用學(xué)生t分布來建立總體均值μ的置信區(qū)間。

學(xué)生t分布,或簡稱t分布,是類似正態(tài)分布的一種對稱分布,但它通常要比正態(tài)分布平坦和分散。一個特定的t分布依賴于稱之為自由度的參數(shù)。自由度越小,那么t分布的圖形就越平坦,隨著自由度的增大,t分布也逐漸趨近于正態(tài)分布。下面的代碼繪制了標準正態(tài)分布以及兩個自由度不同的t分布,結(jié)果如圖2-3所示。

圖2-3 標準正態(tài)分布與t分布

根據(jù)t分布建立的總體均值μ在1-α置信水平下的置信區(qū)間為

其中tα/2是自由度為n-1時,t分布中右側(cè)面積為α/2的t值。

例如,現(xiàn)在為了測定一塊土地的pH值,隨機抽取了17塊土壤樣本,相應(yīng)的pH值檢測結(jié)果如表2-3所示。由于樣本容量僅為17,所以屬于小樣本的情況,于是采用上述方法對這塊土地的pH值均值進行區(qū)間估計。

表2-3 土壤pH值檢測數(shù)據(jù)

根據(jù)已經(jīng)給出的公式可以在R中下面的代碼來進行區(qū)間估計,其估計結(jié)果我們用方框來進行標識。

或者更簡單地,可以直接使用R中的t.test()函數(shù)來計算,示例代碼如下。結(jié)果同樣用方框來進行標識,可見與前面得到的結(jié)果是一致的。

表2-4對本部分介紹的關(guān)于單總體均值的區(qū)間估計方法進行了總結(jié),供讀者參閱。

表2-4 單總體均值的區(qū)間估計

3. 總體方差的區(qū)間估計

此處僅討論正態(tài)總體方差的估計問題。根據(jù)樣本方差的抽樣分布可知,樣本方差服從自由度為n-1的χ2分布。所以考慮用χ2分布構(gòu)造總體方差的置信區(qū)間。給定一個顯著水平α,用χ2分布建立總體方差σ2的置信區(qū)間,其實就是要找到一個χ2值,使得

由于

所以可以用其來替代χ2,于是有

并根據(jù)上式推導(dǎo)出總體方差σ2在1-α置信水平下的置信區(qū)間為

據(jù)此便可對總體方差的置信區(qū)間進行估計。由于R中并沒有提供直接用于方差區(qū)間估計的函數(shù),我們便自行編寫了下面這個函數(shù)用以執(zhí)行相應(yīng)計算。

以食品廠抽檢產(chǎn)品重量的數(shù)據(jù)為例,調(diào)用以上函數(shù)可以算得56.83≤σ2≤180.39。相應(yīng)地,總體標準差的置信區(qū)間則為7.538≤σ≤13.431,即該食品廠生成的食品總體重量標準差95%的置信區(qū)間為7.538~13.431g。

2.1.3 雙總體均值差的估計

第1章中曾經(jīng)指出,若,其中i=1,2,…,n且相互獨立,則它們的線性組合C1X1+C2X2+…+CnXn仍服從正態(tài)分布,其中C1C2,…,Cn是不全為0的常數(shù)。并由數(shù)學(xué)期望和方差的性質(zhì)可知

所以假設(shè)隨機變量的估計符合正態(tài)分布的一個潛在好處就是它們的線性組合仍然可以滿足正態(tài)分布的假設(shè)。如果有,顯然有

a=1,b=-1時,進而有

這其實給出了兩個獨立的正態(tài)分布的總體之差的分布。

X1X2這兩個總體中分別抽取樣本量為n1n2的兩個隨機樣本,其樣本均值分別為。則樣本均值滿足,樣本均值滿足。進而樣本均值之差滿足

由此便得到了進行雙總體均值之差區(qū)間估計的所需素材。在具體討論時我們將問題分成兩類,即獨立樣本數(shù)據(jù)的雙總體均值差估計問題,以及配對樣本數(shù)據(jù)的雙總體均值差估計問題。

1. 獨立樣本

如果兩個樣本是從兩個總體中獨立抽取的,即一個樣本中的元素與另一個樣本中的元素相互獨立,則稱為獨立樣本(Independent Samples)。

當兩總體的方差已知的時候,根據(jù)前面推出的結(jié)論,類似于單個總體區(qū)間估計,可以得出μ1-μ2的置信水平為1-α的雙尾置信區(qū)間為

如果兩個總體的方差未知,可以用兩個樣本方差來代替,這時μ1-μ2的置信水平為1-α的雙尾置信區(qū)間為

對于兩個總體的方差未知的情況,將進一步劃分為兩種情況,首先當兩總體方差相同,即,但未知時,可以得到

其中

此處的分別是樣本方差。類似的做法,可以得到μ1-μ2的置信水平為1-α的雙尾置信區(qū)間為

來看一個例子。假設(shè)有編號為1和2的兩種飼料,我們現(xiàn)在分別用它們來喂養(yǎng)兩組肉雞,然后記錄每只雞的增重情況,數(shù)據(jù)如表2-5所示。

表2-5 喂食不同飼料的肉雞增重情況

首先在R中錄入數(shù)據(jù),并分別計算兩組數(shù)據(jù)的均值和方差,示例代碼如下。

從輸出結(jié)果來看,兩組樣本觀察值的標準差是非常相近的,因此假設(shè)兩個總體的方差是相等的。

根據(jù)上面給出的公式,首先來計算s′的值,計算過程如下

因此μ1-μ2在95%置信水平下的置信區(qū)間為

或者在R中使用t.test()函數(shù)來執(zhí)行上述計算過程,示例代碼如下。區(qū)間估計的結(jié)果已經(jīng)用方框加以標識。這個輸出中的其他指標結(jié)果我們將在假設(shè)檢驗部分繼續(xù)討論。

通過設(shè)置函數(shù)t.test()中的參數(shù)可以修改它的一些執(zhí)行細節(jié),具體參數(shù)列表可以參閱R的幫助文檔。這里僅提其中幾個比較重要的。首先,參數(shù)paired的默認值為FALSE,表示執(zhí)行的是獨立樣本的情況。若將其置為TRUE,則表示要處理的是配對樣本。參數(shù)conf.level的默認值為0.95,即在95%的置信水平下進行區(qū)間估計,調(diào)整它便可以改變置信水平。參數(shù)var.equal的默認值為FALSE,如果將其置為TRUE,就表示兩個總體具有相同的方差。

此外,當兩總體的方差未知,且時,可以證明

近似成立,其中

但由于未知,所以用樣本方差來近似,即

可以近似地認為。并由此得到μ1-μ2的置信水平為1-α的雙尾置信區(qū)間為

仍以飼料和肉雞增重的數(shù)據(jù)為例,可以算得

進而有

因此μ1-μ2在95%置信水平下的置信區(qū)間為

同樣,上述計算過程可以在R中使用t.test()函數(shù)來完成,示例代碼如下。輸出中的其他指標結(jié)果在假設(shè)檢驗部分還會有更為詳細的討論。

2. 配對樣本

在前面的例子中,為了討論兩種飼料的差異,從兩個獨立的總體中進行了抽樣,但使用獨立樣本來估計兩個總體均值之差也潛在著一些弊端。試想一下,如果喂食飼料1的肉雞和喂食飼料2的肉雞體質(zhì)上就存在差異,可能其中一組吸收更好而另一組則略差,顯然試驗結(jié)果的說服力將大大折扣。這種“有失公平”的獨立抽樣往往會掩蓋一些真正的差異。

在實驗設(shè)計中,為了控制其他有失公平的因素,盡量降低不利影響,使用配對樣本(Paired Sample)就是一種值得推薦的做法。所謂配對樣本就是指一個樣本中的數(shù)據(jù)與另一個樣本中的數(shù)據(jù)是相互對應(yīng)的。比如,在驗證飼料差異的試驗中,可以選用同一窩誕下的一對小雞作為一個配對組,因為我們認為同一窩誕下的小雞之間差異最小。按照這種思路,如表2-6所示,一共有六個配對組參與實驗。然后從每組中隨機選取一只小雞喂食飼料1,然后向另外一只喂食飼料2,并記錄肉雞體重增加的數(shù)據(jù)。

表2-6 配對試驗數(shù)據(jù)

使用配對樣本進行估計時,在大樣本條件下,兩個總體均值之差μ1-μ2在1-α置信水平下的置信區(qū)間為

其中,d是一組配對樣本之間的差值,表示各差值的均值;σd表示各差值的標準差。當總體σd未知時,可用樣本差值的標準差sd來代替。

在小樣本情況下,假定兩個總體觀察值的配對差值服從正態(tài)分布。那么兩個總體均值之差μ1-μ2在1-α置信水平下的置信區(qū)間為

例如,根據(jù)表2-6中的數(shù)據(jù)可以算得各配對組之差分別為-2、6、13、10、7和6,以及sd=5.046。因此,總體均值之差μ1-μ2在95%置信水平下的置信區(qū)間為

同樣可以在R中使用t.test()函數(shù)來完成以上計算過程,此時需要將參數(shù)paired置為TRUE。示例代碼如下,輸出結(jié)果中的置信區(qū)間估計已經(jīng)用方框標出。這個區(qū)間估計不包含零,其實也就意味兩者是存在差異的,即飼料1和飼料2的喂食結(jié)果不同。

當然,如果先計算配對組之差,然后再做t.test()所得之結(jié)果將是一樣的。讀者可以自行嘗試下面的代碼,并觀察結(jié)果。

最后需要說明的是,如果僅是執(zhí)行普通的t.test(),而非是做配對數(shù)據(jù)的t.test(),那么將得到一個寬泛得多的區(qū)間估計。如下面代碼所示,最終估計的置信區(qū)間還包含了零,這使得我們將無法確定飼料1和飼料2的喂食結(jié)果是否有不同。

2.1.4 雙總體比例差的估計

由樣本比例的抽樣分布可知,從兩個滿足二項分布的總體中抽出兩個獨立的樣本,那么兩個樣本比例之差的抽樣服從正態(tài)分布,即

再對兩個樣本比例之差進行標準化,即得

當兩個總體的比例p1p2未知時,可用樣本比例來代替。所以,根據(jù)正態(tài)分布建立的兩個總體比例之差p1-p2在1-α置信水平下的置信區(qū)間為

下面來看一個例子。在某電視節(jié)目的收視率調(diào)查中,從農(nóng)村隨機調(diào)查了400人,其中有128人表示收看了該節(jié)目;從城市隨機調(diào)查了500人,其中225人表示收看了該節(jié)目。請以95%的置信水平來估計城市與農(nóng)村收視率差距的置信區(qū)間。

在R中可以使用prop.test()函數(shù)來執(zhí)行雙總體比例差的區(qū)間估計,示例代碼如下。輸出結(jié)果中的置信區(qū)間估計已經(jīng)用方框標出。參數(shù)correct的默認值為TRUE,表示計算過程中需要使用連續(xù)性修正。如果將其置為FALSE,則所得結(jié)果將同依據(jù)上述公式所得結(jié)果完全一致。

從輸出結(jié)果中可以看出估計的置信區(qū)間為(6.68%,19.32%),即城市與農(nóng)村收視率差值的95%的置信區(qū)間為6.68%~19.32%。

如果使用連續(xù)性修正,則所得結(jié)果如下。

主站蜘蛛池模板: 合作市| 塔城市| 江源县| 柏乡县| 墨脱县| 突泉县| 宜春市| 丹巴县| 牡丹江市| 合江县| 望谟县| 萨迦县| 乌拉特中旗| 华宁县| 手游| 扎鲁特旗| 综艺| 大名县| 思茅市| 股票| 盱眙县| 克东县| 穆棱市| 绥宁县| 金寨县| 昌黎县| 丰顺县| 盘山县| 泸水县| 台江县| 汉沽区| 咸阳市| 高安市| 三明市| 自治县| 东海县| 贵溪市| 庆城县| 柳河县| 茌平县| 察雅县|