官术网_书友最值得收藏!

4.4 威爾科克森的秩和檢驗(yàn)

威爾科克森秩和檢驗(yàn)也是一種常用的非參數(shù)檢驗(yàn)方法,它又被稱為曼-惠特尼-威爾科克森檢驗(yàn)(Mann-Whitney-Wilcoxon Test),簡稱MWW檢驗(yàn)。與符號秩檢驗(yàn)不同的是,秩和檢驗(yàn)可以應(yīng)用于兩個獨(dú)立的樣本數(shù)據(jù)集。如果選自一個總體的樣本值和選自另一總體的樣本值沒有關(guān)系,或者沒有某種形式的匹配,就稱這兩個樣本是獨(dú)立的。

威爾科克森秩和檢驗(yàn)與參數(shù)檢驗(yàn)法中獨(dú)立樣本的t檢驗(yàn)法相對應(yīng)。當(dāng)“總體正態(tài)”這一前提不成立時,不能用t檢驗(yàn),可以用秩和檢驗(yàn)法;當(dāng)兩個樣本都為順序變量(例如由秩組成的數(shù)據(jù))時,也需使用秩和法進(jìn)行差異顯著性檢驗(yàn)。在應(yīng)用秩和檢驗(yàn)法時假設(shè)有兩個隨機(jī)選擇的獨(dú)立樣本。同樣,秩和檢驗(yàn)也不要求兩個總體服從正態(tài)分布或者其他特殊分布。威爾科克森秩和檢驗(yàn)的原假設(shè)和備擇假設(shè)一般如下

H0:兩個樣本來自于具有相同分布的總體,即這兩個總體是相同的。

H1:兩個樣本來自于具有不同分布的總體,即兩個總體在某方面有差異。

威爾科克森秩和檢驗(yàn)的核心思想是:如果兩個樣本抽取自相同的總體,且這些值都在數(shù)值的一個合并集中進(jìn)行了排序,那么高的秩和低的秩應(yīng)該平均地落在兩個樣本之中。如果在一個樣本中發(fā)現(xiàn)低秩特別顯著,而在另一樣本中發(fā)現(xiàn)高秩特別顯著,那么就有理由懷疑這兩個總體是不同的。

如何評估這些高秩和低秩是否平均地落在了兩個樣本中呢?我們用n1來表示樣本1的容量,用n2來表示樣本2的容量。用T來表示總體1觀察值的秩之和。如果原假設(shè)為真,即兩個總體具有相同的分布。我們從容量為N的總體1中抽取了一個容量為n1的樣本1,所以樣本1的秩集就相當(dāng)于是從1,2,…,N的整數(shù)值中抽取的容量為n1的一個隨機(jī)樣本。因?yàn)闃颖?和樣本2合并后產(chǎn)生的秩集是從1,2,…,n1+n2+1的一個整數(shù)集合,其均值為

所以在原假設(shè)前提下,T的期望和方差應(yīng)該分別為

其中用到了這樣的一個結(jié)論,即整數(shù)1,2,…,n具有標(biāo)準(zhǔn)差

直觀上如果TμT大很多或小很多,就有理由拒絕原假設(shè)。秩和檢驗(yàn)的拒絕域具體給出了,當(dāng)原假設(shè)被拒絕時TμT差異的大小。在具體執(zhí)行時拒絕的臨界值可以從相關(guān)的統(tǒng)計(jì)表中查到。

對于備擇假設(shè)而言,當(dāng)兩個總體在某方面有差異,具體可以分成三種情形,首先是總體1是總體2的一個右平移,給定顯著水平,差臨界值表得到TU,若TTU,U表示Upper即右邊界,則可以拒絕原假設(shè)。其次是總體1是總體2的一個左平移,差臨界值表得到TL,若TTLL表示Lower即左邊界,則可以拒絕原假設(shè)。顯然前兩種都是單尾的。最后一種則是雙尾的,即總體1和總體2互為平移,若TTU或者TTL,則拒絕原假設(shè)。

來看一個例子,現(xiàn)在討論的都是n1≤10且n2≤10的情況。有研究人員想檢驗(yàn)一下酒精對于反應(yīng)時間的影響。10名參與者飲用了指定劑量的含酒精飲料,另外10名則飲用同樣多的不含酒精的飲品(一種安慰劑)。參與者并不知道自己所喝的飲料中是否含有酒精。表4-17給出了這20個人對一系列測試的反應(yīng)時間(以秒計(jì))。請問酒精是否使得反應(yīng)時間延長了?

表4-17 實(shí)驗(yàn)測試結(jié)果

根據(jù)描述,建立如下原假設(shè)及備擇假設(shè)。

H0:對應(yīng)于安慰劑和酒精的兩個反應(yīng)時間總體分布相同。

H1:對應(yīng)于安慰劑的反應(yīng)時間之總體分布是對應(yīng)于酒精的反應(yīng)時間之總體分布的左平移,及飲酒會延長反應(yīng)時間。

將兩組數(shù)據(jù)混合后排序,并編秩,中間計(jì)算結(jié)果如表4-18所示。

表4-18 中間計(jì)算結(jié)果

對于α=0.05,執(zhí)行單尾檢驗(yàn),n1=n2=10,查表可得TL=83。計(jì)算T的值,即從總體1中抽取的樣本的秩和,T=TX=1+2+3+4+5+6+7+8+16+18=70。因?yàn)?i>T<TL,則拒絕原假設(shè),進(jìn)而認(rèn)為安慰劑總體的反應(yīng)時間小于酒精總體。

在R中同樣可以使用wilcox.test()函數(shù)來執(zhí)行威爾科克森秩和檢驗(yàn),此時只需將參數(shù)paired的值置為默認(rèn)值FALSE即可,因?yàn)槟J(rèn)值為FALSE,所以也可缺省。示例代碼如下。

可見P值為0.003 421<α=0.05,同樣拒絕原假設(shè)。

當(dāng)兩個樣本容量都大于10時,T的抽樣分布近似于正態(tài);于是可以在威爾科克森秩和檢驗(yàn)中用z統(tǒng)計(jì)量代替T,即

理論上,威爾科克森秩和檢驗(yàn)要求總體分布是連續(xù)的,所以任意兩個數(shù)值相等的概率為零。在介紹秩的概念時,我們已經(jīng)給出了相等秩的處理方法。此時我們還需調(diào)整T的方差,調(diào)整后的值為

其中,k是相等數(shù)據(jù)的組數(shù),tj是第j組相等的觀察值中數(shù)據(jù)的個數(shù)。當(dāng)沒有相等數(shù)據(jù)時,對所有的jtj=1,這時情況與我們最初給出的方差公式一致。實(shí)際上,除非有許多相等數(shù)據(jù),否則,調(diào)整對的影響不大。

來看一個例子。研究人員想確定一個湖泊中的清理工程是否奏效。為此在工程開始前,他們從湖中抽取了12個水樣,然后測定其中的溶解氧含量(單位:ppm),因?yàn)槿芙庋鹾吭谝归g有所波動,因此所有測量均在下午2點(diǎn)的高峰期進(jìn)行。工程開展前后的數(shù)據(jù)如表4-19所示。

表4-19 溶解氧的含量數(shù)據(jù)/ppm

根據(jù)描述,提出下列原假設(shè)與備擇假設(shè)

H0:清理前后數(shù)據(jù)的分布相同。

H1:清理前數(shù)據(jù)的分布是清理后數(shù)據(jù)分布的一個右移。

注意如果溶解氧含量降低,則說明清理工程有效,而表現(xiàn)在分布上即為清理前數(shù)據(jù)的分布是清理后數(shù)據(jù)分布的一個右移(或者說,清理后數(shù)據(jù)分布發(fā)生了左移)。

同樣,混合24個樣本觀察值,并賦與相應(yīng)的秩,處理兩個或兩個以上相同觀察值的方法遵循前面介紹的方法,即取平均值。中間結(jié)果如表4-20所示。

表4-20 中間計(jì)算結(jié)果

因?yàn)?i>n1n2的值都大于10,所以可以使用檢驗(yàn)統(tǒng)計(jì)量z。如果想要檢驗(yàn)出清理后觀察值的分布向左平移,那么就應(yīng)該期望樣本X的秩和就應(yīng)該較大。因此,如果z=(T-μT)/σT值較大,就應(yīng)該拒絕原假設(shè)。其中,T=TX=10+14+14+14+17+18+19+20+21+22.5+22.5+24=216。另外根據(jù)前面給出的公式可以算得

所以檢驗(yàn)統(tǒng)計(jì)量z的值為

從圖4-2可見,這個值大于1.645,位于拒絕域內(nèi),所以拒絕原假設(shè)。從而得出結(jié)論:清除前的分布是清除后分布的一個右平移,即清除后溶解氧的含量小于清除前的含量。

還可以用下面的代碼計(jì)算相應(yīng)的P值。

圖4-2 拒絕域與非拒絕域

最后直接使用R提供的wilcox.test()函數(shù)來執(zhí)行秩和檢驗(yàn),易見最終得到的P值與前面人工算得的一致,因?yàn)?i>P值小于0.05,同樣可以據(jù)此推翻原假設(shè),進(jìn)而認(rèn)為清理工程確實(shí)有效。

威爾科克森秩和檢驗(yàn)具有非常優(yōu)異的效力,所涉及的計(jì)算也更簡單。所以即使在正態(tài)分布得以滿足的條件下,研究人員也更傾向于使用秩和檢驗(yàn),而非本書前面介紹的參數(shù)檢驗(yàn)。

主站蜘蛛池模板: 通道| 伊宁县| 南京市| 饶平县| 育儿| 寿阳县| 万年县| 隆回县| 衡山县| 南岸区| 蓝田县| 姚安县| 天峻县| 亚东县| 德昌县| 来宾市| 寿宁县| 临汾市| 南涧| 库车县| 宁蒗| 湛江市| 凉城县| 平山县| 区。| 恩施市| 新乐市| 东平县| 凉山| 登封市| 沙湾县| 鄂伦春自治旗| 葵青区| 衡阳市| 江孜县| 阿拉善右旗| 公主岭市| 文登市| 通江县| 河西区| 古田县|