書名: 統計學習理論與方法:R語言版作者名: 左飛本章字數: 1754字更新時間: 2020-10-16 16:24:25
4.3 威爾科克森符號秩檢驗
威爾科克森符號秩檢驗(Wilcoxon signed-rank test)由美國化學家、統計學家弗蘭克·威爾科克森(Frank Wilcoxon)于1945年提出的。該方法是在成對觀測數據的符號檢驗基礎上發展起來的,它不僅利用了觀察值和原假設中心位置的差的正負,還利用了差值的大小信息,因此比傳統的單獨用正負號的檢驗更加有效。
如果兩個總體的分布相同,每個配對數值的差應服從以0為中心的對稱分布。也就是將差值按照絕對值的大小編秩(排順序)并給秩次加上原來差值的符號后,所形成的正秩和與負秩和在理論上是相等的(滿足差值總體中位數為0的假設),如果兩者相差太大,超出界值范圍,則拒絕原假設。
在正式介紹威爾科克森符號秩檢驗之前,先來了解一下秩的概念。當數據按照某個標準進行排序之后,秩是按照一個樣本項在排序中的次序而分配給該樣本項的一個數字。第一項被賦與秩1,第二項被賦與秩2,依此類推。
例如數字12、10、35、30、18可以按從小到大的順序排列為10、12、18、30、35。那么給這些數字編秩后的結果如下

如果在秩中出現一個同級的情況,一般是算出所涉及之秩的均值后把這個平均秩賦與每一個同級項,例如數字12、10、35、12、18中因為有兩個12,所以秩2和秩3同級,于是就把2和3的平均值2.5賦給這兩個12,即

在應用威爾科克森符號秩檢驗時,通常假設樣本數據是隨機選擇的,而且總體或者(由配對數據算出的)差值總體服從一個近似對稱的分布,但并不要求數據服從正態分布。
威爾科克森符號秩檢驗可以用于檢驗一個樣本是否來自于一個具有指定中位數的總體。例如下面是10個歐洲城鎮每人每年平均消費的酒類(相當于純酒精數),數據已經按升序排列
4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45
人們普遍認為歐洲各國人均年消費酒量的中位數相當于純酒精8升,試用上述數據檢驗這種看法。
通過數據可以看出,中位數為11.155,明顯大于8,因此可以建立如下假設
H0:M=8; H1:M>8
然后根據每個樣本值與中位數的差來計算相應的秩和符號,中間結果如表4-15所示。
表4-15 中間計算結果

分別求出帶正號的秩和以及帶負號的秩和如下
T+=2+4+6+7+8+9+10=46
T-=5+3+1=9
用T來表示兩個秩和中的較小者,兩個和中的任何一個都可以使用,但為了簡化步驟,通常選擇其中的較小者。令n為差值D不為0的樣本數據的數量,對于n≤30,則檢驗統計量為T,如果n>30,則統計量為

如果n≤30,可以從威爾科克森統計量臨界值表中查得T的臨界值。如果n>30,則從正態概率分布表中查得z的臨界值。在本例中T=9,n=10,從威爾科克森統計量臨界值表中查得單尾α=0.05的臨界值為11,因為T=9小于臨界值11,拒絕原假設。也可以直接從威爾科克森符號秩檢驗統計量表中可以查得P值為0.032<α=0.05,同樣可以拒絕原假設。最終得出結論歐洲人均酒精年消費(中位數)多于8升。
現給出在R中執行以上檢驗的代碼如下。

對于配對數據而言,威爾科克森符號秩檢驗也可用以檢驗總體分布之間的差異,所以這時的原假設和備擇假設通常為
H0:兩個樣本來自于相同分布的總體。
H1:兩個樣本來自于不同分布的總體。
來看一個例子。表4-16記錄了9名混合性焦慮和抑郁癥患者在開始接受一種鎮靜劑治療后第一次和第二次抑郁程度評估的結果。現在請考慮這種療法是否使患者的情況得到了改善。
表4-16 治療效果數據

在R中執行配對數據的威爾科克森符號秩檢驗的方法與前面單一樣本的檢驗方法十分相像。下面給出的兩種寫法將會得到相同的結果。

由于P值為0.019 53<α=0.05,所以拒絕原假設,進而得出這種療法使患者的情況得到了改善的結論。
當數據對較多時,可以計算一個近似的P值,為此需要將參數exact的值置為FALSE。此外,參數correct用于控制是否對P值的正態近似計算應用連續性修正。來看下面這段示例代碼。

讀者可以嘗試將同樣的問題分別用符號檢驗和威爾科克森符號秩兩種方法進行分析,確實有些情況,他們所得的結論是相悖的。對同一問題用符號檢驗法和符號秩檢驗法,如果出現矛盾的結果,應該更傾向于相信符號秩檢驗法的結果,因為它既考慮差值的符號,也考慮其大小,利用了更多的信息,所以結果相對可靠些。
最后來考慮一下當n>30時使用的檢驗統計量為何是那樣一種形式的。所有秩的和1+2+3+…+n等于n(n+1)/2;如果這個秩和在正負兩類之間等分,則兩個和中的每一個都應該接近n(n+1)/2的一半,即n(n+1)/4。回想前面給出的檢驗統計量表達式,其中的分母代表了T的標準差,并且使用了下面的等式關系

這個等式可以由數學歸納法來證明,此處不再詳述。