- 臨床研究方法與實用技巧2
- 趙一鳴等編著
- 1084字
- 2020-05-19 11:56:49
09 樣本群體和個體的區別——均值的“可信區間”與“參考值范圍”
李 楠 趙一鳴
當繪制柱狀圖的時候,也許會遇到這樣的問題,用柱狀圖表述一組均值,在繪制柱頂端的范圍時,到底應該用標準差、標準誤還是可信區間,又或者是參考值范圍?想解答這一問題,應該首先問問自己到底是想探討一次抽樣的均值可能是什么,還是想探討一次抽樣的每個個體的值大致落在什么范圍。這就是在描述的時候,樣本群體和每個樣本個體的差異。
讓我們先復習一下統計學的兩個基本知識——標準差和標準誤。簡單來說,標準差是反映一個總體內,個體間的離散程度的指標,即每個個體都會在距離總體真實均值的某一個標準差范圍內波動;標準誤則是衡量一個總體

被抽出樣本的均值,距離總體均值的真實水平的差距可能有多少,標準誤不僅受總體內每個個體變異水平的影響,還受抽樣的樣本量大小影響,是反映抽樣的均值波動范圍的指標。
讓我們看個例子吧。假設我們在某個人群總體中抽了10個樣本,并計算得到一個均值(上圖中間的豎線)。那么由此可以估計出,總體中每個個體的分布如外面的黑線區域所示。同時,如果我們對這個總體反復多次進行重復抽樣,每次都抽取10個人,那么經過多次抽樣并計算均值后,我們會發現均值都落在了陰影部分。黑色曲線框住的部分就是個體的分布范圍;陰影部分就是樣本量為10時,抽樣均值的波動范圍。
現在可以往下說了,在我們針對一個樣本計算得到一個均值之后,我們期望告訴大家的是樣本背后的總體的真實均值是多少。正由于我們得到的均值是通過抽樣獲得的,因此其不僅不一定等于均值,而且每次抽樣的均值也不一定相同。因此我們在給出均值的時候,就要同時告訴大家如果這樣抽樣,均值會在什么范圍內波動,這就是均值的“可信區間”。由此不難看出,均值的可信區間是與上述陰影部分對應的。從公式上說,均值的可信區間可以通過均值和標準誤計算得到(95%可信區間為均值±1.96標準誤),前提是確定可信范圍(80%、90%還是95%)。
而統計學角度的參考值范圍則是群體內每個個體的取值水平。對應的是上圖的黑線下方的全部區域。故統計學角度的參考值范圍是通過均值和標準差計算得到的(95%參考值范圍是均值±1.96標準差)。
當然提到參考值范圍的時候,我們不能僅考慮如何計算,因為醫學的參考值制定本身還有一整套體系。由于參考值多用于界定某個值是否處于正常或異常水平,因此參考值范圍的確定過程更多要考慮到臨床的實際意義,參考值范圍的大小也要考慮實際臨床需求。
回到開始的問題,我想已經不需要多做解釋了。當您期望描述一個抽樣中每個個體的分布時,就用標準差、參考值范圍;而要想描述此次抽樣均值的波動范圍的話,就應該用標準誤和均值的可信區間。