第二節 抽樣術語與抽樣程序
一、抽樣的概念和術語
抽樣中常用到的概念與術語主要有:
1.個體與抽樣單位:個體是收集信息的基本單位,即分析單位。個體可以是某種類型的人,也可以是家庭、組織、社區等。除此之外個體還可以是文化產物,例如文章、雜志、歌曲、詞匯等。個體與抽樣單位在有些研究中是相同的,但在實際抽樣中,抽樣單位往往是多層次的。例如,要調查家庭,可先在一個縣抽選若干鄉,然后從這些鄉組成的樣本中抽選某些村,最后從村樣本中抽出家庭的樣本。這時抽樣單位是鄉、村、家庭三種,分別稱為初級抽樣單位、次級抽樣單位和終級抽樣單位。
2.研究總體和調查總體。研究總體是在理論上明確界定的個體的集合體,它必須受幾個方面的限定:內容、單位、范圍、時間。例如一項關于婦女生育率的研究,如果未加界定,婦女只是個模糊的整體,還不是研究總體,只有經界定為“1988年年滿15—49歲的中國婦女”后,才成為可用于調查的研究總體。研究總體是在理論上明確定義的整體,但在實際中很難做到使符合這一定義的一切個體均能有機會被選入樣本,例如在本例中西藏游牧區婦女,在部隊服役、勞教、患病特別是患精神病的婦女等,雖然在理論上符合研究總體的定義,但實際上無法對其調查。實際上,樣本是從調查總體而不是從研究總體中抽取的。調查總體是研究者從中實際抽取調查樣本的個體的集合體,它往往是對研究總體的進一步界定,即對時間、范圍做更進一步規定,例如本例中的調查總體可界定為:1988年7月1日零時(除中國臺灣和西藏外)28個省市自治區15—49歲婦女,并且要將住在醫院、精神病院、監獄、勞教所、軍隊中的婦女除外。一般地說,樣本只能推論調查總體而不是研究總體。
3.抽樣框,又稱抽樣范疇,是從中抽取樣本的抽樣單位名單。在一次抽樣中,抽樣框的數目是與抽樣單位的層次相對應的,上面例子中有三個層次的抽樣單位:鄉、村、家庭,則對應的抽樣框亦應有三個:全部鄉的名單、鄉樣本中所有村組成的名單、村樣本中所有家庭的名單。
4.參數值與統計值。參數值是關于總體中某一變量的綜合描述,例如全國婦女平均受教育年限,就是一個參數值。統計值則是關于調查樣本中某一變量的綜合描述,例如從一個樣本中得到的婦女平均受教育年限。抽樣調查的重要內容之一就是通過樣本的統計值推算總體的參數值,從而達到由部分認識總體的目的。
5.抽樣誤差。由前所述,總體的異質性和樣本與總體范圍的差異性,在用樣本的統計值去推算總體的參數值時總會有偏差,這種偏差就是抽樣誤差。它是樣本代表性大小的一個標準。需要指出的是,抽樣中因誤抄、計算錯誤等人為過失和其他一些因違反隨機原則而產生的誤差并不是這里所說的抽樣誤差。
6.置信水平與置信區間。置信水平是指總體參數值落在樣本統計值某一正負區間內的概率,而置信區間是指在某一置信水平下,樣本統計值與總體參數值的誤差范圍,詳細內容參見第十五章的討論。
二、抽樣的基本程序
1.界定研究總體和調查總體。對研究總體的界定過程也就是對它的基本構成單位,所包含的內容以及空間與時間的范圍等作出規定的過程,同時它也是確定調查對象,即它的內涵、外延及數量的過程。這種界定要與研究目標及要求相符合,并且要具有理論依據。例如前面提到過婦女生育力的研究,其研究總體被界定為“15—49歲的婦女”,因為理論上認為這一年齡段的婦女具有生育能力。在一些情況下,研究總體就是實施調查的總體,這時研究總體與調查總體一致,但在另外一些情況下,研究總體不等于調查總體,后者只是它的一部分,在這種情況下,調查總體的結論是否適用于研究總體要進行必要的討論,否則會導致錯誤的結果。1936年美國《文學摘要》所進行的總統選舉的民意測驗的失敗就是這種錯誤的一個著名的例子。
有些調查,也許理論上可以對研究總體作出界定,例如借助廣播、電視、雜志或報紙進行的調查,理論上其聽眾和讀者就是研究總體,但是由于不知道這個總體的范圍,因此從中選取的不是隨機樣本,加上往往不了解這個總體的特性,因而不可能確定樣本的質量,即樣本是否代表了總體,如果這時推論總體,就會發生錯誤。
由上所述可以看出,為了組織有根據的抽樣研究,必須根據研究對象的社會學性質界定研究總體與調查總體,并掌握有關總體的社會情況。在實際中如何選擇研究與調查總體以及用何種標準去選擇呢?一般應從理論與實踐兩個方面考慮。理論上要考慮的是:(1)典型性,例如選擇一典型企業進行組織研究;(2)與某一理論相一致(選擇時要首先考慮它有可能證實理論); (3)反駁或修改一種理論(選擇時首先考慮它有可能是“偏差”理論); (4)選擇過去曾作過研究的研究或調查總體(重復實驗、估價變化與反應); (5)選擇過去未研究過的總體(希望發現新理論)。實踐的考慮是:(1)方便性(例如選擇家鄉); (2)易于得到資料(例如在研究中官方記錄可用); (3)考慮應用性;(4)合作的需要或同意做研究(例如在監獄中的研究)。
在確定了調查總體和抽樣單位后,就要編制抽樣框,即將總體按抽樣單位劃分為各部分,這些部分必須互不重疊且能合成總體,然后毫無遺漏地編號排列成表,每個抽樣單位唯一地與表上的一個號碼相對應。對于不同類型的總體,抽樣框的形式也有多種。在學校、企業、機關等正規社會組織中進行抽樣時,可以利用現成的人員花名冊;而在某一個地理區域內抽樣時,常可使用人口普查資料編制抽樣框。抽樣框是概率抽樣一個最基本的要求,它的質量關系著抽樣的質量。在實際抽樣時,得到一個好的抽樣框往往既困難又麻煩,需要具備一定的技巧并采取認真細致的態度。例如當總體范圍太大時,如果沒有現成的抽樣框,就需要編制一個新的抽樣框,這往往要花費巨大的人力、物力,如編制一份北京市全體60歲以上老人的清單。有時可能會有一現成的抽樣框,但它們可能已經過時,例如1983年人口普查時已得到一份北京市60歲以上老人的清單,但1989年調查時由于一部分人新進入這一總體,一部分人已死亡,這份清單已經過時,這時應把清單進行整理或稍微修改總體定義。此外,在復雜的多階段抽樣中,相應各個階段要有多個抽樣框。
2.設計和抽取樣本。設計包括兩部分,一是確定樣本所含個體的數目,二是選擇抽樣的具體方法。樣本所含個體數目的多少與抽樣方法均對樣本代表性有重大影響。本章我們專辟兩節討論這兩個問題。樣本大小和抽樣方法確定后,便實際進行抽樣。
3.評估樣本與對總體進行估計。抽樣的目的不是說明樣本本身的情況,而是通過樣本推斷和說明總體。因此,樣本對于總體的代表性問題始終是抽樣中關注的中心問題。衡量樣本質量主要有兩個標準,即準確性和精確性。
準確性 所謂樣本準確性是指樣本沒有偏差。偏差也稱系統誤差,它可能來源于多種原因,其中主要有:(1)抽樣程序的缺點,即未能嚴格遵循隨機原則。例如所使用的抽樣框不完整或已過時;或抽取樣本時摻入了主觀判斷因素等。(2)無回答,無回答是樣本偏差的主要來源之一。一個樣本一經抽定,就應嚴格按選定的調查對象進行調查。但在實際調查中,有時在調查現場找不到被選定的人,或調查對象拒絕調查或對某些問題拒絕回答。這些無回答者往往具有某種特征,例如關于家庭收支調查,那些高收入者往往拒絕回答收入情況的問題;又如在外面做工的人往往無法調查到。這就使實際調查的樣本與被抽出的樣本產生偏差。事實上一個包含比初始選定的單位少于80%的樣本幾乎肯定地是有偏差的,在這種情況下應通過二訪、三訪或其他手段提高回答率。
精確性 樣本精確性是指抽樣誤差的大小。如前面所述,抽樣誤差是抽樣這種方法所固有的誤差,是隨機誤差。抽樣誤差可以定量進行估計,因此研究人員對于抽樣誤差的估計具有很大的主動性。
從理論上講,如果能嚴格遵照隨機原則和抽樣程序,并提高回答率與問卷回收率,就可以得到一個無偏即準確性很高的樣本,但實際上是很難做到完全無偏的,而且沒有確定的數學模型從資料內部對樣本的偏差進行測量,這給我們對樣本代表性的評估帶來了很大困難。但是由于有技術和有經驗的抽樣專家可以最大限度地減少偏差,因此可以假設這種情況下抽取的樣本是無偏的,這時就可以用抽樣誤差對樣本進行評估。
對樣本的評估分為兩個階段,即正式調查前和調查結束后,后者是計算抽樣誤差并由樣本統計值推論總體參數值等。本節我們主要介紹前一階段的樣本評估方法,調查后的樣本評估和對總體的估計將在“統計分析”一章詳細介紹。
在依確定了的樣本規模和抽樣方法抽出樣本后,應先對抽出的樣本進行評估,其目的是初步檢查樣本對于總體的代表性,以剔除那些偏差太大的樣本,重新抽樣。評估可以采取收集若干容易得到的資料,例如年齡、性別、文化程度等作為樣本與總體之間的比較的方法。下面舉例加以說明。比如我們要抽樣調查某一小鎮上的家庭平均人口和每月平均消費水平。已經從全鎮1000戶家庭中抽取了100戶作樣本。這時可在正式調查之前先收集一些容易取得的資料,例如全鎮人口的性別比率為107,而抽取的100戶中人口性別比率為105;又如從其他報表上得知全鎮家庭中有28%大戶(3人以上),56%小戶(2人與3人戶), 16%為單身戶。而在抽出的100戶中相應家庭的比例為25%、60%、15%。由上述總體與樣本之間人口性別比例與家庭結構比例的比較中,我們就可以看到所抽樣本與總體情況相似。這樣的樣本就有代表性,能在平均人口與消費量的調查推論中獲得可靠結論。如果兩者資料相差甚多,則表明前面的步驟中有問題要檢查、修正。一般地說,比較的變量越多,樣本越可靠。
樣本評估目前在規范化的社會調查研究報告中已成為一項不可缺少的指標。