官术网_书友最值得收藏!

第五節(jié) 樣本容量的確定

樣本容量又稱樣本大小、樣本規(guī)模,指的是樣本內(nèi)所含個體數(shù)量的多少。樣本容量的確定是抽樣設(shè)計的最重要的內(nèi)容之一。樣本大小不僅影響其自身的代表性,而且還直接影響到調(diào)查的費用和人力的花費,太大的樣本會浪費人力、財力,增加工作量,甚至難以完成;太小的樣本則會減少調(diào)查的效果。因此樣本大小“適當(dāng)”是非常重要的,適當(dāng)?shù)臉颖疽姥芯磕康暮涂傮w性質(zhì)而定,并且還受制于客觀條件以及抽樣方法等,樣本容量的確定是對上述幾方面綜合考慮的結(jié)果。

(一)研究的精確度要求與樣本容量

研究的目的往往要求通過樣本得到對總體的估計,例如通過一部分婦女生育力水平估計全國婦女的生育力水平。在研究目的是由樣本得到對總體的估計時,首先要依研究的目的對這種估計所允許的誤差大小做出規(guī)定,即確定抽樣的精確度。允許誤差(精確度)等于抽樣誤差與概率度t的乘積,t值取決于研究所要求的置信水平,可從t分布表中查出置信水平與概率度成正比。因此當(dāng)置信水平確定后,允許誤差實際上就是允許抽樣誤差。由重復(fù)簡單隨機抽樣的誤差公式可知,抽樣誤差與樣本大小密切相關(guān),樣本越大,越接近總體,抽樣誤差越??;反之,樣本越小,與總體差異越大,誤差越大。因此樣本大小視研究所要求的精確度,即允許誤差與置信水平而定,對樣本的精確度要求越高,所允許的誤差則越小,樣本就應(yīng)越大,反之亦然。下表是在1 %到7%的允許誤差和兩種置信水平下,簡單隨機抽樣所需樣本數(shù)。轉(zhuǎn)引自于真等:《當(dāng)代社會調(diào)查研究科學(xué)方法與技術(shù)》,工人出版社1988年版。

(二)總體性質(zhì)與樣本容量

總體性質(zhì)包括兩個方面:總體規(guī)模與總體異質(zhì)程度。由上面的討論可知,抽樣誤差與樣本大小密切相關(guān),樣本越大,越近總體,抽樣誤差越小,反之抽樣誤差越大。因此,在一定精確度要求下,總體越大者其樣本要求亦應(yīng)越大。但這種情況僅僅在一定程度上是正確的,當(dāng)總體規(guī)模增大時,必需的樣本容量并不同它保持同樣的增長速度,如圖7.2所示,對一組已知的條件(總體可信度、方差、誤差界限等等)來說,當(dāng)總體規(guī)模從1000增大到500,000或更大時,樣本必需量有所增長,但當(dāng)總體規(guī)模達(dá)到足夠大時,樣本的必需量相對于總體來說,只是受到較小影響,實際上規(guī)模在10,000以上的總體,樣本必需量是相當(dāng)接近的(參見圖7.2)引自﹝美﹞林楠:《社會研究方法》,農(nóng)村讀物出版社1987年版。。因此,所要調(diào)查的總體規(guī)模越大,使用抽樣調(diào)查越經(jīng)濟合算。

圖7.2 不同的總體規(guī)模所需的樣本數(shù)量

重復(fù)簡單抽樣的平均抽樣誤差公式表明,抽樣誤差還與σ2有關(guān),σ2為總體方差,它是衡量總體內(nèi)個體間差異程度的指標(biāo),因此,當(dāng)精確度要求一定時,樣本所需容量除受總體規(guī)模的影響外,還受總體內(nèi)部異質(zhì)程度的影響,總體內(nèi)部異質(zhì)程度越低,所需樣本容量越小,相反總體內(nèi)部異質(zhì)程度越高,所需樣本容量越大,這點是容易想象的。由此可見,為了獲得“適當(dāng)”的樣本規(guī)模,對總體的了解是必不可少的。

根據(jù)精確度的定義和簡單隨機抽樣的抽樣誤差公式,可得允許誤差(抽樣精確度)t·,用Δ表示精確度則。因此,當(dāng)確定了精度要求和概率度后,由于總體的異質(zhì)程度,即σ2是未知的,n仍無法確定,為此常采用以下辦法:(1)通過以往曾進(jìn)行的同類調(diào)查的資料估算σ2。(2)由專家提供有關(guān)信息,據(jù)此進(jìn)行估計。(3)進(jìn)行試調(diào)查,以取得必要信息來估計σ2。

(三)分析要求與樣本容量

許多社會研究,其目的不只是了解總體特征,而且還想了解總體中某些部分的特征,或者想了解各種變量間的真實關(guān)系,這時如果樣本過小,則某些類別的子樣本就可能由于調(diào)查對象太少而無法進(jìn)行分析。因此在確定樣本大小時,應(yīng)當(dāng)估計一下在分析時樣本需做哪些分類,并保證每個類別有一個能夠統(tǒng)計分析的子樣本,相關(guān)分析和其后的檢驗方法要求每一小類的子樣本容量不得小于10。

研究所要求的分析程度不同,它需要的樣本大小亦不同。例如回歸分析中樣本大小要依自變量的個數(shù)增減。

通常大多數(shù)調(diào)查收集不止一個項目的信息資料,當(dāng)項目很多時,應(yīng)對其中最重要的一些項目分別確定精度要求,然后逐項確定這些項目所需子樣本的大小。這時可能各項目的子樣本大小相差不多,如此便選其中容量最大的一個作為總體樣本容量。但有時各子樣本相差很多,這時可降低某些項目的精確度要求或取消這些項目。

(四)抽樣方法與樣本容量

在同樣的精確度要求下,樣本容量還因所選擇的抽樣方法不同而不同,每一種抽樣方法都有自己計算樣本容量的公式。因此在選定抽樣方法后,需分別考察和計算這一方法所需樣本數(shù)。

(五)無回答與樣本容量

在調(diào)查過程中,由于調(diào)查對象未找到或拒絕訪問等原因,實際上最終收集到的樣本數(shù)與理論決定的樣本數(shù)不同。再有,即使是全參與分析的樣本,也因?qū)ζ渲懈鱾€問題的回答率不同而在不同項目上顯示出不同的樣本規(guī)模,在確定樣本大小時,亦應(yīng)將這些情況考慮進(jìn)去。例如初步確定的樣本容量是1000,但估計可能有20%的無回答,則實際調(diào)查所用的樣本容量應(yīng)為

(六)經(jīng)費與樣本容量

最后,在樣本大小按上述考慮確定后,還要看看樣本規(guī)模是否與準(zhǔn)備用于調(diào)查的現(xiàn)有人力、物力、財力、時間等條件相適應(yīng),有時由于上述條件的限制或抽樣操作上的困難,必須縮小樣本,那么,就需作出選擇:是減少樣本規(guī)模,但達(dá)不到所要求的精確度;還是增加調(diào)查力量,以保證樣本的精確度,或是干脆放棄這次調(diào)查。

由上面的介紹可以看出,樣本容量的確定要受到各種因素的制約,這些因素往往是相互對立的,例如為了提高樣本的代表性,我們往往希望一個大樣本,但樣本越大,雖然抽樣誤差減小了,非抽樣誤差卻可能大大增加,經(jīng)費也要增多。又如采用多階段整群抽樣,由于樣本集中,雖然可以節(jié)約大量經(jīng)費,但樣本的代表性則會降低,要提高樣本精確度,則要增加樣本容量。實際上在設(shè)計樣本規(guī)模時,精度要求與費用、抽樣誤差與非抽樣誤差始終是兩對難于處理的矛盾。隨著抽樣理論的發(fā)展和抽樣調(diào)查的廣泛應(yīng)用,其中有些成功的經(jīng)驗逐漸成為樣本設(shè)計的依據(jù)。例如美國的民意測驗,樣本數(shù)一般在1600—2000人之間,最多不超過3000人,而最重要的全國調(diào)查則在15萬—20萬之間。在一般的社會調(diào)查研究中,實際上并不要求很高的精確度,調(diào)查人員一般是憑經(jīng)驗確定樣本容量的大致范圍,下表給出了經(jīng)驗確定樣本容量的大致范圍,僅供參考。

經(jīng)驗確定樣本數(shù)的范圍

應(yīng)當(dāng)指出的是,由經(jīng)驗確定的樣本調(diào)查,其結(jié)果不能推論總體,只能作為了解總體狀況的參考。要想精確地推論總體的狀況,不僅要對代表性進(jìn)行檢驗,而且要檢查抽樣方法是否科學(xué)。精確的抽樣調(diào)查需要抽樣專家和專業(yè)研究人員的嚴(yán)格指導(dǎo)。

主站蜘蛛池模板: 武乡县| 绥芬河市| 合阳县| 乌拉特前旗| 江陵县| 尼玛县| 凯里市| 常熟市| 蓝田县| 定安县| 瓦房店市| 万全县| 衡水市| 海城市| 宜良县| 金门县| 沛县| 和静县| 克拉玛依市| 达孜县| 亳州市| 石嘴山市| 秦安县| 齐齐哈尔市| 望江县| 金阳县| 临安市| 马山县| 简阳市| 湘乡市| 丰顺县| 新晃| 澳门| 永胜县| 星座| 淅川县| 宁武县| 高阳县| 邯郸市| 宁蒗| 桐梓县|