4.7 數據的加權
數據加權是指在統計分析過程中,不同個案定義不同的權數。加權變量的數值表示數據文件中個案觀察值的頻數。當加權值為0、負值或缺失值時的個案不參與分析,正的小數可以為加權值。
當執行加權后,該加權變量一直作用到改變權變量或停止加權之前。保存加權的數據文件,其加權信息也一并被保存,可以在任何時候改變加權變量或關閉加權功能。
下面舉一個例子,說明加權操作的基本方法。
(Rutherford放射性粒子數實驗)Rutherford進行了著名的實驗,觀測在固定的時間間隔內,放射性物質放射出的粒子個數。共進行了N=2608次觀測,觀測時間間隔為7.5s,Rutherford放射性粒子實驗數據如表4.3所示。其中k為粒子數,Nk為相應出現的次數。指定加權變量,并畫出粒子數出現頻數的直方圖。(數據文件:weight.sav)
表4.3 Rutherford放射性粒子實驗數據

數據加權操作的基本步驟如下:
step 1 根據表4.3,在SPSS數據編輯窗口,創建名為weight.sav的數據文件。變量名分別為K和NK,表示時間間隔的粒子數和粒子數的頻數。
step 2 在數據編輯窗口,選擇菜單“Data”→“Weight Cases”(個案加權)命令,打開“Weight Cases”對話框,如圖4.24所示。

圖4.24 “Weight Cases”對話框
step 3 選擇是否對個案進行加權操作。對話框中包含兩個單選框:
◆ Do not weight cases不對個案加權。為默認選項。
◆ Weight cases by對個案加權。這時,“Frequency Variable”(頻數變量)窗口變為可用。在左側的變量列表框中指定頻數變量,單擊右向箭頭按鈕,將其移動到“Frequency Variable”框中。本例選擇變量NK為頻數變量。
step 4 單擊“OK”按鈕,執行個案加權。
step 5 選擇菜單“Analyze”→“Descriptive Statistics”→“Frequencies”命令,打開如圖4.25所示的“Frequencies”(頻數)對話框。在變量列表框中選擇變量“NK”,單擊右向箭頭按鈕,將變量移動到“Variable(s)”(變量)對話框。

圖4.25 “Frequencies”(頻數)對話框
step 6 單擊“Charts”按鈕,打開“Frequencies:Charts”(頻數分析:圖形)子對話框,選擇“Histograms”(直方圖)選項,然后單擊“Continue”按鈕,返回至“Frequencies”對話框。
step 7 單擊“OK”按鈕,執行頻數分析操作。在輸出窗口中,得到放射性物質粒子數直方圖,如圖4.26所示。
關于描述性統計分析的頻數模塊,將在基本統計分析一章中詳細解釋。

圖4.26 放射性物質粒子數直方圖
step 8 “Paste”得到的Syntax語句程序如下:
/* 加權操作. WEIGHT BY NK . /* 頻數分析. FREQUENCIES VARIABLES=NK /HISTOGRAM /ORDER= ANALYSIS .