少林足球后卫

第4章 SPSS數據的管理

本章包括

◆ 數據的排序

◆ 數據的轉置

◆ 重復個案的識別

◆ 數據文件的拆分

◆ 數據文件的合并

◆ 數據的加權

可以對通過數據編輯窗錄入和編輯的數據形成的數據文件，進行簡單的統計分析。但是在很多情況下，SPSS的分析過程往往對數據有特殊的要求，需要預先對數據文件進行進一步的加工和處理才能順利地調用相應的統計分析過程。

本章主要介紹一些數據的整理、分類、變換和數據轉換的方法，這些方法是進行數據分析的基礎。數據文件的管理主要用到主菜單中的“Data”菜單和“Transform”菜單。

在SPSS數據管理中，經常會要求對數據的某些變量進行排序處理，例如對數據文件進行拆分、選擇等操作。下面給出排序操作的基本步驟：

step 1 打開個案排序對話框。

選擇菜單“Data”→“Sort Cases”命令，顯示如圖4.1所示的“Sort Cases”（個案排序）對話框。

圖4.1 “Sort Cases”（個案排序）對話框

step 2 選擇排序變量。

在對話框的左側變量列表框中選擇主排序變量，單擊右向箭頭按鈕，將該變量移動到“Sort by”窗口中，并在“Sort Order”框中選擇變量的排序方式，該窗口給出了兩種排序方式：

◆ Ascending升序排序。選擇該項，表示將所選變量的大小按從小到大的順序對數據文件中的個案進行排序。

◆ Descending降序排序。選擇該項，表示將所選變量的大小按從大到小的順序對數據文件中的個案進行排序。

如果是多重排序，還要依次指定第二、第三排序變量及相應的排序方法。方法是用鼠標選擇“Sort by”窗口的變量，然后選擇排序方式。

設置完畢后，單擊對話框中的“OK”按鈕，數據編輯窗口中的數據便自動按用戶指定的順序重新排列顯示。

對于數據的排序操作，需要說明以下幾點：

◆ 數據排序是整行數據排序，而不是只對某列變量排列。

◆ 多重排序中指定排序變量的次序很關鍵。排序時先指定的變量優于后指定的變量。多重排序可以在按某個變量值升序（或降序排列）排列的同時，再按其他變量值的降序（或升序）排序。

◆ 數據排序以后，原有數據的排列次序將被打亂。因此在時間序列數據中，如果數據中沒有標識（如年份、月份、季度等），則應注意保留數據的原始排列，以免發生混亂。

表4.1是大學教師基本情況問卷調查統計表的前20個數據。利用SPSS排序操作，找出年齡最大和最小的個案。（數據文件：data2.sav）

表4.1 大學教師基本情況問卷統計表的前20個數據

圖4.2為按年齡（升序）排序后的結果，從圖中可以看出，在給定的20名教師名單中，年齡最大者為57歲，最小者為21歲。

圖4.2 按年齡排序（升序）結果

還可以通過在主對話框中單擊“Paste”按鈕，在Syntax語句窗口得到命令語句程序：

      /＊ 按升序排列.
      SORT CASES BY
        年齡 (A) .

      /＊ 按降序排列.
      SORT CASES BY
        年齡 (D) .