3.2 SPSS數(shù)據(jù)文件的構(gòu)成
創(chuàng)建數(shù)據(jù)文件是進(jìn)行統(tǒng)計(jì)分析的首要步驟。SPSS提供了豐富的數(shù)據(jù)結(jié)構(gòu)和多種創(chuàng)建SPSS數(shù)據(jù)文件的方法,本節(jié)將介紹SPSS數(shù)據(jù)文件的結(jié)構(gòu)和創(chuàng)建方法,同時,對數(shù)據(jù)文件的編輯和不同格式數(shù)據(jù)之間的轉(zhuǎn)換也是本節(jié)討論的重點(diǎn)。
3.2.1 SPSS數(shù)據(jù)文件的結(jié)構(gòu)
SPSS的數(shù)據(jù)文件由數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)內(nèi)容兩部分構(gòu)成。SPSS的數(shù)據(jù)結(jié)構(gòu)規(guī)定了數(shù)據(jù)文件的基本構(gòu)成屬性。主要包括數(shù)據(jù)文件的所有變量以及變量的特征。一個完整的SPSS數(shù)據(jù)結(jié)構(gòu)應(yīng)包括變量名、變量類型、變量名標(biāo)簽、變量值標(biāo)簽、缺失值的定義、度量尺度以及數(shù)據(jù)的顯示屬性,即顯示寬度、列寬度和對齊方式等。
例如,某班學(xué)生研究生考試成績表包含姓名、考號、各科科目成績(英語、高數(shù)、政治、專業(yè)課)6個變量,對每一個變量定義其屬性,如“姓名”變量定義為字符型變量,寬度定義為8(4個漢字),度量尺度為定類型變量,由于變量含義很清楚,所以不需要定義變量名標(biāo)簽和變量值標(biāo)簽,缺失值默認(rèn)為零。
3.2.2 SPSS數(shù)據(jù)文件中的個案
在SPSS數(shù)據(jù)編輯窗口的二維表中,每列表示一個變量的所有的取值,而每行則代表了數(shù)據(jù)文件的一個記錄。在統(tǒng)計(jì)學(xué)理論中稱之為個隨機(jī)樣本的一個“隨機(jī)事件”;在SPSS菜單中稱之為“Cases”,即“個案”,很多場合也稱為一個“記錄”。
一個數(shù)據(jù)文件是由眾多的個案構(gòu)成的。一個個案中,會有很多個變量的取值,個案中每一個變量的相應(yīng)取值稱之為一個觀測值,在SPSS中用“Case”表示。Case實(shí)際上也就是一個變量值,在SPSS數(shù)據(jù)窗口中表現(xiàn)為一個單元格。
如某個學(xué)生的數(shù)學(xué)成績就是一個“Case”,或一個觀測值;某一個學(xué)生的姓名、學(xué)號和各科成績構(gòu)成了數(shù)據(jù)文件的一個個案,全體個案形成了數(shù)據(jù)的內(nèi)容。在數(shù)據(jù)編輯窗口“Data View”(數(shù)據(jù)視窗)視區(qū)中,利用一個二維數(shù)表描述了多個學(xué)生的成績表,從而形成SPSS數(shù)據(jù)文件的內(nèi)容。
3.2.3 創(chuàng)建SPSS數(shù)據(jù)文件
3.2.3.1 基本操作
創(chuàng)建SPSS數(shù)據(jù)文件需要完成兩個主要步驟:
step 1 在“Variable View”(變量視窗)視區(qū)定義變量及其變量的屬性。
step 2 在“Data View”(數(shù)據(jù)視窗)視區(qū)錄入數(shù)據(jù)文件的內(nèi)容,此內(nèi)容將在數(shù)據(jù)文件的錄入和編輯一節(jié)詳述。
瀏覽數(shù)據(jù)文件的變量名的3種方法:
◆ 在“Variable View”(變量視窗)視區(qū)中瀏覽。
◆ 在SPSS菜單項(xiàng)中選擇菜單“Utilities”→“Variables”命令,顯示如圖3.11所示的“Variables”變量信息對話框。該對話框中出現(xiàn)了該數(shù)據(jù)文件所有的變量名及其定義的屬性。

圖3.11 “Variables”變量信息對話框
◆ 在SPSS主界面中選擇菜單“File”→“Display Date File lnformation”(顯示數(shù)據(jù)文件信息)→“Working File”命令,則以“File lnformation”(文件信息)輸出窗口的形式顯示變量名及其變量屬性,如圖3.12所示。

圖3.12 “File lnformation”(文件信息)輸出窗口
3.2.3.2 利用Define Variable Properties(定義變量屬性)對話框定義變量屬性
利用“Variable View”視區(qū)提供的值標(biāo)簽對話框,定義和修改變量的值標(biāo)簽等信息,不夠直觀和簡練。這里介紹的“Define Variable Properties”對話框可以快速而直觀地顯示、定義并且修改分類變量的值標(biāo)簽和其他變量信息。
基本操作步驟:
step 1 選擇菜單“Data”→“Define Variable Properties”命令,打開“Define Variable Properties”(定義變量屬性)對話框,如圖3.13所示。

圖3.13 “Define Variable Properties”(定義變量屬性)對話框
step 2 變量類型應(yīng)該是數(shù)值型或者短字符型變量。對話框中左側(cè)是變量列表框,單擊箭頭按鈕,選擇左側(cè)要修改和編輯的變量名,將其移動至右側(cè),也可以一次將全部變量移動至右側(cè)。
長字符型變量(寬度超過8個字符的變量為長字符型變量)不出現(xiàn)在變量的列表框中。長字符型變量不能定義值標(biāo)簽或缺失值類型。
step 3 圖3.13的下方有一多選框“Limit number of cases scanned to”(限制搜索個案的數(shù)量),如需要指定搜索個案的數(shù)量,則選擇該選項(xiàng),并在右側(cè)輸入搜索個案的數(shù)量。當(dāng)數(shù)據(jù)文件含有大量個案時,限制搜索個案的數(shù)量會減少操作時間。如果不選擇該項(xiàng),則系統(tǒng)自動默認(rèn)值為99。
step 4 圖3.13下方的另一多選框“Limit number of values displayed to”(顯示個案數(shù)量的限制),默認(rèn)選擇是指定該項(xiàng),默認(rèn)值為200,也可修改該選項(xiàng)。因?yàn)楫?dāng)定距型變量(如連續(xù)區(qū)間)中包含有大量個案(如數(shù)十萬)時,在屏幕上顯示所有的數(shù)據(jù)顯然會占用大量內(nèi)存,使得操作變慢,這時應(yīng)規(guī)定顯示變量值的數(shù)量。
step 5 單擊“Continue”按鈕,確認(rèn)選擇,彈出如圖3.14所示的“Define Variable Properties”主對話框。

圖3.14 “Define Variable Properties”主對話框
step 6 在“Define Variable properties”主對話框中,在左側(cè)變量列表框中選擇需要創(chuàng)建的值標(biāo)簽、以及定義和修改其他變量屬性的變量名。
step 7 選擇變量后,對話框右側(cè)會顯示一個二維數(shù)表,數(shù)表中給出了該變量搜索范圍內(nèi)的所有不同的值及其相應(yīng)值標(biāo)簽,若該變量值沒有定義值標(biāo)簽,則Label列的相應(yīng)位置為空白。可在出現(xiàn)的變量值標(biāo)簽二維表格“Label”欄中輸入或者修改該變量值的標(biāo)簽。
step 8 如果需要創(chuàng)建值標(biāo)簽的變量值沒有顯示在列表中,則可以在Value列中最后一個空白記錄處輸入變量值,同時在右邊的Label列中輸入相應(yīng)的值標(biāo)簽。
step 9 對于每一個顯示變量,均重復(fù)上述過程,直至全部設(shè)置完畢。
step 10 單擊“OK”按鈕,使上述設(shè)置生效。
- Foundations of Blockchain
- 世界是隨機(jī)的:大數(shù)據(jù)時代的概率統(tǒng)計(jì)學(xué)
- 一定要懂博弈論
- Ethereum Smart Contract Development
- 數(shù)學(xué)實(shí)驗(yàn)教程
- 高等數(shù)學(xué)(下冊)
- 隨機(jī)數(shù)學(xué)及其應(yīng)用
- 基于變分法的細(xì)胞演化建模
- 實(shí)用高等數(shù)學(xué)
- 微積分Ⅱ
- 基于ANSYS的信號和電源完整性設(shè)計(jì)與分析(第2版)
- 咖啡時間聊數(shù)學(xué)
- 不可思議的自然對數(shù)
- 萊布尼茲微積分
- 高等數(shù)學(xué)(上冊)