4.4 數(shù)據(jù)文件的拆分
在進(jìn)行數(shù)據(jù)管理和統(tǒng)計(jì)分析時(shí),經(jīng)常需要將文件中的數(shù)據(jù)按變量進(jìn)行分組分析。例如,在教師基本情況調(diào)查表中,需要統(tǒng)計(jì)出具有“教授”職稱的教師,其年度發(fā)表論文的平均值和科研經(jīng)費(fèi)總數(shù)。但是,由于具有不同職稱的教師的相關(guān)數(shù)據(jù)都在同一個(gè)數(shù)據(jù)文件中。因此在進(jìn)行分析時(shí),應(yīng)該對(duì)數(shù)據(jù)文件按照“職稱”變量進(jìn)行拆分。
拆分文件并不是將原文件拆分成兩個(gè)或多個(gè)獨(dú)立文件,而是對(duì)原文件按照某種變量值重新排序,但又和之前所述的數(shù)據(jù)排序不同,因?yàn)閿?shù)據(jù)的拆分對(duì)后續(xù)的統(tǒng)計(jì)分析有很大的影響,后續(xù)分析將按照分組進(jìn)行。
在數(shù)據(jù)編輯窗口讀入數(shù)據(jù)(數(shù)據(jù)文件:data2.sav)后,可以按照下面給出的拆分?jǐn)?shù)據(jù)文件的基本步驟進(jìn)行操作:
step 1 打開主對(duì)話框。
選擇菜單“Data”→“Split Files”命令,打開“Split File”(拆分文件)對(duì)話框,如圖4.9所示。

圖4.9 “Split File”(拆分文件)對(duì)話框
step 2 選擇文件拆分方式。
在“Split File”對(duì)話框中,首先選擇文件拆分方式:
◆ AnaIyze aII cases,do not create groups分析所有個(gè)案,但不創(chuàng)建分組。默認(rèn)選項(xiàng)。選擇該項(xiàng),表示分析所有個(gè)案,不進(jìn)行拆分。若選則該項(xiàng),下面的分組信息將呈灰色顯示,不可用。
◆ Compare groups比較分組。選擇該項(xiàng),表示將分組統(tǒng)計(jì)結(jié)果輸出到同一張表格中,以便進(jìn)行不同組之間的比較。一般選擇此項(xiàng)。
◆ Organize output by groups輸出結(jié)果按組分開組織。選擇此項(xiàng),表示將分組統(tǒng)計(jì)結(jié)果分別輸出到不同的表格中。
若選擇“Compare groups”或“Organize output by groups”單選項(xiàng),則其下面的變量分組選擇窗口“Groups Based on”(分組基于)將變?yōu)榭捎谩T谧筮呑兞苛斜碇羞x擇一個(gè)以上的分組變量,通過單擊右向箭頭按鈕,將其移動(dòng)到“Groups Based on”窗口。本例選擇的分組變量是“職稱”。
如果數(shù)據(jù)編輯窗口中的數(shù)據(jù)已經(jīng)事先按所指定的拆分變量進(jìn)行了排序,則可以選擇“File is already sorted”(文件已經(jīng)拆分)選項(xiàng);否則,選擇“Sort the file by grouping variables”(按分組變量對(duì)文件進(jìn)行排序)選項(xiàng)。
step 3 執(zhí)行文件拆分操作。
單擊“OK”按鈕,執(zhí)行拆分?jǐn)?shù)據(jù)文件的操作。
圖4.10、圖4.11和圖4.12分別是按照“Analyze all cases,do not create groups”選項(xiàng)、“Compare groups”選項(xiàng)和“Organize output by groups”選項(xiàng)拆分文件,進(jìn)行描述性統(tǒng)計(jì)分析后得到的輸出結(jié)果。從圖中可以看出,第3個(gè)輸出結(jié)果實(shí)際上是第2個(gè)輸出結(jié)果中的表格按職稱分成了單獨(dú)的4個(gè)表格。

圖4.10 選擇Analyze all cases,do not create groups選項(xiàng)后的描述性分析結(jié)果

圖4.11 選擇Compare groups選項(xiàng)后的描述性分析結(jié)果

圖4.12 選擇Organize output by groups選項(xiàng)后的描述性分析結(jié)果
拆分后的文件如果保存修改文件,則在下次調(diào)用該數(shù)據(jù)文件時(shí),分組信息仍起作用。當(dāng)不需要分組信息時(shí),可以按上述拆分文件的步驟,選擇默認(rèn)選項(xiàng)“Analyze all cases,do not create groups”,即可消除分組信息。
step 4 “Paste”得到的Syntax語句程序如下:
/* 拆分文件后在同一表格顯示結(jié)果的命令語句Compare groups. SORT CASES BY 職稱 . SPLIT FILE LAYERED BY 職稱 . /* 拆分文件后在不同表格顯示結(jié)果的命令語句Organize output by groups. SORT CASES BY 職稱 . SPLIT FILE SEPARATE BY 職稱 .
- 走進(jìn)奇妙的數(shù)學(xué)世界(小學(xué)一二年級(jí))
- 仿真模型可移植性規(guī)范及其應(yīng)用
- 奧妙的數(shù)學(xué)問答
- 數(shù)學(xué)建模:算法與編程實(shí)現(xiàn)
- 這才是好看的數(shù)學(xué)
- ANSYS 18.0有限元分析基礎(chǔ)與實(shí)例教程
- 我的第一本趣味數(shù)學(xué)書2
- Mastering Ethereum
- 10堂極簡概率課
- 代數(shù)的歷史:人類對(duì)未知量的不舍追蹤(修訂版)
- 計(jì)算進(jìn)化史:改變數(shù)學(xué)的命運(yùn)
- ABAQUS 2018有限元分析從入門到精通
- 認(rèn)識(shí)無窮的八堂課:數(shù)學(xué)世界的冒險(xiǎn)之旅
- 數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí):數(shù)學(xué)與統(tǒng)計(jì)方法
- 復(fù)分析:可視化方法