官术网_书友最值得收藏!

  • SPSS寶典
  • 張慶利等編著
  • 3834字
  • 2018-12-27 10:35:28

3.6 數據文件的操作

在利用各種統計工具進行數據處理和統計工作的過程中,由于軟件工具的差異,數據的存儲格式會有很大的不同。不同的統計工具讀入不同的數據文件的格式也會不同。例如,在倉儲的管理部門,會利用Excel電子表格的xls格式保存數據,財務部門很有可能將員工的工資信息保存在數據庫文件中。這就存在不同數據格式文件的交換問題。SPSS軟件提供了多種不同數據格式的讀取和保存方式,甚至可以從不同格式的文本文件中方便地讀取數據;另一方面,經SPSS軟件處理的數據也可以保存為其他格式的數據文件。

3.6.1 創建和讀取SPSS數據文件

創建SPSS數據文件,最直接的辦法是通過SPSS的數據編輯窗口定義變量,并輸入數據。這方面內容前幾節已有詳述。除了直接創建SPSS數據文件以外,還可以通過打開不同格式的數據文件,間接創建SPSS數據文件。

3.6.1.1 打開一個已存在的數據文件

step 1 在SPSS主界面,選擇菜單“File”→“Open”→“Data”命令,打開“Open Data”(打開數據源)對話框,如圖3.21所示。

圖3.21 “Open Data”(打開數據源)對話框

step 2 在打開數據源對話框中,選擇打開文件類型。方法是單擊對話框上的“Files of type”(文件類型)下拉列表框中的黑色向下箭頭,顯示SPSS能夠識別的所有數據格式列表,從中選擇文件類型。

step 3 在“Look in”(查找范圍)下拉菜單中,選擇所要打開數據文件的位置,單擊“Open”(打開)按鈕。

SPSS可以讀取的數據文件類型主要有Excel格式文件、dBASE格式文件和SAS格式文件。

3.6.1.2 讀取Excel格式的文件

讀取Excel格式文件,可以利用上面介紹的打開數據文件的步驟,在圖3.21中“Files of type”(文件類型)下拉列表中選擇“Excel(*.xls)”選項,并且單擊指定的xls文件,這時,彈出如圖3.22所示“Open Data”(打開數據源)對話框。

圖3.22 “Open Data”(打開數據源)對話框

單擊“OK”按鈕,確認操作。在SPSS數據編輯窗口打開此文件。

3.6.1.3 讀取文本文件

文本格式的數據文件較常見,但由于沒有統一的格式,所以要正確地讀取文本格式的數據文件,就要增加更多的識別條件。為此,SPSS給出了區別于其他格式的識別和讀取操作規則。下面用具體示例來說明其操作。

首先建立一個名為data.txt的文本數據文件,如圖3.23所示。

圖3.23 文本數據文件

利用文本數據文件導出向導,讀取文本數據文件,操作步驟如下:

step 1 打開讀取文本數據對話框。

選擇菜單“File”→“Read Text Data”(讀取文本數據文件)命令后,顯示如圖3.24所示的文本文件選擇對話框。

圖3.24 文本文件選擇對話框

在該對話框中選擇文本數據文件的路徑和文件名,單擊“Open”按鈕,則顯示“Text lmport Wizard - Step 1 of 6”(文本文件導出向導:步驟1)對話框,如圖3.25所示。

step 2 讀取文本文件的第一步。

“Text lmport Wizard-Step 1 of 6”對話框用于指定是否套用預先設置的格式。“Does your text file match a predefined format?”(文本數據文件是否和預先給定的文件格式相匹配?)窗口給出兩個選項。如果選擇“Yes”,則需要再次單擊“Browse”按鈕,指定匹配文件;如果不是,則選擇選項“No”,該選項為默認選項。設置完畢后,單擊“Next”(下一步)按鈕,進入“Text lmport Wizard-Step 2 of 6”(文本文件導出向導:步驟2)對話框,如圖3.26所示。

圖3.25 “Text lmport Wizard - Step 1 of 6”對話框

圖3.26 “Text lmport Wizard - Step 2 of 6”對話框

step 3 讀取文本文件的第二步。

在“Text lmport Wizard - Step 2 of 6”對話框中設置變量處理方式,包括字符間隔符的表示和文本文件中第一行是否作變量名。各窗口和選項的含義如下:

“How are your variables arranged?”(變量如何處理)窗口設置變量處理方式,有兩個單選項:

DeIimited 選擇該項,表示用空格、逗號等字符分隔變量,每個個案中的變量值按相同的順序排列,但可能不在同一列中。

Fixed width 固定列寬。選擇該項,表示變量按固定格式列對齊,不需要間隔符。“Are variable names included at the top of your file?”(變量名是否被包含在文件的開頭部分)窗口用于確定是否在第一行顯示變量名,有兩個選項:

Yes 選擇該項,表示變量名顯示在第一行。

No 默認選項。選擇該項,表示不顯示變量名。

確認設置以后,單擊“Next”(下一步)按鈕,彈出如圖3.27所示的“Text lmport Wizard-Delimited Step 3 of 6”對話框。

圖3.27 “Text lmport Wizard - Delimited Step 3 of 6”對話框

step 4 讀取文本文件的第三步。

在“Text lmport Wizard - Delimited Step 3 of 6”對話框中,需要設置第一個個案顯示的行的位置,以及個案所代表的變量數。該對話框的窗口及其選項含義如下:

在“The first case of data begins on which line number?”欄中輸入數值,確定在第幾行顯示第一個個案。默認值為1。

“How are your cases represented?”窗口用于指定個案所代表的變量數,包含兩個選項:

Each Iine represents a case 默認選項。選擇該項,表示數據編輯器中的每一行代表一個個案。

A specific number of variabIes represents a case 選擇該項,表示在后面的輸入欄中輸入一個數值,確定每一個個案所代表的變量數,默認值為10。

“How many cases do you want to import?”用于設置窗口輸入的個案數,包含3個選項:

AII of the cases 默認選項。選擇該項,表示輸入所有的個案。

The first n cases 選擇該項后,需要在后面的輸入欄中輸入一個正整數,確定輸入前面的變量個數,默認值為1000。

A random percentage of cases(approximate) 選擇該項后,需要在后面的輸入欄中輸入一個數值,確定隨機地輸入一個百分比個案,默認值為10%。

確認設置后,單擊“Next”(下一步)按鈕。出現如圖3.28所示的“Text lmport Wizard-Delimited Step 4 of 6”對話框。

圖3.28 “Text lmport Wizard - Delimited Step 4 of 6”對話框

step 5 讀取文本文件的第四步。

在“Text lmport Wizard - Delimited Step 4 of 6”對話框中,需要設置變量之間的間隔類型以及顯示設置后的數據預覽效果。該對話框中各選項含義如下:

“Which delimiters appear between variables?”窗口用于確定數據之間的間隔類型,該窗口給出5種間隔類型,分別為:

Tab 默認選項。變量數據之間的間隔為表間距。

Space 變量數據之間的間隔為空格。

Comma 變量數據之間的間隔為逗號。

SemicoIon 變量數據之間的間隔為半個列寬。

Other 選擇該項后,需要在后面的輸入欄中輸入數值,以確定變量數據之間的間隔的空格數。

“What is the text qualifier?”窗口用于確定文本中的分隔符,包含4個選項:

None 不選。

SingIe quote 單引號。

DoubIe quote 雙引號。

Other 選擇該項,需要在后面的輸入欄中輸入其他分隔符。

確認設置以后,單擊“Next”(下一步)按鈕。彈出如圖3.29所示的“Text lmport Wizard-Step 5 of 6”對話框。

圖3.29 “Text lmport Wizard - Step 5 of 6”對話框

step 6 讀取文本文件的第五步。

在“Text lmport Wizard - Step 5 of 6”對話框中,設置關于變量名和選擇變量的操作。各個窗口及其選項含義如下:

“Specifications for variable(s) selected in the data preview”用于選擇數據預覽框中的變量名和數據類型:

VariabIe name 變量名。默認變量名形為vn,這里的n為從1開始的正整數。可以更改默認變量名,其方法是在數據預覽(Data preview)框中選擇變量名,然后在該欄處輸入更改后的變量名。

Data format 數據類型。單擊該欄處的下拉箭頭,在彈出的下拉列表中選擇數據類型,默認數據類型為數值型(Numeric)。

確認設置以后,單擊“Next”(下一步)按鈕。彈出如圖3.30所示的“Text lmport Wizard-Step 6 of 6”對話框。

圖3.30 “Text lmport Wizard - Step 6 of 6”對話框

step 7 讀取文本文件的第六步。

在“Text lmport Wizard-Step 6 of 6”對話框中,設置是否保存設置的格式,以及是否粘貼Syntax語句到Syntax窗口。各個窗口及其選項含義如下:

在“Would you like to save this file format for future use?”窗口中選擇是否保存設置的格式為外部文件。如果是,則選擇“Yes”;否則選擇“No”。

在“Would you like to paste the syntax?”窗口選擇是否將設置過程粘貼到syntax窗口。如果是,則選擇“Yes”;否則選擇“No”。

step 8 完成讀取文件的操作。

確認設置以后,若檢查前面幾個步驟沒有錯誤,并且在預覽框中能正確顯示數據項,則單擊“Finish”(完成)按鈕,結束文本數據的讀取操作;反之,可以單擊“Back”(上一步)按鈕,返回上一步驟,修改設置。圖3.31顯示的是文本文件data.txt經上述步驟轉換后的SPSS數據編輯窗口。

圖3.31 文本數據轉換后的SPSS數據編輯窗口

3.6.2 保存SPSS數據文件

3.6.2.1 保存SPSS數據文件的基本操作

保存數據就是將SPSS編輯窗口的數據以數據文件形式保存到外部存儲介質中。經SPSS數據編輯窗編輯的數據既可以保存為SPSS for Windows數據文件,也可以保存為其他數據處理軟件可以識別和打開的文件。

保存SPSS數據的操作與一般Windows界面下的文件保存操作基本相同。選擇菜單“File”→“Save”命令,或者選擇“File”→“Save as”命令。但由于不同數據文件格式的數據結構定義方式有所不同,所以,SPSS數據保存的操作與其他文件的保存方式略有不同。

在SPSS數據編輯窗口,保存數據的基本操作步驟如下:

step 1 選擇菜單“File”→“Save”命令,或者選擇“File”→“Save as”命令,彈出如圖3.32所示的“Save Data As”(文件保存)對話框。

圖3.32 “Save Data As”(文件保存)對話框

step 2 在如圖3.33所示的“Save Data As:Variables”對話框中,指定文件存儲路徑、文件類型和文件名,其方法與打開數據文件的操作完全相同。

圖3.33 “Save Data As:Variables”對話框

step 3 單擊對話框中的“Variables”按鈕,彈出“Save Data As:Variables”對話框。對話框中的“Variables”按鈕允許用戶在保存文件時,指定保存哪些變量。該對話框中顯示了當前數據文件的所有變量名,其中變量名前畫“√”的變量將被保存到磁盤中。默認選擇是保存全部變量。

step 4 在變量選擇對話框中,通過單擊相應變量名可以指定或清除該變量,也可以單擊“Keep All”按鈕,選擇全部變量;或單擊“Drop All”按鈕,清除所有變量。選定后,單擊“Continue”按鈕,返回文件保存對話框。

step 5 單擊“Save”(保存)按鈕,數據文件將按指定的類型被保存在指定路徑處。

若利用SPSS軟件打開一個其他類型的數據文件,經編輯后,無論選擇的是“Save”命令或是“Save As”命令,來保存文件,都只顯示如圖3.32所示的“Save Data As”(文件保存)對話框。

3.6.2.2 保存為其他格式的數據文件

SPSS可選擇的文件類型主要有SPSS文件、固定格式的ASCll文件,自由格式的ASCll文件、Excel文件、dBASE數據庫文件、SAS文件和Stata文件。

需要注意的是,數據文件格式的選擇對應不同版本有不同的選項。即使是同一種文件類型,其不同版本之間也存在兼容性問題,可能會發生保存的文件在其他軟件中無法打開或者丟失信息的情況。

當SPSS數據文件保存為其他類型文件時,變量名標簽、變量值標簽和缺失值的定義全部丟失(除SPSS Portable文件外)。

主站蜘蛛池模板: 蒙城县| 鄂伦春自治旗| 彩票| 灵石县| 马鞍山市| 吴川市| 通渭县| 隆子县| 伽师县| 枝江市| 东辽县| 务川| 青龙| 铜川市| 蓝田县| 安义县| 敖汉旗| 巩留县| 榕江县| 平定县| 安仁县| 新绛县| 定陶县| 策勒县| 安泽县| 陕西省| 综艺| 蓝山县| 时尚| 池州市| 渝中区| 普兰店市| 浏阳市| 宁化县| 平罗县| 互助| 兴和县| 隆安县| 平安县| 上栗县| 滨海县|