官术网_书友最值得收藏!

Stata統計分析從入門到精通

1.2 Stata 16.0窗口說明及基本設置

下載資源:\video\第1章\…

下載資源:\sample\第1章\數據1、數據1G、數據1H

1.2.1 Stata 16.0窗口說明

在正確安裝Stata 16.0以后,單擊Stata主程序的圖標文件,即可打開Stata的主界面,如圖1.1所示。

圖1.1 Stata 16.0主界面

與大部分的程序窗口類似,Stata 16.0也有自己的菜單欄、工具欄,其特色在于主界面中的5個區域:History(歷史)、Variables(變量)、Command(命令)、Results(結果)、Properties(屬性)。

· History窗口中顯示的是自本次啟動Stata 16.0以來執行過的所有命令。命令產生的來源包括兩類,一類是用戶直接在Command窗口中輸入的命令,而且無論命令是否正確(錯誤的、未被執行的命令會被加上紅色);另一類是用戶通過窗口菜單操作,Stata自動轉換得出的命令。History窗口中顯示的命令可以非常方便地被用戶調閱,用戶只需雙擊相應的命令或單擊相應的命令并按鍵盤上的Enter鍵即可再次執行該命令,當用戶需要在一次分析中反復使用同一個命令時,這一操作非常方便。但需注意的是,History窗口中顯示的這些命令都是臨時性的,關閉Stata軟件后這些命令將會消失,如果用戶想保存這些命令以便下次使用,則需要使用log命令或通過右擊進行保存。

· Variables窗口中顯示的是當前Stata數據文件中的所有變量。當用戶單擊某個變量名稱時,該變量就會在Command窗口中出現。

· Command窗口是最重要的窗口,在本窗口內可輸入準備執行的命令。

· Results窗口中顯示的是每次執行Stata命令后的執行結果(無論執行成功還是失敗),執行失敗時Stata會以紅色信息顯示。

· Properties窗口中顯示的是當前數據文件中指定的變量以及數據的性質。

各個窗口的大小都可以調節,讀者可以用鼠標進行窗口的伸縮操作。在每個窗口的右上角均有關閉按鈕,如果不小心單擊了關閉按鈕而想要恢復原來窗口的狀態,可參照如圖1.2所示的方式進行操作,單擊菜單欄中的“窗口”按鈕,在菜單中選擇想要恢復的窗口名稱即可(也可以通過菜單中顯示的快捷鍵操作,如命令窗口的快捷鍵為Ctrl+1)。

圖1.2 “窗口”菜單

注意

上面的“窗口”菜單為中文界面,在初次安裝Stata時會顯示為英文界面。關于從英文界面切換為中文界面的設置,我們將在“1.1.2 設定偏好的界面語言”中詳細講解。此處之所以提前用中文界面介紹,是為了使讀者更清晰地看到中英文窗口之間的對應關系,如History(歷史)窗口。

1.2.2 設定偏好的界面語言

Stata 16.0的MP版本允許用戶設定自己偏好的界面語言,操作方式如下:

如圖1.3所示,單擊菜單欄的“Edit|Preferences|User-interface language…”,即可彈出如圖1.4所示的Set Stata’s user-interface language對話框。

圖1.3 用于設置偏好的界面語言的菜單

圖1.4 Set Stata’s user-interface language對話框

在該對話框中,我們可以從Language下拉菜單中找出自己偏好的界面語言,具體可供選擇的語言包括英語、西班牙語、日語、韓語等。通常來說,對于偏好窗口菜單操作的國內用戶,或者Stata新用戶,可能傾向于選擇“簡體中文”,那么在下拉菜單中選擇Chinese(China)即可;而對于習慣使用命令操作、習慣Stata前期版本的老用戶來說,可能傾向于選擇“英語”,那么在下拉菜單中選擇English即可。

需要說明和強調的是,用戶設置偏好的界面語言之后,系統并不會立刻自動變成設置后的語言,而是需要先將目前的Stata窗口關閉,在重新啟動Stata后,Stata才會變成設置之后的語言。重啟之后的界面如圖1.5所示。

可以看到,在簡體中文模式的Stata 16.0主界面中,Stata的菜單欄和歷史窗口、變量窗口、屬性窗口等中的文字信息都以簡體中文來顯示了,菜單欄中具體模塊的文字信息也都以簡體中文來顯示了。以統計菜單中“多元時間序列|VAR模型診斷和檢驗”為例,我們只需從菜單欄中選擇“統計|多元時間序列|VAR模型診斷和檢驗”即可,如圖1.6所示。

圖1.5 簡體中文模式的Stata 16.0主界面

圖1.6 “統計|多元時間序列|VAR模型診斷和檢驗”選擇菜單

如果用戶覺得并不適應簡體中文界面,可以在如圖1.7所示的偏好界面語言設置菜單中選擇“編輯|首選項|用戶界面語言”,即可彈出如圖1.8所示的對話框。

圖1.7 用于設置偏好的界面語言的菜單

圖1.8 “設置Stata的用戶界面語言”對話框

在“設置Stata的用戶界面語言”對話框中選擇English,即可改回英文操作界面。為便于國內用戶學習,本書統一使用簡體中文操作界面進行講解。

1.2.3 新建或編輯樣本觀測值、變量的基本操作

打開Stata 16.0主程序,彈出如圖1.1所示的主界面。

選擇菜單“數據”|“數據編輯器”|“數據編輯器(編輯)”命令,或者直接在“命令窗口”中輸入“edit”命令,彈出如圖1.9所示的“數據編輯器(編輯)”對話框。

在“數據編輯器(編輯)”對話框左上角的單元格中可以輸入數據,比如輸入“10086”,系統會自動創建“var1”變量,如圖1.10所示。

圖1.9 “數據編輯器(編輯)”對話框

圖1.10 創建“var1”變量

單擊右下方“屬性窗口”中“變量”的相關屬性,“變量”的屬性(包括名稱、標簽、類型、格式、值標簽等)隨即進入可編輯狀態,如圖1.11所示。

可以對變量名稱進行修改,比如把變量的名稱定義為號碼,例如把“var1”修改為“haoma”,其他采取系統默認設置,修改完成后單擊左側數據輸入區域的空白處,隨即彈出如圖1.12所示的對話框。然后關閉“數據編輯器(編輯)”對話框,在主界面的工具欄中單擊按鈕,即可對編輯的變量和數據進行保存。

圖1.11 編輯變量特征

圖1.12 修改變量

提示

1.我們還可以只瀏覽而不編輯數據,選擇菜單“數據”|“數據編輯器”|“數據編輯器(瀏覽)”命令,或者直接在“命令窗口”中輸入“browse”命令即可。

2.使用“rename”命令對變量名稱進行修改(接上例),在命令窗口中輸入“rename haoma dianhuahaoma”,即可將變量名稱“haoma”改成“dianhuahaoma”。

3.Stata是區分變量名的字母大小寫的,不能混用大小寫,否則就會提示錯誤。

1.2.4 通過在命令窗口中輸入命令的方式來輸入數據

輸入數據的命令為input,該命令的語法格式為:

input [varlist] [,automatic label]

其中varlist為需要輸入的變量名稱列表,automatic選項可以使Stata自動為它遇到的非數字數據創建值標簽,它還可以自動擴大顯示格式,以適應最長的標簽。label選項用于讓用戶輸入標簽(即字符串),而不是為與值標簽相關聯的變量輸入數值。

注意

input命令允許用戶直接將數據輸入到內存中的數據集中。不過,對于大多數用戶來說,使用菜單“數據”|“數據編輯器”|“數據編輯器(編輯)”命令是向數據集中添加樣本觀測值的更好方法,因為它會根據實際需要自動調整變量的存儲類型,以適應新值。

1.2.5 讀取以前創建的Stata格式的數據文件

通常情況下,正確安裝Stata軟件后,Stata軟件能夠自動識別與Stata關聯的文件,如果不能自動識別,用戶就需要將相關文件的默認打開類型設置為Stata。Stata文件類型及后綴如圖1.13所示。

圖1.13 Stata文件類型

打開已存在的Stata文件有3種方式:

1)直接雙擊該數據文件,前提是文件默認打開程序已設置為Stata。

2)在Stata主界面菜單欄選擇“文件”|“打開”命令,找到文件后打開即可。

3)在主界面的命令窗口中使用use命令。

use命令的完整語法格式為:

use [varlist] [if] [in] using filename [,clear nolabel]

其中use為命令,varlist為變量名稱,if是條件表達式,in用于設定樣本范圍,using filename是數據文件名稱,命令中的[varlist] [if] [in] [,clear nolabel]都是可以省略或者根據需要使用的選項。

提示

針對use命令的示例如下,比如我們要打開桌面上的數據文件“數據1.dta”:

use "C:\Users\Administrator\Desktop\數據1.dta"(本命令的含義是打開數據文件“數據1.dta”,注意需要輸入文件的完整路徑,即“C:\Users\Administrator\Desktop\數據1.dta”)。

use 數據1.dta(如果數據文件“數據1.dta”已經放在了Stata默認的文件夾中,就可以不再輸入文件的完整路徑,也能起到相同的效果)。

sysuse 數據1.dta(如果不清楚數據文件“數據1.dta”的文件路徑,也不知道是否放在了Stata默認的文件夾中,可以使用sysuse命令來打開計算機上命名為“數據1.dta”的數據文件)。

use Y1 X1 X2 using "C:\Users\Administrator\Desktop\數據1.dta"(如果我們只需要使用數據文件“數據1.dta”中的Y1、X1、X2這3個變量,則可以設定變量名稱,注意在這種情形下,命令中需要加上“using”,否則就會提示錯誤)。

use "C:\Users\Administrator\Desktop\數據1.dta" if xingbie==1(如果我們只需要針對變量“xingbie”為“1”的樣本觀測值進行分析,則可以添加“if”選項,注意在這種情形下,命令中不需要使用“using”)。

use "C:\Users\Administrator\Desktop\數據1.dta" in 3/50(如果我們只需要使用數據文件“數據1.dta”中的第3~5個樣本觀測值,則可以添加“in”選項設定樣本觀測值的范圍,這種情形下命令中也不需要使用“using”)。

1.2.6 導入其他格式的數據文件

在Stata主界面選擇“文件|導入”命令(如圖1.14所示),即可看到Stata支持的其他格式的數據文件類型,包括Excel電子表格、文本數據、SPSS數據、SAS數據、固定格式文本數據、字典定義的固定格式文本數據、自由格式文本數據、SAS XPORT V8、SAS XPORT V5、美聯儲經濟數據、Haver Analytics數據庫、ODBC數據源、dBase等。

圖1.14 Stata支持的文件類型

1.讀取Excel電子表格數據

我們以“數據1G”數據文件為例進行說明。

在圖1.14所示的“Stata支持的文件類型”中選擇“Excel電子表格”,即可彈出“import excel-導入Excel文件”對話框,如圖1.15所示。

· 單擊“Excel文件”列表框右側的“瀏覽”按鈕,在彈出的“打開”對話框中找到“數據1G”數據文件(如圖1.16所示),設置好文件路徑。

· “import excel-導入Excel文件”對話框中就會出現數據文件的預覽,我們可以根據實際情況靈活設置。首先可以通過“工作表”下拉列表框設置需要導入Excel文件的具體Sheet表,這一點在Excel文件存在多個Sheet表時非常適用。然后通過“單元格范圍”按鈕設置需要導入的具體單元格范圍。本例中采取系統默認的范圍即可。

· “將第一行作為變量名”復選框用于設定是否將第一行作為變量名稱。本例中由于第一行的確是變量名稱,因此需要勾選“將第一行作為變量名”選項。

· “將所有數據導入為字符串類型”復選框用于設定是否將所有數據導入為字符串類型,本例中的數據為日期和數據,所以不勾選。

· “變量名大小寫”下拉列表用于設置是否保留原Excel數據文件中變量名稱的大小寫,或者全部統一為大寫,或者全部統一為小寫,用戶根據自己的研究需要靈活設置即可,本例中采用系統默認設置的“保留”選項。

圖1.15 “import excel-導入Excel文件”對話框

圖1.16 “打開”對話框

最后單擊“import excel-導入Excel文件”對話框下方的“確認”按鈕,即可得到如圖1.17所示的數據導入結果。

圖1.17 Excel格式數據導入結果

2.讀取文本數據

我們以“數據1H”數據文件為例進行說明。在圖1.14所示的“Stata支持的文件類型”中選擇“文本數據”,即可彈出“import delimited-導入帶分隔符的文本數據”對話框,如圖1.18所示。

單擊“導入文件”列表框右側的按鈕,在彈出的“打開”對話框中找到“數據1H”數據文件(如圖1.19所示),設置好文件路徑。“import delimited-導入帶分隔符的文本數據”對話框中就會出現數據文件的預覽,我們可以根據實際情況靈活設置。

圖1.18 “import delimited-導入帶分隔符的文本數據”對話框

圖1.19 “打開”對話框

· “使用第一行作為變量名”下拉列表框用于設定是否將第一行作為變量名稱,包括“自動”“總是”“從不”“自定義”4個下拉選項。本例中由于第一行的確是變量名稱,因此選擇“總是”下拉選項。

· “變量名大小寫”下拉列表用于設置是否保留原Excel數據文件中變量名稱的大小寫,或者全部統一為大寫,或者全部統一為小寫,用戶根據自己的研究需要靈活設置即可,本例中采用系統默認設置的“保留”選項。

· “浮點精度”下拉列表框包括“默認值”“導入為單精度”“導入為雙精度”3個選項,本例中采用“默認值”選項。

· “文本編碼”下拉列表框用于選擇文本編碼類型,通常情況下采用默認設置即可。

· “綁定雙引號”下拉列表框包括“寬松”“嚴格”“忽略”3個選項?!皠h除雙引號”下拉列表框包括“自動”“總是”“從不”3個選項,本例中采用默認設置即可。

· “分隔符”下拉列表框包括“自動”“逗號”“制表符”“空格”“空白字符”“自定義”6個選項,用戶根據實際情況靈活設置,本例中選取“自動”即可,下方的“連續分隔符視為一個處理”復選框如果被選中,則數據中出現多個連續的分隔符時將被視作一個,而不是多個。

小技巧

用戶如果覺得設置比較麻煩或不會設置,可觀察“import delimited-導入帶分隔符的文本數據”對話框下方的“預覽”界面,如果預覽的數據是自己想要的,就說明設置是正確的,如果不是自己想要的,就需要采用其他選項設置或者修改數據源使其格式更加規范。

在“import delimited-導入帶分隔符的文本數據”對話框下方的“預覽”界面,用戶可以看到數據預處理的情況,右側可以設置每個變量的類型,包括str(字符串)、numeric(數值型)、use default(使用默認值)”。本例中均采用系統默認設置。

注意

除了在右側設置外,用戶如果要更改列(變量)的數據類型,還可以右擊該列,然后選擇適當的類型。另外,要慎重將系統默認的字符串數據導入為數值型,因為可能會導致數據丟失。

設置完成后,最后單擊“import delimited-導入帶分隔符的文本數據”對話框下方的“確定”按鈕,即可得到如圖1.20所示的數據導入結果。

圖1.20 文本數據導入結果

1.2.7 Stata幫助系統介紹

Stata為用戶提供了強大的幫助系統,用戶可以通過幫助系統更好地利用Stata完成自己所需要的功能和操作。在Stata的幫助系統中,常用的方式主要包括調用Stata自帶幫助、閱讀PDF格式幫助文檔、使用Stata網絡幫助。

1.調用Stata自帶幫助

調用Stata自帶幫助系統是最方便,也是最常用的方法。調用幫助系統需使用help命令,該命令的語法格式為:

help [所要查詢命令]

比如我們要查詢基本線性回歸分析命令regress的使用方法,就可以在命令窗口中輸入help regress這一命令,然后按鍵盤上的回車鍵即可得到如圖1.21所示的結果。

圖1.21 help regress結果

命令執行結果主要包括:

· Syntax:命令的語法格式。

· Menu:菜單實現。

· Description:命令描述。

· Links to PDF documentation:PDF格式幫助鏈接。

· Options:選項。

· Examples:示例。

· Video example:視頻形式示例。

· References:參考文獻等主要內容。

上述內容均為英文格式,即使在菜單中已設置為簡體中文也是如此,需要一定的英文基礎才能理解和掌握。

調用Stata自帶的幫助系統也可以通過菜單來實現,如圖1.22所示,在菜單欄中選擇“幫助|Stata命令”選項,即可彈出如圖1.23所示的“Stata命令”對話框。在其中輸入“regress”即可出現如圖1.24所示的基本線性回歸分析命令regress的使用方法。

圖1.22 “幫助|Stata命令”選項

此外,在菜單欄中選擇“幫助|內容”選項,會彈出“Viewer-help contents”對話框,如圖1.24所示,里面是模塊化的內容介紹,用戶可以從中選閱需要的內容。

圖1.23 “Stata命令”對話框

圖1.24 “Viewer-help contents”對話框

2.閱讀PDF格式幫助文檔

在如圖1.22所示的“幫助”菜單下,如果選擇“PDF文檔”菜單選項,則會出現PDF格式的幫助文檔,找到相應的內容閱讀即可。需要注意的是,其中的內容同樣全部是用英文的。

3.使用Stata網絡幫助

“調用Stata自帶幫助”或“閱讀PDF格式幫助文檔”基本上能滿足絕大部分用戶的需求,這些幫助內容已經覆蓋幾乎所有主流的數據管理、數據分析和圖表繪制方法。當用戶遇到還沒有內置化的命令時(即Stata尚未將其模塊化,需要用戶自己編程實現),用戶可以通過“Stata網絡幫助”的方式獲得支持。如果用戶知道所查找命令的名稱,在命令窗口中輸入如下命令即可:

findit [所查找命令], net

search [所查找命令], net

之后就可以按照提示進行操作,完成下載和安裝。如果用戶不知道所查找命令的名稱,只是想使用Stata解決一定問題,則可以在一些主流的論壇(如Stata中文討論專區)公開發布信息尋求幫助。此外,用戶還可以利用一些網站資源,從而更好地使用Stata:

· Stata公司官方網站:http://www.stata.com,用戶可以看到各種資源鏈接、新技術公告等各種各樣有用的信息。

· Stata出版社網站:http://www.stata-press.com,提供有關Stata出版物的信息。

· Stata電子雜志的官方網站:http://www.stata-journal.com,提供有關Stata電子雜志的信息。

主站蜘蛛池模板: 台前县| 泊头市| 米脂县| 眉山市| 随州市| 宁乡县| 三明市| 怀安县| 沙雅县| 大厂| 蕲春县| 镇沅| 犍为县| 阿勒泰市| 望谟县| 永兴县| 清水河县| 尼玛县| 怀远县| 平顶山市| 东乡族自治县| 修武县| 深州市| 稻城县| 石泉县| 修文县| 慈溪市| 广丰县| 应城市| 岳阳县| 黄石市| 巴彦淖尔市| 五常市| 靖边县| 上饶市| 本溪| 镇平县| 宁波市| 罗城| 黄梅县| 永年县|