官术网_书友最值得收藏!

Stata統計分析從入門到精通

1.7 本章回顧與習題

1.7.1 本章回顧

本章主要介紹了Stata概述、Stata基本操作及數據處理,包括Stata 16.0窗口說明及基本設置、Stata 16.0命令的語法格式、Stata 16.0運算符與函數、分類變量和定序變量的基本操作、常用的幾種處理數據的操作等。

1.Stata 16.0窗口說明及基本設置

1)Stata 16.0有菜單欄、工具欄,主界面包括5個區域:History、Variables、Command、Results、Properties。

2)Stata 16.0的MP版本可以允許用戶設定自己偏好的界面語言。

3)選擇菜單“數據”|“數據編輯器”|“數據編輯器(編輯)”命令,或者直接在“命令窗口”中輸入“edit”命令,即可新建或編輯樣本觀測值、變量。也可以通過在命令窗口中輸入命令“input”的方式來輸入數據。

4)打開現有的Stata文件有3種方式:

· 一是直接雙擊該數據文件即可打開,前提是文件默認打開程序已設置為Stata。

· 二是在Stata主界面菜單欄選擇“文件”|“打開”命令,找到文件后打開即可。

· 三是在主界面的命令窗口中使用use命令。

5)在Stata主界面選擇“文件|導入”命令,可導入Excel電子表格、文本數據、SPSS數據等其他格式的數據。

2.Stata 16.0命令的語法格式

Stata命令的語法格式為:

[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [using filename] [,options]

· []表示可以省略或者根據需要使用的選項,只有command是必不可少的,對于其他各個組成部分,用戶都可以根據自身研究的需要合理選用。

· command為命令中的命令名稱。

· varlist為命令中的變量列表,可以設置一個或者多個變量,多個變量之間要用空格分隔開。

· by varlist是按照變量值分類操作的命令,表示對變量分類的子集分別執行相應的操作。

· =exp用來統一改變原有變量的值或生成新變量替換原變量,主要包括 generate和 replace兩個命令。

· if exp(條件表達式)用于對樣本集進行篩選,只對符合相關條件的樣本子集執行相應的操作。

· in range同樣用于對樣本集進行篩選,與條件表達式的區別在于不依賴變量是否符合某一條件,而是直接使用范圍內的樣本觀測值,對篩選出的樣本執行相應的操作。

· weight的作用在于對樣本觀測值進行加權,通常用于加權最小二乘回歸分析。

· options可以在很多命令中使用,不同命令之間的差異比較大。

3.Stata 16.0運算符與函數

在Stata 16.0中,我們可以使用算術運算符、關系運算符和邏輯運算符。

函數用于表達式中,表達式在命令中縮寫為exp,可以在任何表達式中調用函數。函數的參數可以是包括其他函數在內的任何表達式。函數的參數用圓括號括起來,如果有多個參數,則參數之間用逗號分隔開。Stata 16.0共有9大類函數,分別是日期和時間函數、數學函數、矩陣函數、編程函數、隨機數函數、時間序列函數、統計函數、字符串函數、三角函數。

4.分類變量和定序變量的基本操作

常用命令包括tabulate、generate、sort。

5.常用的幾種處理數據的操作

在Stata 16.0中,數據類型主要包括3種,分別是數值型數據、字符型數據和日期型數據。數值型數據由數字、正負號和小數點所組成,包括5個子類,默認類型為float型。字符型數據可由字母、特殊符號和數字所組成,一般會被保存為str#格式,str后面的數字代表最大字符長度,如str8表示可容納最大長度為8個字符的字符型變量。字符型數據一般用英文狀態下的引號""進行標注,且引號一般不被視為字符型變量的一部分。日期型數據有多種表達方式,例如2019年6月25日,可以寫為20190625,也可以寫為25062019等。

· 對數據進行長短變換的命令:reshape。

· 對數據進行類型變換的命令:encode、decode、destring、tostring。

· 生成隨機數的命令:set obs、generate。

· 數據壓縮的命令:compress。

· 按變量合并或拆分數據文件的命令:merge、drop。

· 按樣本觀測值合并或拆分數據文件的命令:append、drop。

· 添加標簽的命令:label。

· 對數據進行排序的命令:sort gsort。

1.7.2 本章習題

1.打開Stata程序,依次進行以下操作:

1)將Excel電子表格格式的數據文件“習題1”導入Stata并保存。

2)為變量“year”“profit”“invest”“labor”“rd”分別添加相應的變量標簽“年份”“營業利潤水平”“固定資產投資”“平均職工人數”“研究開發支出”。

3)將數據文件中的樣本觀測值按變量“profit”從小到大排列。

4)將數據文件中的樣本觀測值按變量“year”從大到小排列。

5)將變量“profit”從數值變量轉換成字符串變量。

6)基于上一步操作,再將變量“profit”從字符串變量轉換成數值變量。

2.將TXT文本數據文件“習題1A”導入Stata并保存。

3.打開Stata程序,依次進行以下操作:

1)在Stata中設置一個包含25個樣本的數據集,里面包含[13,18]區間的25個隨機數據。

2)在Stata中設置一個包含25個樣本的數據集,里面包含[1,18]區間的25個隨機數據,且取值為整數。

3)對生成的數據文件進行壓縮。

主站蜘蛛池模板: 陈巴尔虎旗| 多伦县| 赣州市| 阿合奇县| 周口市| 砀山县| 新昌县| 原平市| 襄樊市| 竹山县| 邛崃市| 长沙县| 温宿县| 资阳市| 武夷山市| 自治县| 常德市| 永寿县| 天峻县| 昭通市| 确山县| 保亭| 新邵县| 兰西县| 应城市| 察哈| 昆明市| 隆昌县| 南召县| 无为县| 诸城市| 古丈县| 葵青区| 贵南县| 开远市| 澄城县| 邢台县| 班玛县| 五峰| 丰都县| 开江县|