- Stata統計分析從入門到精通
- 楊維忠 張甜編著
- 1765字
- 2023-09-15 18:21:08
1.7 本章回顧與習題
1.7.1 本章回顧
本章主要介紹了Stata概述、Stata基本操作及數據處理,包括Stata 16.0窗口說明及基本設置、Stata 16.0命令的語法格式、Stata 16.0運算符與函數、分類變量和定序變量的基本操作、常用的幾種處理數據的操作等。
1.Stata 16.0窗口說明及基本設置
1)Stata 16.0有菜單欄、工具欄,主界面包括5個區域:History、Variables、Command、Results、Properties。
2)Stata 16.0的MP版本可以允許用戶設定自己偏好的界面語言。
3)選擇菜單“數據”|“數據編輯器”|“數據編輯器(編輯)”命令,或者直接在“命令窗口”中輸入“edit”命令,即可新建或編輯樣本觀測值、變量。也可以通過在命令窗口中輸入命令“input”的方式來輸入數據。
4)打開現有的Stata文件有3種方式:
· 一是直接雙擊該數據文件即可打開,前提是文件默認打開程序已設置為Stata。
· 二是在Stata主界面菜單欄選擇“文件”|“打開”命令,找到文件后打開即可。
· 三是在主界面的命令窗口中使用use命令。
5)在Stata主界面選擇“文件|導入”命令,可導入Excel電子表格、文本數據、SPSS數據等其他格式的數據。
2.Stata 16.0命令的語法格式
Stata命令的語法格式為:
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [using filename] [,options]
· []表示可以省略或者根據需要使用的選項,只有command是必不可少的,對于其他各個組成部分,用戶都可以根據自身研究的需要合理選用。
· command為命令中的命令名稱。
· varlist為命令中的變量列表,可以設置一個或者多個變量,多個變量之間要用空格分隔開。
· by varlist是按照變量值分類操作的命令,表示對變量分類的子集分別執行相應的操作。
· =exp用來統一改變原有變量的值或生成新變量替換原變量,主要包括 generate和 replace兩個命令。
· if exp(條件表達式)用于對樣本集進行篩選,只對符合相關條件的樣本子集執行相應的操作。
· in range同樣用于對樣本集進行篩選,與條件表達式的區別在于不依賴變量是否符合某一條件,而是直接使用范圍內的樣本觀測值,對篩選出的樣本執行相應的操作。
· weight的作用在于對樣本觀測值進行加權,通常用于加權最小二乘回歸分析。
· options可以在很多命令中使用,不同命令之間的差異比較大。
3.Stata 16.0運算符與函數
在Stata 16.0中,我們可以使用算術運算符、關系運算符和邏輯運算符。
函數用于表達式中,表達式在命令中縮寫為exp,可以在任何表達式中調用函數。函數的參數可以是包括其他函數在內的任何表達式。函數的參數用圓括號括起來,如果有多個參數,則參數之間用逗號分隔開。Stata 16.0共有9大類函數,分別是日期和時間函數、數學函數、矩陣函數、編程函數、隨機數函數、時間序列函數、統計函數、字符串函數、三角函數。
4.分類變量和定序變量的基本操作
常用命令包括tabulate、generate、sort。
5.常用的幾種處理數據的操作
在Stata 16.0中,數據類型主要包括3種,分別是數值型數據、字符型數據和日期型數據。數值型數據由數字、正負號和小數點所組成,包括5個子類,默認類型為float型。字符型數據可由字母、特殊符號和數字所組成,一般會被保存為str#格式,str后面的數字代表最大字符長度,如str8表示可容納最大長度為8個字符的字符型變量。字符型數據一般用英文狀態下的引號""進行標注,且引號一般不被視為字符型變量的一部分。日期型數據有多種表達方式,例如2019年6月25日,可以寫為20190625,也可以寫為25062019等。
· 對數據進行長短變換的命令:reshape。
· 對數據進行類型變換的命令:encode、decode、destring、tostring。
· 生成隨機數的命令:set obs、generate。
· 數據壓縮的命令:compress。
· 按變量合并或拆分數據文件的命令:merge、drop。
· 按樣本觀測值合并或拆分數據文件的命令:append、drop。
· 添加標簽的命令:label。
· 對數據進行排序的命令:sort gsort。
1.7.2 本章習題
1.打開Stata程序,依次進行以下操作:
1)將Excel電子表格格式的數據文件“習題1”導入Stata并保存。
2)為變量“year”“profit”“invest”“labor”“rd”分別添加相應的變量標簽“年份”“營業利潤水平”“固定資產投資”“平均職工人數”“研究開發支出”。
3)將數據文件中的樣本觀測值按變量“profit”從小到大排列。
4)將數據文件中的樣本觀測值按變量“year”從大到小排列。
5)將變量“profit”從數值變量轉換成字符串變量。
6)基于上一步操作,再將變量“profit”從字符串變量轉換成數值變量。
2.將TXT文本數據文件“習題1A”導入Stata并保存。
3.打開Stata程序,依次進行以下操作:
1)在Stata中設置一個包含25個樣本的數據集,里面包含[13,18]區間的25個隨機數據。
2)在Stata中設置一個包含25個樣本的數據集,里面包含[1,18]區間的25個隨機數據,且取值為整數。
3)對生成的數據文件進行壓縮。
- PrestaShop 1.3 Theming – Beginner’s Guide
- vtiger CRM Beginner's Guide
- 剪映專業版(電腦版)視頻剪輯全攻略:音效添加+轉場特效+視頻制作
- Pro/E Wildfire 5.0中文版入門、精通與實戰
- DSP開發寶典
- ASP.NET 3.5 Application Architecture and Design
- 24小時學會PowerPoint 2010
- 新編 中文版Photoshop入門與提高
- iPhone User Interface Cookbook
- After Effects 2022從新手到高手
- 中文版Flash CS6動畫制作(慕課版)
- SVG動畫
- Moodle Course Conversion: Beginner's Guide
- Mobile Web Development
- Final Cut Pro視頻后期剪輯零基礎入門到精通