飞鸟是什么游戏

書名： Stata統計分析從入門到精通
作者名：楊維忠張甜編著
本章字數： 1765字
更新時間： 2023-09-15 18:21:08

Stata統計分析從入門到精通

1.7　本章回顧與習題

1.7.1　本章回顧

本章主要介紹了Stata概述、Stata基本操作及數據處理，包括Stata 16.0窗口說明及基本設置、Stata 16.0命令的語法格式、Stata 16.0運算符與函數、分類變量和定序變量的基本操作、常用的幾種處理數據的操作等。

1．Stata 16.0窗口說明及基本設置

1）Stata 16.0有菜單欄、工具欄，主界面包括5個區域：History、Variables、Command、Results、Properties。

2）Stata 16.0的MP版本可以允許用戶設定自己偏好的界面語言。

3）選擇菜單“數據”|“數據編輯器”|“數據編輯器（編輯）”命令，或者直接在“命令窗口”中輸入“edit”命令，即可新建或編輯樣本觀測值、變量。也可以通過在命令窗口中輸入命令“input”的方式來輸入數據。

4）打開現有的Stata文件有3種方式：

·　一是直接雙擊該數據文件即可打開，前提是文件默認打開程序已設置為Stata。

·　二是在Stata主界面菜單欄選擇“文件”|“打開”命令，找到文件后打開即可。

·　三是在主界面的命令窗口中使用use命令。

5）在Stata主界面選擇“文件|導入”命令，可導入Excel電子表格、文本數據、SPSS數據等其他格式的數據。

2．Stata 16.0命令的語法格式

Stata命令的語法格式為：

[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [using filename] [,options]

·　[]表示可以省略或者根據需要使用的選項，只有command是必不可少的，對于其他各個組成部分，用戶都可以根據自身研究的需要合理選用。

·　command為命令中的命令名稱。

·　varlist為命令中的變量列表，可以設置一個或者多個變量，多個變量之間要用空格分隔開。

·　by varlist是按照變量值分類操作的命令，表示對變量分類的子集分別執行相應的操作。

·　=exp用來統一改變原有變量的值或生成新變量替換原變量，主要包括 generate和 replace兩個命令。

·　if exp（條件表達式）用于對樣本集進行篩選，只對符合相關條件的樣本子集執行相應的操作。

·　in range同樣用于對樣本集進行篩選，與條件表達式的區別在于不依賴變量是否符合某一條件，而是直接使用范圍內的樣本觀測值，對篩選出的樣本執行相應的操作。

·　weight的作用在于對樣本觀測值進行加權，通常用于加權最小二乘回歸分析。

·　options可以在很多命令中使用，不同命令之間的差異比較大。

3．Stata 16.0運算符與函數

在Stata 16.0中，我們可以使用算術運算符、關系運算符和邏輯運算符。

函數用于表達式中，表達式在命令中縮寫為exp，可以在任何表達式中調用函數。函數的參數可以是包括其他函數在內的任何表達式。函數的參數用圓括號括起來，如果有多個參數，則參數之間用逗號分隔開。Stata 16.0共有9大類函數，分別是日期和時間函數、數學函數、矩陣函數、編程函數、隨機數函數、時間序列函數、統計函數、字符串函數、三角函數。

4．分類變量和定序變量的基本操作

常用命令包括tabulate、generate、sort。

5．常用的幾種處理數據的操作

在Stata 16.0中，數據類型主要包括3種，分別是數值型數據、字符型數據和日期型數據。數值型數據由數字、正負號和小數點所組成，包括5個子類，默認類型為float型。字符型數據可由字母、特殊符號和數字所組成，一般會被保存為str#格式，str后面的數字代表最大字符長度，如str8表示可容納最大長度為8個字符的字符型變量。字符型數據一般用英文狀態下的引號""進行標注，且引號一般不被視為字符型變量的一部分。日期型數據有多種表達方式，例如2019年6月25日，可以寫為20190625，也可以寫為25062019等。

·　對數據進行長短變換的命令：reshape。

·　對數據進行類型變換的命令：encode、decode、destring、tostring。

·　生成隨機數的命令：set obs、generate。

·　數據壓縮的命令：compress。

·　按變量合并或拆分數據文件的命令：merge、drop。

·　按樣本觀測值合并或拆分數據文件的命令：append、drop。

·　添加標簽的命令：label。

·　對數據進行排序的命令：sort gsort。

1.7.2　本章習題

1．打開Stata程序，依次進行以下操作：

1）將Excel電子表格格式的數據文件“習題1”導入Stata并保存。

2）為變量“year”“profit”“invest”“labor”“rd”分別添加相應的變量標簽“年份”“營業利潤水平”“固定資產投資”“平均職工人數”“研究開發支出”。

3）將數據文件中的樣本觀測值按變量“profit”從小到大排列。

4）將數據文件中的樣本觀測值按變量“year”從大到小排列。

5）將變量“profit”從數值變量轉換成字符串變量。

6）基于上一步操作，再將變量“profit”從字符串變量轉換成數值變量。

2．將TXT文本數據文件“習題1A”導入Stata并保存。

3．打開Stata程序，依次進行以下操作：

1）在Stata中設置一個包含25個樣本的數據集，里面包含[13,18]區間的25個隨機數據。

2）在Stata中設置一個包含25個樣本的數據集，里面包含[1,18]區間的25個隨機數據，且取值為整數。

3）對生成的數據文件進行壓縮。

官术网_书友最值得收藏!