官术网_书友最值得收藏!

Stata統計分析從入門到精通

1.1 Stata概述

Stata可以滿足用戶關于數據操作、可視化、統計和自動報告的系列需求。Stata由Stata公司研制開發成功,并于1985年推向市場,迄今已有30多年歷史,它在全球范圍內被廣泛應用于企業和學術機構中,特別是在經濟學、社會學、政治學及流行病學領域。目前的新版本為Stata 17.0,不過最為流行的版本仍為2019年6月26日推出的Stata 16.0。雖然Stata的歷史相對悠久,且歷經十余次改版升級,但Stata公司特別重視該軟件版本的升級管理,如果用戶在1985年運用最初的版本編寫了一個程序來進行分析,那么這個程序在Stata新版本上仍然可以順利運行,會得到同樣的結果,用戶在1985年創建的任何數據集,在今天還是能讀取到。與其他軟件相比,Stata軟件具有以下明顯的優勢。

1.Stata支持多種操作風格,運行速度快

Stata的操作可以通過多種方式來實現,既可以通過單擊菜單選項來完成,也可以通過輸入命令來完成。輸入命令的優點在于簡潔明快、邏輯清晰、靈活方便;菜單操作類似于Windows和Office操作界面,并且有多種語言可供選擇,用戶可以根據自己熟悉的語言進行設置,比如國內大多數用戶可以將界面語言調整為“簡體中文”,通過簡體中文菜單完成Stata程序的運行,大大降低了入門難度。此外,作為一個統計分析軟件,Stata也具有很強的程序設計語言功能,Stata的ADO文件(高級統計部分)都是用Stata自己的程序設計語言編寫的,用戶完全可以根據研究需要在Stata中進行編程,并將相關程序固化,在以后運行時可以非常方便地調用。不同研究人員開發的程序也可以非常方便地交互和共享,大大提升了數據分析的效率。

Stata在分析時將數據全部讀入內存,在統計、分析或計算全部完成后才和磁盤交換數據,因此運行速度很快。根據百度百科上的介紹,通常情況下,SAS的運算速度要比SPSS至少快一個數量級,而Stata的某些模塊和執行同樣功能的SAS模塊比,其速度又比SAS快將近一個數量級。此外,個別模塊包括生存數據分析、縱向數據(重復測量數據)分析等的功能也超過了SAS。

2.Stata是一個開放的、實時更新的軟件系統

與其他統計軟件相比,Stata軟件可以做到開放地、實時更新地吸納研究者、用戶的最新研究成果,許多高級統計模塊均是編程人員用宏語言寫成的程序文件(ADO文件),這些文件可以自行修改、添加和下載。用戶可以通過互聯網到Stata網站尋找并下載新的升級文件,實時更新功能,也可以就相關問題向世界各地的用戶求助,及時運用新成果解決使用Stata時遇到的問題。這一特點使得Stata始終處于統計分析方法研發的前沿,用戶總是能很快找到采用新統計算法的 Stata 程序版本。實時更新的具體操作是:

· 用戶可以到Stata官方網站(http://www.stata.com)下載相關模塊更新,或直接在命令窗口中輸入“update”,在聯網的情況下實現更新。

· 用戶可以使用findit命令找到所需要的功能模塊,并實現下載和安裝。

· 用戶可以下載由其他用戶編寫的Stata模塊,通過菜單選項Help→SJ and User-written Programs進行下載和更新。當然,用戶也可以自己編寫程序,從而實現所需要的功能。

此外,一個非常重要的應用是,Stata可以非常便利地與當前熱門的Python程序設計語言進行交互,Stata可以以交互的方式調用Python程序或將Python程序代碼嵌入到Stata代碼中,以及使用Stata中的任何Python包;在Python執行環境中也可以調用Stata,例如從IPython環境調用Stata代碼開展Stata分析;Stata和Python之間還可以無縫傳遞數據和運行結果。

3.Stata具有強大的數據分析功能

Stata提供了從簡單的統計描述到復雜的多因素統計分析方法,如數據的探索性分析、統計描述、交叉表分析、二維相關分析、秩相關分析、偏相關分析、方差分析、非參數檢驗分析、多元回歸分析、生存分析分析、協方差分析、判別分析、因子分析、聚類分析、非線性回歸分析、Logistic分析回歸等,也可以實現多種計量模型的應用,如單方程模型回歸、聯立方程模型回歸、離散被解釋變量模型、受限因變量模型、時間序列模型、面板數據模型、分位數回歸模型等。除了傳統的統計分析方法外,還收集了近20年發展起來的新方法,如Cox比例風險回歸、指數與Weibull回歸、負二項回歸及廣義負二項回歸等。Stata的功能非常強大,可為大型統計項目提供完善的解決方案。

4.Stata具有強大的圖形制作功能

用戶可以根據研究需要通過菜單窗口操作或直接輸入命令的方式創建自定義圖形,包括直方圖、散點圖、曲線標繪圖、連線標繪圖、箱圖、餅圖、條形圖、點圖等,也可以編寫程序生成數百或數千個圖表。用戶可以將圖形導出到EPS或TIFF以供發布,也可以導出到PNG或SVG以供Web使用,或導出到PDF以供查看。除了專門的圖形繪制模塊外,在有些非繪圖命令中,也提供了專門繪制某種圖形的功能,如在生存分析中提供了繪制生存曲線圖,在回歸分析中提供了殘差圖,等等。Stata還提供了集成的圖形編輯器,用戶可以通過單擊鼠標方式來更改圖形的任何內容,包括添加標題、注釋、線條、箭頭和文本等。

5.Stata可以進行矩陣運算

在多元統計分析中,很多情形下不再是單方程系數估計,而是需要進行矩陣運算。在Stata中,用戶可以非常方便地進行矩陣的基本運算,包括矩陣的加、積、逆、Cholesky分解、Kronecker內積等,也可以開展矩陣的一些高級運算,包括特征根、特征向量、奇異值分解等。除了專門的矩陣計算模塊外,在執行完某些統計分析命令后,Stata還提供了一些系統矩陣,如估計系數向量、估計系數的協方差矩陣等,使用起來非常方便。

主站蜘蛛池模板: 葵青区| 南投市| 旌德县| 林州市| 阳西县| 浮梁县| 洮南市| 双江| 沐川县| 芦溪县| 历史| 泸溪县| 五大连池市| 微博| 墨脱县| 泰安市| 康马县| 通道| 政和县| 会泽县| 栾城县| 武平县| 沈阳市| 灵川县| 都江堰市| 浑源县| 延庆县| 乌审旗| 紫阳县| 玉树县| 北辰区| 突泉县| 精河县| 古浪县| 依安县| 崇信县| 连平县| 阿拉善左旗| 福清市| 台南市| 台东市|