- Stata統(tǒng)計(jì)分析從入門到精通
- 楊維忠 張?zhí)鹁幹?/a>
- 9187字
- 2023-09-15 18:21:10
2.3 Stata制圖簡(jiǎn)介
眾所周知,圖形是對(duì)數(shù)據(jù)分析結(jié)果以及其他綜合分析的一種很好的展示方式。制圖功能一直是Stata的強(qiáng)項(xiàng),也是許多軟件用戶選擇該軟件進(jìn)行數(shù)據(jù)分析的重要理由之一。經(jīng)過Stata公司編程人員長(zhǎng)期不懈的努力,制圖功能在Stata 16.0版本中已經(jīng)非常完善,比較以前的版本,不僅形成圖形的能力得到增強(qiáng),圖形輸出的外觀和選擇也得到了極大的改進(jìn)。本節(jié)講解Stata制圖基本操作以及常用的幾種圖形的繪制,包括直方圖、散點(diǎn)圖、曲線標(biāo)繪圖、連線標(biāo)繪圖、箱圖、餅圖、條形圖、點(diǎn)圖等。
2.3.1 Stata制圖基本操作
1.命令的語法格式
(1)整體命令的語法格式
graph-command(plot-command,plot-options)(plot-command,plot-options),…graph-options
其中的graph-command是用來定義圖的類型的命令,plot-command是用來定義曲線類型的命令,不同的曲線之間用括號(hào)分隔開,曲線有自身的options選項(xiàng),整個(gè)圖形也有統(tǒng)一的options選項(xiàng)。
(2)標(biāo)題與副標(biāo)題的設(shè)置
設(shè)置標(biāo)題的命令為:title()。用戶在括號(hào)內(nèi)輸入標(biāo)題名即可。
副標(biāo)題的設(shè)置命令為:subtitle()。用戶在括號(hào)內(nèi)輸入副標(biāo)題名即可。
假如我們要把一幅圖的標(biāo)題設(shè)置為“案例結(jié)果”,副標(biāo)題設(shè)置為“案例2.1結(jié)果”,則命令為:
title(案例結(jié)果) subtitle(案例2.1結(jié)果)
(3)為坐標(biāo)軸命名
為橫坐標(biāo)軸命名的命令為:xtitle()。用戶在括號(hào)內(nèi)輸入標(biāo)題名即可。
為縱坐標(biāo)軸命名的命令為:ytitle()。用戶在括號(hào)內(nèi)輸入標(biāo)題名即可。
(4)坐標(biāo)軸刻度值的設(shè)置
設(shè)置橫坐標(biāo)軸刻度值的命令語法為:xtick(#1(#2) #3)。
設(shè)置縱坐標(biāo)軸刻度值的命令語法為:ytick(#1(#2) #3)。
其中#1代表起始刻度,#3代表結(jié)束刻度,(#2)代表間隔刻度。比如ytick(500(50)900)表示縱坐標(biāo)軸起始刻度為500,結(jié)束刻度為900,間隔刻度為50。
(5)坐標(biāo)軸數(shù)值標(biāo)簽的設(shè)置
設(shè)置橫坐標(biāo)軸數(shù)值標(biāo)簽的命令語法為:xlabel(#1(#2) #3)。
設(shè)置縱坐標(biāo)軸數(shù)值標(biāo)簽的命令語法為:ylabel(#1(#2) #3)。
其中#1代表起始刻度,#3代表結(jié)束刻度,(#2)代表間隔刻度。比如ylabel(500(100)900)表示為Y軸添加數(shù)值標(biāo)簽,取值為500~900,間距為100。
(6)坐標(biāo)軸樣式的設(shè)置
設(shè)置橫坐標(biāo)軸樣式的命令為:xscale()。其中xscale(off)表示不使用橫坐標(biāo)軸。
設(shè)置縱坐標(biāo)軸樣式的命令為:yscale()。其中yscale(off)表示不使用縱坐標(biāo)軸。
(7)圖例的設(shè)置
設(shè)置圖例的命令語法為:legend(label(# "text")…)。用戶將圖例的代號(hào)填入“#”處,將內(nèi)容寫在"text"中即可。比如legend(label(1 "上海") label(2 "深圳"))表示將圖例代號(hào)為1的顯示為上海,將圖例代號(hào)為2的顯示為深圳。
用戶還可以設(shè)置圖例所在的位置,命令為legend(position()),用戶只需將位置所對(duì)應(yīng)時(shí)刻的數(shù)字填入括號(hào)中即可,共有12個(gè)位置可供選擇(對(duì)應(yīng)鐘表的12個(gè)時(shí)刻),比如我們想要把圖例放置在鐘表3點(diǎn)對(duì)應(yīng)的位置,對(duì)應(yīng)的命令為legend(position(3))。
(8)腳注的設(shè)置
設(shè)置腳注的命令語句為:note()。用戶將腳注內(nèi)容寫在括號(hào)中即可。比如我們需要注明數(shù)據(jù)來源為公司內(nèi)部數(shù)據(jù),對(duì)應(yīng)的命令為:note(數(shù)據(jù)來源:公司內(nèi)部數(shù)據(jù))。
(9)圖形的保存與打開
保存圖形的命令語法是:graph save [graphname] filename [,asis replace]。
graph save為基本命令,[graphname]為圖形保存的名稱,filename為保存的路徑,[,asis replace]選項(xiàng)用來凍結(jié)圖形,使其不能再被修改。
打開圖形的命令的語法格式是:graph use filename。其中filename是文件保存的路徑名稱。
顯示圖形的命令的語法格式是:graph display [name] [,options]。其中name為圖形的名稱。
(10)圖形的合并
合并圖形的命令語法是:graph combine name [name...] [,options]。
2.菜單實(shí)現(xiàn)
Stata 制圖也可以通過菜單來實(shí)現(xiàn),在菜單欄單擊“圖形”,即可顯示出如圖2.27所示的可選項(xiàng)。通過該菜單Stata可以實(shí)現(xiàn)二維圖(散點(diǎn)圖、折線圖等)、條形圖、點(diǎn)圖、餅圖、直方圖、箱線圖、等高線圖、散點(diǎn)圖矩陣、分布圖、平滑和密度、回歸診斷圖、時(shí)間序列圖、面板數(shù)據(jù)折線圖、生存分析圖、ROC分析圖、多元分析、質(zhì)量控制等各種圖形的繪制。比如我們單擊“二維圖(散點(diǎn)圖、折線圖等)”,即可出現(xiàn)如圖2.28所示的對(duì)話框。

圖2.27 菜單欄“圖形”選項(xiàng)

圖2.28 “twoway-二維圖”對(duì)話框
在“twoway-二維圖”對(duì)話框中有8個(gè)選項(xiàng)卡。
· “繪圖”選項(xiàng)卡供用戶選擇繪圖類別和類型、Y變量、X變量,從而生成初步的圖形。用戶需要先單擊“創(chuàng)建”按鈕,然后在彈出的子對(duì)話框“圖形1”中進(jìn)行相應(yīng)的設(shè)置。
· “if/in”選項(xiàng)卡供用戶設(shè)置if選項(xiàng)和in選項(xiàng),其中if選項(xiàng)用來設(shè)置條件表達(dá)式,in選項(xiàng)用來設(shè)置樣本范圍。
· “Y軸”“X軸”選項(xiàng)卡的功能是設(shè)置Y軸、X軸的相關(guān)內(nèi)容,包括標(biāo)題、主要刻度/標(biāo)簽屬性、次要刻度/標(biāo)簽屬性、軸線屬性、軸刻度尺屬性、參考線、是否隱藏軸、是否將軸放在圖形的對(duì)面位置等。
· “標(biāo)題”選項(xiàng)卡用于設(shè)置與標(biāo)題相關(guān)的內(nèi)容,主要包括標(biāo)題的設(shè)置、副標(biāo)題的設(shè)置、標(biāo)注的設(shè)置、注釋文字的設(shè)置等。
· “圖例”選項(xiàng)卡用于設(shè)置與圖例相關(guān)的內(nèi)容,主要包括顯示或隱藏圖例、圖例的組織/外觀、圖例的位置等內(nèi)容。
· “整體”選項(xiàng)卡用于設(shè)置與總體圖形相關(guān)的內(nèi)容,包括整個(gè)圖形的名稱、大小設(shè)置、區(qū)域?qū)傩缘葍?nèi)容。
· “By”選項(xiàng)卡用于設(shè)置分類輸出圖形,用戶在該選項(xiàng)卡中指定是否給變量的每個(gè)唯一值繪制子圖,并設(shè)置子圖的組織、標(biāo)題、區(qū)域、軸線等。
2.3.2 直方圖
下載資源:\video\第2章\…
下載資源:\sample\第2章\數(shù)據(jù)2F
直方圖(Histogram)又稱柱狀圖,是一種統(tǒng)計(jì)報(bào)告圖,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況。一般用橫軸表示數(shù)據(jù)類型,縱軸表示分布情況。通過繪制直方圖可以較為直觀地傳遞有關(guān)數(shù)據(jù)的變化信息,使數(shù)據(jù)使用者能夠較好地觀察數(shù)據(jù)波動(dòng)的狀態(tài),使數(shù)據(jù)決策者能夠依據(jù)分析結(jié)果確定在什么地方需要集中力量改進(jìn)工作。
直方圖用到histogram命令,該命令的語法格式為:
histogram varname [if] [in] [weight] [,[continuous_opts | discrete_opts] options]
varname為變量,[if]為條件表達(dá)式,[in]用于設(shè)置樣本范圍,[weight]用于設(shè)置權(quán)重。continuous_opts為連續(xù)變量可用選項(xiàng),discrete_opts為分類變量可用選項(xiàng),options為連續(xù)、分類變量共用選項(xiàng),如表2.8所示。
表2.8 continuous_opts、discrete_opts、options說明

(續(xù)表)

下面以“數(shù)據(jù)2F”數(shù)據(jù)文件為例進(jìn)行介紹,在“數(shù)據(jù)2F”中設(shè)置了兩個(gè)變量,分別是province和amount,如圖2.29所示。

圖2.29 “數(shù)據(jù)2F”中的數(shù)據(jù)內(nèi)容
打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:histogram amount,frequency
本命令的含義是繪制amount變量的直方圖,繪制結(jié)果如圖2.30所示。
histogram amount,frequency title("案例結(jié)果")
本命令的含義是繪制amount變量的直方圖,并給圖形增加標(biāo)題名“案例結(jié)果”,繪制結(jié)果如圖2.31所示。

圖2.30 直方圖1

圖2.31 直方圖2
histogram amount,frequency title("案例結(jié)果")xlabel(0(50)600) ylabel(0(1)10)
本命令的含義是繪制amount變量的直方圖,并給圖形增加標(biāo)題名“案例結(jié)果”,還要為X軸添加數(shù)值標(biāo)簽,取值為0~600,間距為50,為Y軸添加數(shù)值標(biāo)簽,取值為0~10,間距為1,繪制結(jié)果如圖2.32所示。
histogram amount,frequency title("案例結(jié)果")xlabel(0(50)600) ylabel(0(1)10)ytick(0(0.5)10)
本命令的含義是繪制amount變量的直方圖,并給圖形增加標(biāo)題名“案例結(jié)果”,還要為X軸添加數(shù)值標(biāo)簽,取值為0~600,間距為50,為Y軸添加數(shù)值標(biāo)簽,取值為0~10,間距為1,還要為Y軸添加刻度,取值為0~10,間距為0.5,繪制結(jié)果如圖2.33所示。

圖2.32 直方圖3

圖2.33 直方圖4
histogram amount,frequency title("案例結(jié)果")xlabel(0(50)600) ylabel(0(1)10)ytick(0(0.5)10) start(10) width(25)
本命令的含義是繪制amount變量的直方圖,并給圖形增加標(biāo)題名“案例結(jié)果”,還要對(duì)X軸添加數(shù)值標(biāo)簽,取值為0~600,間距為50,為Y軸添加數(shù)值標(biāo)簽,取值為0~10,間距為1,還要為Y軸添加刻度,取值為0~10,間距為0.5,然后使直方圖的第1個(gè)直方條從10開始,每一個(gè)直方條的寬度為25,繪制結(jié)果如圖2.34所示。

圖2.34 直方圖5
2.3.3 散點(diǎn)圖
下載資源:\video\第2章\…
下載資源:\sample\第2章\數(shù)據(jù)2G
作為對(duì)數(shù)據(jù)進(jìn)行預(yù)處理的重要工具之一,散點(diǎn)圖(Scatter Diagram)深受專家、學(xué)者們的喜愛。散點(diǎn)圖的簡(jiǎn)要定義就是點(diǎn)在直角坐標(biāo)系平面上的分布圖。研究者對(duì)數(shù)據(jù)制作散點(diǎn)圖的主要出發(fā)點(diǎn)是通過繪制該圖來觀察某變量隨另一變量變化的大致趨勢(shì),據(jù)此可以探索數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,甚至選擇合適的函數(shù)對(duì)數(shù)據(jù)點(diǎn)進(jìn)行擬合。
繪制散點(diǎn)圖的命令為scatter,該命令的語法格式為:
[twoway] scatter varlist [if] [in] [weight] [,options]
[twoway] scatter表示繪制散點(diǎn)圖,varlist是將要繪制散點(diǎn)圖的變量列表,此處需要注意x軸變量要放置在y軸變量之后,[if]為條件表達(dá)式,[in]用于設(shè)置樣本范圍,[weight]用于設(shè)置權(quán)重。[,options]為可選項(xiàng),有很多,常見的包括數(shù)據(jù)標(biāo)記形狀的設(shè)置、顏色的設(shè)置、大小的設(shè)置、散點(diǎn)標(biāo)簽的設(shè)置、分類輸出散點(diǎn)圖的設(shè)置,具體說明如下:
1.?dāng)?shù)據(jù)標(biāo)記形狀的設(shè)置
數(shù)據(jù)標(biāo)記形狀的設(shè)置通過msymbol()命令選項(xiàng)來實(shí)現(xiàn),用戶在括號(hào)中輸入所需要的命令選項(xiàng)或代號(hào)縮寫即可,常用的msymbol()命令選項(xiàng)如表2.9所示。
表2.9 常用的msymbol()命令選項(xiàng)

2.?dāng)?shù)據(jù)標(biāo)記顏色的設(shè)置
數(shù)據(jù)標(biāo)記顏色的設(shè)置通過mcolor()命令選項(xiàng)來實(shí)現(xiàn),用戶在括號(hào)中輸入所需要的命令選項(xiàng)或代號(hào)縮寫即可,常用的mcolor()命令選項(xiàng)如表2.10所示。
表2.10 常用的mcolor()命令選項(xiàng)

3.?dāng)?shù)據(jù)標(biāo)記大小的設(shè)置
數(shù)據(jù)標(biāo)記大小的設(shè)置通過msize()命令選項(xiàng)來實(shí)現(xiàn),用戶將適當(dāng)大小的數(shù)字輸入括號(hào)中即可。比如要設(shè)置數(shù)據(jù)標(biāo)記的大小為6號(hào),則命令為:
msize(6)
4.散點(diǎn)標(biāo)簽的設(shè)置
散點(diǎn)標(biāo)簽的設(shè)置通過mlabel()和mlabposition()命令選項(xiàng)來實(shí)現(xiàn),用戶將標(biāo)簽的內(nèi)容輸入mlabel后的括號(hào),將代表標(biāo)簽位置的數(shù)字輸入mlabposition后面的括號(hào)即可。比如用戶想要設(shè)置散點(diǎn)標(biāo)簽的內(nèi)容為變量amount,標(biāo)簽位置在9點(diǎn)鐘處,可使用如下命令:
mlabel(amount) mlabposition(9)
5.分類輸出散點(diǎn)圖的設(shè)置
如果在數(shù)據(jù)中存在分類變量,可以將數(shù)據(jù)分類以后再繪制散點(diǎn)圖,所使用的命令為by(),用戶在括號(hào)中填入分類變量即可。比如按照xueli變量分類繪圖,可在繪圖命令之后添加選項(xiàng):
by(xueli)
下面以“數(shù)據(jù)2G”數(shù)據(jù)文件為例進(jìn)行介紹,“數(shù)據(jù)2G”中設(shè)置了兩個(gè)變量,分別是ab和mn,如圖2.35所示。

圖2.35 “數(shù)據(jù)2G”中的數(shù)據(jù)內(nèi)容
打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:
graph twoway scatter ab mn
本命令的含義是繪制ab和mn兩個(gè)變量的散點(diǎn)圖,繪制結(jié)果如圖2.36所示。
graph twoway scatter ab mn,title("案例結(jié)果") xlabel(68(2)92) ylabel(150(10)200)ytick(150(5)200)
本命令的含義是繪制ab和mn兩個(gè)變量的散點(diǎn)圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為68~92,間距為2,為Y軸添加數(shù)值標(biāo)簽,取值為150~200,間距為10,為Y軸添加刻度,間距為5,繪制結(jié)果如圖2.37所示。

圖2.36 散點(diǎn)圖1

圖2.37 散點(diǎn)圖2
graph twoway scatter ab mn,title("案例結(jié)果") xlabel(68(2)92) ylabel(150(10)200)ytick(150(5)200) msymbol(D)
本命令的含義是繪制ab和mn兩個(gè)變量的散點(diǎn)圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為68~92,間距為2,為Y軸添加數(shù)值標(biāo)簽,取值為150~200,間距為10,為Y軸添加刻度,間距為5,并且使散點(diǎn)圖中散點(diǎn)標(biāo)志的形狀變?yōu)閷?shí)心菱形,繪制結(jié)果如圖2.38所示。
graph twoway scatter ab mn,title("案例結(jié)果") xlabel(68(2)92) ylabel(150(10)200)ytick(150(5)200) msymbol(D) mcolor(yellow)
本命令的含義是繪制ab和mn兩個(gè)變量的散點(diǎn)圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為68~92,間距為2,為Y軸添加數(shù)值標(biāo)簽,取值為150~200,間距為10,為Y軸添加刻度,間距為5,并使散點(diǎn)圖中散點(diǎn)標(biāo)志的形狀變?yōu)閷?shí)心菱形,然后使散點(diǎn)標(biāo)志的顏色變?yōu)辄S色,繪制結(jié)果如圖2.39所示。

圖2.38 散點(diǎn)圖3

圖2.39 散點(diǎn)圖4
2.3.4 曲線標(biāo)繪圖
下載資源:\video\第2章\…
下載資源:\sample\第2章\數(shù)據(jù)2H
從形式上看,曲線標(biāo)繪圖與散點(diǎn)圖的區(qū)別就是用一條線來替代散點(diǎn)標(biāo)志,這樣做可以更加清晰直觀地看出數(shù)據(jù)走勢(shì),但卻無法觀察到每個(gè)散點(diǎn)的準(zhǔn)確定位。從用途上看,曲線標(biāo)繪圖常用于時(shí)間序列分析的數(shù)據(jù)預(yù)處理,用來觀察變量隨時(shí)間的變化趨勢(shì)。此外,曲線標(biāo)繪圖可以同時(shí)反映多個(gè)變量隨時(shí)間的變化情況,所以曲線標(biāo)繪圖的應(yīng)用范圍非常廣泛。
繪制曲線標(biāo)繪圖的命令的語法格式為:
[twoway] line varlist [if] [in] [,options]
varlist是將要繪制曲線標(biāo)繪圖的變量列表,此處需要注意x軸變量要放置在y軸變量之后,[if]為條件表達(dá)式,[in]用于設(shè)置樣本范圍。[,options]為可選項(xiàng),散點(diǎn)圖中的[,options]可選項(xiàng),在曲線標(biāo)繪圖也大多適用,除此之外,曲線標(biāo)繪圖還可以對(duì)有關(guān)曲線樣式進(jìn)行設(shè)置,常用選項(xiàng)包括connect_options(連接樣式的設(shè)置)、linepatternstyle(線條樣式的設(shè)置)等。
1.連接樣式的設(shè)置
用于設(shè)置連接樣式的命令為connect(),用戶在括號(hào)中填入樣式代碼或縮寫即可,具體如表2.11所示。
表2.11 connect()命令括號(hào)中可填入的樣式代碼及縮寫

2.線條樣式的設(shè)置
用于設(shè)置線條樣式的命令為clpattern(),用戶在括號(hào)中填入樣式代碼即可,具體如表2.12所示。
表2.12 clpattern()命令括號(hào)中可填入的樣式代碼

下面以“數(shù)據(jù)2H”數(shù)據(jù)文件為例介紹,數(shù)據(jù)中有3個(gè)變量,分別是year、shanghai、shenzhen,如圖2.40所示。

圖2.40 “數(shù)據(jù)2H”中的數(shù)據(jù)內(nèi)容
打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:
graph twoway line shanghai shenzhen year
本命令的含義是繪制shanghai和shenzhen兩個(gè)變量隨年份變化的曲線標(biāo)繪圖,繪制結(jié)果如圖2.41所示。
graph twoway line shanghai shenzhen year,title("案例結(jié)果") xlabel(2010(2)2020)ylabel(500(50)900) xtick(2010(1)2020)
本命令的含義是繪制shanghai和shenzhen兩個(gè)變量隨年份變化的曲線標(biāo)繪圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標(biāo)簽,取值為500~900,間距為10,為X軸添加刻度,間距為1,繪制結(jié)果如圖2.42所示。

圖2.41 曲線標(biāo)繪圖1

圖2.42 曲線標(biāo)繪圖2
graph twoway line shanghai shenzhen year,title("案例結(jié)果") xlabel(2010(2)2020)ylabel(500(50)900) xtick(2010(1)2020) legend(label(1 "上海") label(2 "深圳"))
本命令的含義是繪制shanghai和shenzhen兩個(gè)變量隨年份變化的曲線標(biāo)繪圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標(biāo)簽,取值為500~900,間距為10,為X軸添加刻度,間距為1,同時(shí)以中文顯示shanghai和shenzhen這兩個(gè)變量的標(biāo)簽,從而更加清晰直觀,繪制結(jié)果如圖2.43所示。
graph twoway line shanghai shenzhen year,title("案例結(jié)果") xlabel(2010(2)2020)ylabel(500(50)900) xtick(2010(1)2020) legend(label(1 "上海") label(2 "深圳"))clpattern(solid dash)
本命令的含義是繪制shanghai和shenzhen兩個(gè)變量隨年份變化的曲線標(biāo)繪圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標(biāo)簽,取值為500~900,間距為10,為X軸添加刻度,間距為1,同時(shí)以中文顯示shanghai和shenzhen這兩個(gè)變量的標(biāo)簽,從而更加清晰直觀,然后使深圳的曲線變?yōu)樘摼€,繪制結(jié)果如圖2.44所示。

圖2.43 曲線標(biāo)繪圖3

圖2.44 曲線標(biāo)繪圖4
在上述命令中,solid代表實(shí)線,對(duì)應(yīng)的是第1個(gè)因變量“上海”;dash代表虛線,對(duì)應(yīng)的是第2個(gè)因變量“深圳”。線條樣式與其對(duì)應(yīng)的命令縮寫如表2.13所示。
表2.13 線條樣式與其對(duì)應(yīng)的命令縮寫

2.3.5 連線標(biāo)繪圖
下載資源:\video\第2章\…
下載資源:\sample\第2章\數(shù)據(jù)2H
在前面的章節(jié)中我們可以看到,曲線標(biāo)繪圖用一條線來代替散點(diǎn)標(biāo)志,可以更加清晰直觀地看出數(shù)據(jù)走勢(shì),但卻無法觀察到每個(gè)散點(diǎn)的準(zhǔn)確定位。那么,有沒有一種作圖方式既可以滿足觀測(cè)數(shù)據(jù)走勢(shì)的需要,又能實(shí)現(xiàn)每個(gè)散點(diǎn)的準(zhǔn)確定位?Stata的連線標(biāo)繪圖制圖方法就提供了解決這一問題的方法。
繪制連線標(biāo)繪圖的命令的語法格式為:
twoway connected varlist [if] [in] [weight] [,scatter_options]
varlist是將要繪制曲線標(biāo)繪圖的變量列表,[if]為條件表達(dá)式,[in]用于設(shè)置樣本范圍,[weight]用于設(shè)置權(quán)重,[,scatter_options]為可選項(xiàng)。
我們繼續(xù)使用“數(shù)據(jù)2H”數(shù)據(jù)文件,打開該數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:
graph twoway connected shanghai shenzhen year
本命令的含義是繪制shanghai、shenzhen兩個(gè)變量隨年份變化的連線標(biāo)繪圖,繪制結(jié)果如圖2.45所示。
graph twoway connected shanghai shenzhen year,title("案例結(jié)果")xlabel(2010(1)2020) ylabel(500(100)900) ytick(500(50)900)
本命令的含義是繪制shanghai、shenzhen兩個(gè)變量隨年份變化的連線標(biāo)繪圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標(biāo)簽,取值為500~900,間距為100,為Y軸添加刻度,間距為50,繪制結(jié)果如圖2.46所示。

圖2.45 連線標(biāo)繪圖1

圖2.46 連線標(biāo)繪圖2
graph twoway connected shanghai shenzhen year,title("案例結(jié)果")xlabel(2010(1)2020) ylabel(500(100)900) ytick(500(50)900) clpattern(dash)
本命令的含義是繪制shanghai、shenzhen兩個(gè)變量隨年份變化的連線標(biāo)繪圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標(biāo)簽,取值為500~900,間距為100,為Y軸添加刻度,間距為50,同時(shí)使“上海”的曲線變?yōu)樘摼€, 繪制結(jié)果如圖2.47所示。
graph twoway connected shanghai shenzhen year,title("案例結(jié)果")xlabel(2010(1)2020) ylabel(500(100)900) ytick(500(50)900) clpattern(dash)msymbol(D)
本命令的含義是繪制shanghai、shenzhen兩個(gè)變量隨年份變化的連線標(biāo)繪圖,并給圖形增加標(biāo)題名“案例結(jié)果”,為X軸添加數(shù)值標(biāo)簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標(biāo)簽,取值為500~900,間距為100,為Y軸添加刻度,間距為50,同時(shí)使“上海”的曲線變?yōu)樘摼€,使連線標(biāo)繪圖中散點(diǎn)標(biāo)志的形狀變?yōu)閷?shí)心菱形,繪制結(jié)果如圖2.48所示。

圖2.47 連線標(biāo)繪圖3

圖2.48 連線標(biāo)繪圖4
2.3.6 箱圖
下載資源:\video\第2章\…
下載資源:\sample\第2章\數(shù)據(jù)2I
箱圖(Box-Plot)又稱為盒須圖、盒式圖或箱線圖,是一種用于顯示一組數(shù)據(jù)分散情況的統(tǒng)計(jì)圖。箱圖很形象地分為中心、延伸以及分部狀態(tài)的全部范圍,提供了一種只用5個(gè)點(diǎn)總結(jié)數(shù)據(jù)集的方式,這5個(gè)點(diǎn)包括中點(diǎn)、Q1、Q3、分部狀態(tài)的高位和低位。數(shù)據(jù)分析者通過繪制箱圖不僅可以直觀明了地識(shí)別數(shù)據(jù)中的異常值,還可以判斷數(shù)據(jù)的偏態(tài)、尾重以及比較幾批數(shù)據(jù)的形狀。
繪制箱圖的命令及其語法格式如下:
graph box yvars [if] [in] [weight] [,options]
graph hbox yvars [if] [in] [weight] [,options]
其中g(shù)raph box用來繪制縱向箱圖,graph hbox用于繪制橫向箱圖,yvars是將要繪制箱圖的變量,[if]為條件表達(dá)式,[in]用于設(shè)置樣本范圍,[weight]用于設(shè)置權(quán)重。
下面使用“數(shù)據(jù)2I”數(shù)據(jù)文件為例進(jìn)行說明,“數(shù)據(jù)2I”中有3個(gè)變量,分別是place、amount、grade,如圖2.49所示。

圖2.49 “數(shù)據(jù)2I”中的數(shù)據(jù)內(nèi)容
打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:
graph box amount
本命令的含義是繪制amount變量的箱圖,繪制結(jié)果如圖2.50所示。箱圖把所有的數(shù)據(jù)分成了4部分,第1部分是從頂線到箱子的上部,這部分?jǐn)?shù)據(jù)值在全體數(shù)據(jù)中排名前25%;第2部分是從箱子的上部到箱子中間的線,這部分?jǐn)?shù)據(jù)值在全體數(shù)據(jù)中排名25%以下、50%以上;第3部分是從箱子中間的線到箱子的下部,這部分?jǐn)?shù)據(jù)值在全體數(shù)據(jù)中排名50%以下、75%以上;第4部分是從箱子的底部到底線,這部分?jǐn)?shù)據(jù)值在全體數(shù)據(jù)中排名后25%。頂線與底線的間距在一定程度上表示了數(shù)據(jù)的離散程度,間距越大就越離散。
graph box amount,over( grade)
本命令的含義是繪制amount變量的箱圖,但是按照grade變量分別列出,繪制結(jié)果如圖2.51所示。

圖2.50 箱圖1

圖2.51 箱圖2
2.3.7 餅圖
下載資源:\video\第2章\…
下載資源:\sample\第2章\數(shù)據(jù)2J
餅圖是數(shù)據(jù)分析中常見的一種經(jīng)典圖形,因其外形類似于圓餅而得名。在數(shù)據(jù)分析中,很多時(shí)候需要分析數(shù)據(jù)總體的各個(gè)組成部分的占比,我們可以通過各個(gè)部分與總額相除來計(jì)算,但這種數(shù)學(xué)比例的表示方法相對(duì)抽象。Stata 16.0提供了餅形制圖工具,能夠直接以圖形的方式顯示各個(gè)組成部分所占的比例,更為重要的是,由于采用圖形的方式,因此更加形象直觀。
下面介紹繪制餅圖的命令。
1)餅圖中的切片作為每個(gè)變量的總數(shù)或百分比,該命令的語法格式如下:
graph pie varlist [if] [in] [weight] [,options]
2)餅圖中的切片作為over(varname )類別中的總數(shù)或百分比,該命令的語法格式如下:
graph pie varname [if] [in] [weight], over(varname) [options]
3)餅圖中的切片作為over(varname )類別中的頻數(shù),該命令的語法格式如下:
graph pie [if] [in] [weight], over(varname) [options]
這3個(gè)命令表達(dá)的基本含義是一致的,只是在餅圖具體繪制時(shí)有所區(qū)別。varlist/varname表示將要繪制圖形的變量,[if]為條件表達(dá)式,[in]用于設(shè)置樣本范圍,[,options]為可選項(xiàng),具體含義如表2.14所示。
表2.14 [,options]可選項(xiàng)及其含義

以“數(shù)據(jù)2J”數(shù)據(jù)文件為例進(jìn)行講解,在“數(shù)據(jù)2J”中設(shè)置了4個(gè)變量,分別是province、amount2018、amount2019、amount2020,如圖2.52所示。

圖2.52 “數(shù)據(jù)2J”的數(shù)據(jù)內(nèi)容
打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:
graph pie amount2018 amount2019 amount2020
本命令的含義是繪制amount2018、amount2019、amount2020三個(gè)變量的餅圖,繪制結(jié)果如圖2.53所示。
graph pie amount2018 amount2019 amount2020,pie(1,explode) pie(2,color(yellow))plabel(1 percent,gap(20)) plabel(2 percent,gap(20))
本命令的含義是繪制amount2018、amount2019、amount2020三個(gè)變量的餅圖。要突出顯示amount2018的占比,把a(bǔ)mount2019的切片顏色改為黃色,給amount2018和amount2019的切片在距中心20個(gè)相對(duì)半徑單位的位置處加上百分比標(biāo)簽,繪制結(jié)果如圖2.54所示。

圖2.53 餅圖1

圖2.54 餅圖2
graph pie amount2018 amount2019 amount2020,pie(1,explode) pie(2,color(yellow))plabel(1 percent,gap(20)) plabel(2 percent,gap(20)) by( province)
本命令的含義是繪制amount2018、amount2019、amount2020三個(gè)變量的餅圖。要突出顯示amount2018的占比,把a(bǔ)mount2019的切片顏色改為黃色,給amount2018和amount2019的切片在距中心20個(gè)相對(duì)半徑單位的位置處加上百分比標(biāo)簽,并按province變量分別列出,繪制結(jié)果如圖2.55所示。

圖2.55 餅圖3
2.3.8 條形圖
下載資源:\video\第2章\…
下載資源:\sample\第2章\數(shù)據(jù)2K
相對(duì)于前面提到的箱圖,條形圖(Bar Chart)本身所包含的信息相對(duì)較少,但是它仍然為平均數(shù)、中位數(shù)、合計(jì)數(shù)或計(jì)數(shù)等多種概要統(tǒng)計(jì)提供了簡(jiǎn)單又多樣化的展示,所以條形圖也深受研究者的喜愛,經(jīng)常出現(xiàn)在研究者的論文或者調(diào)查報(bào)告中。
下面介紹繪制條形圖的基本命令。
1)繪制縱向條形圖的命令及其語法格式:
graph bar yvars [if] [in] [weight] [,options]
2)繪制橫向條形圖的命令及其語法格式:
graph hbar yvars [if] [in] [weight] [,options]
在命令中,[if] 為條件表達(dá)式,[in]用于設(shè)置樣本范圍。
yvar是將要繪制圖形的變量,可以是變量列表的值:(asis) varlist,也可以是變量列表值的百分比(percent) [varlist],或變量列表值的計(jì)數(shù)(count) [varlist],還可以是變量名或變量列表的指定統(tǒng)計(jì)量:
[(stat)] varname [[(stat)]…]
[(stat)] varlist [[(stat)]…]
[(stat)] [name=]varname […] [[(stat)]…]
默認(rèn)顯示均值(mean)統(tǒng)計(jì)量,繪制條形圖常用的統(tǒng)計(jì)量如表2.15所示。
表2.15 繪制條形圖常用的統(tǒng)計(jì)量

[,options]包括6大類,每一個(gè)大類又有一些子類,常用的可選項(xiàng)如表2.16所示。
表2.16 常用的可選項(xiàng)具體選項(xiàng)

下面以“數(shù)據(jù)2K”數(shù)據(jù)文件為例進(jìn)行說明,數(shù)據(jù)中有3個(gè)變量,分別是group、amount、people,如圖2.56所示。

圖2.56 “數(shù)據(jù)2K”中的數(shù)據(jù)內(nèi)容
打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:
graph bar amount,over(group)
本命令的含義是繪制變量amount的條形圖,以group變量作為分組變量,繪制結(jié)果如圖2.57所示。
graph bar amount,over(group) title("案例結(jié)果") ylabel(1000(1000)7000)ytick(1000(500)7000)
本命令的含義是繪制變量amount的條形圖,以group變量作為分組變量,并給圖形增加標(biāo)題名“案例結(jié)果”,為Y軸添加數(shù)值標(biāo)簽,取值為1000~7000,間距為1000,為Y軸添加刻度,間距為500,繪制結(jié)果如圖2.58所示。

圖2.57 條形圖1

圖2.58 條形圖2
graph bar amount people,over(group) title("案例結(jié)果") ylabel(1000(1000)7000)ytick(1000(500)7000)
本命令的含義是繪制變量amount、people的條形圖,以group變量作為分組變量,并給圖形增加標(biāo)題名“案例結(jié)果”,為Y軸添加數(shù)值標(biāo)簽,取值為1000~7000,間距為1000,為Y軸添加刻度,間距為500,繪制結(jié)果如圖2.59所示。
graph bar(median) amount(median) people,over(group) title("案例結(jié)果")ylabel(1000(1000)7000) ytick(1000(500)7000)
本命令的含義是繪制變量amount、people的條形圖,使用的統(tǒng)計(jì)量不再是變量amount、people的均值,而是它們的中位數(shù),以group變量作為分組變量,并給圖形增加標(biāo)題名“案例結(jié)果”,為Y軸添加數(shù)值標(biāo)簽,取值為1000~7000,間距為1000,為Y軸添加刻度,間距為500,繪制結(jié)果如圖2.60所示。

圖2.59 條形圖3

圖2.60 條形圖3
2.3.9 點(diǎn)圖
下載資源:\video\第2章\…
下載資源:\sample\第2章\數(shù)據(jù)2K
點(diǎn)圖(Dot Plot)的功能與作用與前面提到的條形圖類似,都是用來直觀地比較一個(gè)或者多個(gè)變量的概要統(tǒng)計(jì)情況。
繪制點(diǎn)圖的命令的語法格式為:
graph dot yvars [if] [in] [weight] [,options]
下面繼續(xù)沿用“數(shù)據(jù)2K”數(shù)據(jù)文件為例,打開該數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:
graph dot amount people,over(group)
本命令的含義是繪制amount和people兩個(gè)變量的點(diǎn)圖,并以group為分組變量,繪制結(jié)果如圖2.61所示。
graph dot amount people,over(group) title("案例結(jié)果")
本命令的含義是繪制amount和people兩個(gè)變量的點(diǎn)圖,并以group為分組變量,給圖形增加標(biāo)題名“案例結(jié)果”,繪制結(jié)果如圖2.62所示。

圖2.61 點(diǎn)圖1

圖2.62 點(diǎn)圖2
graph dot amount people,over(group) title("案例結(jié)果") marker(1,msymbol(D))marker(2,msymbol(T))
本命令的含義是繪制amount和people兩個(gè)變量的點(diǎn)圖,并以group為分組變量,給圖形增加標(biāo)題“案例結(jié)果”,使圖中amount變量散點(diǎn)標(biāo)志的形狀變?yōu)閷?shí)心菱形,使圖中people變量散點(diǎn)標(biāo)志的形狀變?yōu)閷?shí)心三角,繪制結(jié)果如圖2.63所示。

圖2.63 點(diǎn)圖3
- Photoshop CC 2018實(shí)用教程
- Core Data iOS Essentials
- Creo 6.0快速入門、進(jìn)階與精通(升級(jí)版)
- SOLIDWORKS Visualize 實(shí)例詳解(微視頻版)
- PHP應(yīng)用開發(fā)與實(shí)踐
- After Effects影視特效立體化教程:After Effects 2021(微課版)
- Oracle Enterprise Manager Grid Control 11g R1: Business Service Management
- CAXA電子圖板2016基礎(chǔ)與實(shí)例教程
- LaTeX入門與實(shí)戰(zhàn)應(yīng)用
- Instant Markdown
- 構(gòu)筑敏捷的開發(fā)團(tuán)隊(duì):微軟Visual Studio 2010實(shí)戰(zhàn)兵法
- Deep Inside osCommerce: The Cookbook
- Moodle 1.9 for Design and Technology
- Web Host Manager Administration Guide
- Photoshop CC圖形圖像處理實(shí)戰(zhàn)教程(微課版)