官术网_书友最值得收藏!

Stata統(tǒng)計分析從入門到精通

2.3 Stata制圖簡介

眾所周知,圖形是對數(shù)據(jù)分析結果以及其他綜合分析的一種很好的展示方式。制圖功能一直是Stata的強項,也是許多軟件用戶選擇該軟件進行數(shù)據(jù)分析的重要理由之一。經(jīng)過Stata公司編程人員長期不懈的努力,制圖功能在Stata 16.0版本中已經(jīng)非常完善,比較以前的版本,不僅形成圖形的能力得到增強,圖形輸出的外觀和選擇也得到了極大的改進。本節(jié)講解Stata制圖基本操作以及常用的幾種圖形的繪制,包括直方圖、散點圖、曲線標繪圖、連線標繪圖、箱圖、餅圖、條形圖、點圖等。

2.3.1 Stata制圖基本操作

1.命令的語法格式

(1)整體命令的語法格式

graph-command(plot-command,plot-options)(plot-command,plot-options),…graph-options

其中的graph-command是用來定義圖的類型的命令,plot-command是用來定義曲線類型的命令,不同的曲線之間用括號分隔開,曲線有自身的options選項,整個圖形也有統(tǒng)一的options選項。

(2)標題與副標題的設置

設置標題的命令為:title()。用戶在括號內輸入標題名即可。

副標題的設置命令為:subtitle()。用戶在括號內輸入副標題名即可。

假如我們要把一幅圖的標題設置為“案例結果”,副標題設置為“案例2.1結果”,則命令為:

title(案例結果) subtitle(案例2.1結果)

(3)為坐標軸命名

為橫坐標軸命名的命令為:xtitle()。用戶在括號內輸入標題名即可。

為縱坐標軸命名的命令為:ytitle()。用戶在括號內輸入標題名即可。

(4)坐標軸刻度值的設置

設置橫坐標軸刻度值的命令語法為:xtick(#1(#2) #3)。

設置縱坐標軸刻度值的命令語法為:ytick(#1(#2) #3)。

其中#1代表起始刻度,#3代表結束刻度,(#2)代表間隔刻度。比如ytick(500(50)900)表示縱坐標軸起始刻度為500,結束刻度為900,間隔刻度為50。

(5)坐標軸數(shù)值標簽的設置

設置橫坐標軸數(shù)值標簽的命令語法為:xlabel(#1(#2) #3)。

設置縱坐標軸數(shù)值標簽的命令語法為:ylabel(#1(#2) #3)。

其中#1代表起始刻度,#3代表結束刻度,(#2)代表間隔刻度。比如ylabel(500(100)900)表示為Y軸添加數(shù)值標簽,取值為500~900,間距為100。

(6)坐標軸樣式的設置

設置橫坐標軸樣式的命令為:xscale()。其中xscale(off)表示不使用橫坐標軸。

設置縱坐標軸樣式的命令為:yscale()。其中yscale(off)表示不使用縱坐標軸。

(7)圖例的設置

設置圖例的命令語法為:legend(label(# "text")…)。用戶將圖例的代號填入“#”處,將內容寫在"text"中即可。比如legend(label(1 "上海") label(2 "深圳"))表示將圖例代號為1的顯示為上海,將圖例代號為2的顯示為深圳。

用戶還可以設置圖例所在的位置,命令為legend(position()),用戶只需將位置所對應時刻的數(shù)字填入括號中即可,共有12個位置可供選擇(對應鐘表的12個時刻),比如我們想要把圖例放置在鐘表3點對應的位置,對應的命令為legend(position(3))。

(8)腳注的設置

設置腳注的命令語句為:note()。用戶將腳注內容寫在括號中即可。比如我們需要注明數(shù)據(jù)來源為公司內部數(shù)據(jù),對應的命令為:note(數(shù)據(jù)來源:公司內部數(shù)據(jù))。

(9)圖形的保存與打開

保存圖形的命令語法是:graph save [graphname] filename [,asis replace]。

graph save為基本命令,[graphname]為圖形保存的名稱,filename為保存的路徑,[,asis replace]選項用來凍結圖形,使其不能再被修改。

打開圖形的命令的語法格式是:graph use filename。其中filename是文件保存的路徑名稱。

顯示圖形的命令的語法格式是:graph display [name] [,options]。其中name為圖形的名稱。

(10)圖形的合并

合并圖形的命令語法是:graph combine name [name...] [,options]。

2.菜單實現(xiàn)

Stata 制圖也可以通過菜單來實現(xiàn),在菜單欄單擊“圖形”,即可顯示出如圖2.27所示的可選項。通過該菜單Stata可以實現(xiàn)二維圖(散點圖、折線圖等)、條形圖、點圖、餅圖、直方圖、箱線圖、等高線圖、散點圖矩陣、分布圖、平滑和密度、回歸診斷圖、時間序列圖、面板數(shù)據(jù)折線圖、生存分析圖、ROC分析圖、多元分析、質量控制等各種圖形的繪制。比如我們單擊“二維圖(散點圖、折線圖等)”,即可出現(xiàn)如圖2.28所示的對話框。

圖2.27 菜單欄“圖形”選項

圖2.28 “twoway-二維圖”對話框

在“twoway-二維圖”對話框中有8個選項卡。

· “繪圖”選項卡供用戶選擇繪圖類別和類型、Y變量、X變量,從而生成初步的圖形。用戶需要先單擊“創(chuàng)建”按鈕,然后在彈出的子對話框“圖形1”中進行相應的設置。

· “if/in”選項卡供用戶設置if選項和in選項,其中if選項用來設置條件表達式,in選項用來設置樣本范圍。

· “Y軸”“X軸”選項卡的功能是設置Y軸、X軸的相關內容,包括標題、主要刻度/標簽屬性、次要刻度/標簽屬性、軸線屬性、軸刻度尺屬性、參考線、是否隱藏軸、是否將軸放在圖形的對面位置等。

· “標題”選項卡用于設置與標題相關的內容,主要包括標題的設置、副標題的設置、標注的設置、注釋文字的設置等。

· “圖例”選項卡用于設置與圖例相關的內容,主要包括顯示或隱藏圖例、圖例的組織/外觀、圖例的位置等內容。

· “整體”選項卡用于設置與總體圖形相關的內容,包括整個圖形的名稱、大小設置、區(qū)域屬性等內容。

· “By”選項卡用于設置分類輸出圖形,用戶在該選項卡中指定是否給變量的每個唯一值繪制子圖,并設置子圖的組織、標題、區(qū)域、軸線等。

2.3.2 直方圖

下載資源:\video\第2章\…

下載資源:\sample\第2章\數(shù)據(jù)2F

直方圖(Histogram)又稱柱狀圖,是一種統(tǒng)計報告圖,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況。一般用橫軸表示數(shù)據(jù)類型,縱軸表示分布情況。通過繪制直方圖可以較為直觀地傳遞有關數(shù)據(jù)的變化信息,使數(shù)據(jù)使用者能夠較好地觀察數(shù)據(jù)波動的狀態(tài),使數(shù)據(jù)決策者能夠依據(jù)分析結果確定在什么地方需要集中力量改進工作。

直方圖用到histogram命令,該命令的語法格式為:

histogram varname [if] [in] [weight] [,[continuous_opts | discrete_opts] options]

varname為變量,[if]為條件表達式,[in]用于設置樣本范圍,[weight]用于設置權重。continuous_opts為連續(xù)變量可用選項,discrete_opts為分類變量可用選項,options為連續(xù)、分類變量共用選項,如表2.8所示。

表2.8 continuous_opts、discrete_opts、options說明

(續(xù)表)

下面以“數(shù)據(jù)2F”數(shù)據(jù)文件為例進行介紹,在“數(shù)據(jù)2F”中設置了兩個變量,分別是province和amount,如圖2.29所示。

圖2.29 “數(shù)據(jù)2F”中的數(shù)據(jù)內容

打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:histogram amount,frequency

本命令的含義是繪制amount變量的直方圖,繪制結果如圖2.30所示。

histogram amount,frequency title("案例結果")

本命令的含義是繪制amount變量的直方圖,并給圖形增加標題名“案例結果”,繪制結果如圖2.31所示。

圖2.30 直方圖1

圖2.31 直方圖2

histogram amount,frequency title("案例結果")xlabel(0(50)600) ylabel(0(1)10)

本命令的含義是繪制amount變量的直方圖,并給圖形增加標題名“案例結果”,還要為X軸添加數(shù)值標簽,取值為0~600,間距為50,為Y軸添加數(shù)值標簽,取值為0~10,間距為1,繪制結果如圖2.32所示。

histogram amount,frequency title("案例結果")xlabel(0(50)600) ylabel(0(1)10)ytick(0(0.5)10)

本命令的含義是繪制amount變量的直方圖,并給圖形增加標題名“案例結果”,還要為X軸添加數(shù)值標簽,取值為0~600,間距為50,為Y軸添加數(shù)值標簽,取值為0~10,間距為1,還要為Y軸添加刻度,取值為0~10,間距為0.5,繪制結果如圖2.33所示。

圖2.32 直方圖3

圖2.33 直方圖4

histogram amount,frequency title("案例結果")xlabel(0(50)600) ylabel(0(1)10)ytick(0(0.5)10) start(10) width(25)

本命令的含義是繪制amount變量的直方圖,并給圖形增加標題名“案例結果”,還要對X軸添加數(shù)值標簽,取值為0~600,間距為50,為Y軸添加數(shù)值標簽,取值為0~10,間距為1,還要為Y軸添加刻度,取值為0~10,間距為0.5,然后使直方圖的第1個直方條從10開始,每一個直方條的寬度為25,繪制結果如圖2.34所示。

圖2.34 直方圖5

2.3.3 散點圖

下載資源:\video\第2章\…

下載資源:\sample\第2章\數(shù)據(jù)2G

作為對數(shù)據(jù)進行預處理的重要工具之一,散點圖(Scatter Diagram)深受專家、學者們的喜愛。散點圖的簡要定義就是點在直角坐標系平面上的分布圖。研究者對數(shù)據(jù)制作散點圖的主要出發(fā)點是通過繪制該圖來觀察某變量隨另一變量變化的大致趨勢,據(jù)此可以探索數(shù)據(jù)之間的關聯(lián)關系,甚至選擇合適的函數(shù)對數(shù)據(jù)點進行擬合。

繪制散點圖的命令為scatter,該命令的語法格式為:

[twoway] scatter varlist [if] [in] [weight] [,options]

[twoway] scatter表示繪制散點圖,varlist是將要繪制散點圖的變量列表,此處需要注意x軸變量要放置在y軸變量之后,[if]為條件表達式,[in]用于設置樣本范圍,[weight]用于設置權重。[,options]為可選項,有很多,常見的包括數(shù)據(jù)標記形狀的設置、顏色的設置、大小的設置、散點標簽的設置、分類輸出散點圖的設置,具體說明如下:

1.數(shù)據(jù)標記形狀的設置

數(shù)據(jù)標記形狀的設置通過msymbol()命令選項來實現(xiàn),用戶在括號中輸入所需要的命令選項或代號縮寫即可,常用的msymbol()命令選項如表2.9所示。

表2.9 常用的msymbol()命令選項

2.數(shù)據(jù)標記顏色的設置

數(shù)據(jù)標記顏色的設置通過mcolor()命令選項來實現(xiàn),用戶在括號中輸入所需要的命令選項或代號縮寫即可,常用的mcolor()命令選項如表2.10所示。

表2.10 常用的mcolor()命令選項

3.數(shù)據(jù)標記大小的設置

數(shù)據(jù)標記大小的設置通過msize()命令選項來實現(xiàn),用戶將適當大小的數(shù)字輸入括號中即可。比如要設置數(shù)據(jù)標記的大小為6號,則命令為:

msize(6)

4.散點標簽的設置

散點標簽的設置通過mlabel()和mlabposition()命令選項來實現(xiàn),用戶將標簽的內容輸入mlabel后的括號,將代表標簽位置的數(shù)字輸入mlabposition后面的括號即可。比如用戶想要設置散點標簽的內容為變量amount,標簽位置在9點鐘處,可使用如下命令:

mlabel(amount) mlabposition(9)

5.分類輸出散點圖的設置

如果在數(shù)據(jù)中存在分類變量,可以將數(shù)據(jù)分類以后再繪制散點圖,所使用的命令為by(),用戶在括號中填入分類變量即可。比如按照xueli變量分類繪圖,可在繪圖命令之后添加選項:

by(xueli)

下面以“數(shù)據(jù)2G”數(shù)據(jù)文件為例進行介紹,“數(shù)據(jù)2G”中設置了兩個變量,分別是ab和mn,如圖2.35所示。

圖2.35 “數(shù)據(jù)2G”中的數(shù)據(jù)內容

打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:

graph twoway scatter ab mn

本命令的含義是繪制ab和mn兩個變量的散點圖,繪制結果如圖2.36所示。

graph twoway scatter ab mn,title("案例結果") xlabel(68(2)92) ylabel(150(10)200)ytick(150(5)200)

本命令的含義是繪制ab和mn兩個變量的散點圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為68~92,間距為2,為Y軸添加數(shù)值標簽,取值為150~200,間距為10,為Y軸添加刻度,間距為5,繪制結果如圖2.37所示。

圖2.36 散點圖1

圖2.37 散點圖2

graph twoway scatter ab mn,title("案例結果") xlabel(68(2)92) ylabel(150(10)200)ytick(150(5)200) msymbol(D)

本命令的含義是繪制ab和mn兩個變量的散點圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為68~92,間距為2,為Y軸添加數(shù)值標簽,取值為150~200,間距為10,為Y軸添加刻度,間距為5,并且使散點圖中散點標志的形狀變?yōu)閷嵭牧庑危L制結果如圖2.38所示。

graph twoway scatter ab mn,title("案例結果") xlabel(68(2)92) ylabel(150(10)200)ytick(150(5)200) msymbol(D) mcolor(yellow)

本命令的含義是繪制ab和mn兩個變量的散點圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為68~92,間距為2,為Y軸添加數(shù)值標簽,取值為150~200,間距為10,為Y軸添加刻度,間距為5,并使散點圖中散點標志的形狀變?yōu)閷嵭牧庑危缓笫股Ⅻc標志的顏色變?yōu)辄S色,繪制結果如圖2.39所示。

圖2.38 散點圖3

圖2.39 散點圖4

2.3.4 曲線標繪圖

下載資源:\video\第2章\…

下載資源:\sample\第2章\數(shù)據(jù)2H

從形式上看,曲線標繪圖與散點圖的區(qū)別就是用一條線來替代散點標志,這樣做可以更加清晰直觀地看出數(shù)據(jù)走勢,但卻無法觀察到每個散點的準確定位。從用途上看,曲線標繪圖常用于時間序列分析的數(shù)據(jù)預處理,用來觀察變量隨時間的變化趨勢。此外,曲線標繪圖可以同時反映多個變量隨時間的變化情況,所以曲線標繪圖的應用范圍非常廣泛。

繪制曲線標繪圖的命令的語法格式為:

[twoway] line varlist [if] [in] [,options]

varlist是將要繪制曲線標繪圖的變量列表,此處需要注意x軸變量要放置在y軸變量之后,[if]為條件表達式,[in]用于設置樣本范圍。[,options]為可選項,散點圖中的[,options]可選項,在曲線標繪圖也大多適用,除此之外,曲線標繪圖還可以對有關曲線樣式進行設置,常用選項包括connect_options(連接樣式的設置)、linepatternstyle(線條樣式的設置)等。

1.連接樣式的設置

用于設置連接樣式的命令為connect(),用戶在括號中填入樣式代碼或縮寫即可,具體如表2.11所示。

表2.11 connect()命令括號中可填入的樣式代碼及縮寫

2.線條樣式的設置

用于設置線條樣式的命令為clpattern(),用戶在括號中填入樣式代碼即可,具體如表2.12所示。

表2.12 clpattern()命令括號中可填入的樣式代碼

下面以“數(shù)據(jù)2H”數(shù)據(jù)文件為例介紹,數(shù)據(jù)中有3個變量,分別是year、shanghai、shenzhen,如圖2.40所示。

圖2.40 “數(shù)據(jù)2H”中的數(shù)據(jù)內容

打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:

graph twoway line shanghai shenzhen year

本命令的含義是繪制shanghai和shenzhen兩個變量隨年份變化的曲線標繪圖,繪制結果如圖2.41所示。

graph twoway line shanghai shenzhen year,title("案例結果") xlabel(2010(2)2020)ylabel(500(50)900) xtick(2010(1)2020)

本命令的含義是繪制shanghai和shenzhen兩個變量隨年份變化的曲線標繪圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標簽,取值為500~900,間距為10,為X軸添加刻度,間距為1,繪制結果如圖2.42所示。

圖2.41 曲線標繪圖1

圖2.42 曲線標繪圖2

graph twoway line shanghai shenzhen year,title("案例結果") xlabel(2010(2)2020)ylabel(500(50)900) xtick(2010(1)2020) legend(label(1 "上海") label(2 "深圳"))

本命令的含義是繪制shanghai和shenzhen兩個變量隨年份變化的曲線標繪圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標簽,取值為500~900,間距為10,為X軸添加刻度,間距為1,同時以中文顯示shanghai和shenzhen這兩個變量的標簽,從而更加清晰直觀,繪制結果如圖2.43所示。

graph twoway line shanghai shenzhen year,title("案例結果") xlabel(2010(2)2020)ylabel(500(50)900) xtick(2010(1)2020) legend(label(1 "上海") label(2 "深圳"))clpattern(solid dash)

本命令的含義是繪制shanghai和shenzhen兩個變量隨年份變化的曲線標繪圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標簽,取值為500~900,間距為10,為X軸添加刻度,間距為1,同時以中文顯示shanghai和shenzhen這兩個變量的標簽,從而更加清晰直觀,然后使深圳的曲線變?yōu)樘摼€,繪制結果如圖2.44所示。

圖2.43 曲線標繪圖3

圖2.44 曲線標繪圖4

在上述命令中,solid代表實線,對應的是第1個因變量“上海”;dash代表虛線,對應的是第2個因變量“深圳”。線條樣式與其對應的命令縮寫如表2.13所示。

表2.13 線條樣式與其對應的命令縮寫

2.3.5 連線標繪圖

下載資源:\video\第2章\…

下載資源:\sample\第2章\數(shù)據(jù)2H

在前面的章節(jié)中我們可以看到,曲線標繪圖用一條線來代替散點標志,可以更加清晰直觀地看出數(shù)據(jù)走勢,但卻無法觀察到每個散點的準確定位。那么,有沒有一種作圖方式既可以滿足觀測數(shù)據(jù)走勢的需要,又能實現(xiàn)每個散點的準確定位?Stata的連線標繪圖制圖方法就提供了解決這一問題的方法。

繪制連線標繪圖的命令的語法格式為:

twoway connected varlist [if] [in] [weight] [,scatter_options]

varlist是將要繪制曲線標繪圖的變量列表,[if]為條件表達式,[in]用于設置樣本范圍,[weight]用于設置權重,[,scatter_options]為可選項。

我們繼續(xù)使用“數(shù)據(jù)2H”數(shù)據(jù)文件,打開該數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:

graph twoway connected shanghai shenzhen year

本命令的含義是繪制shanghai、shenzhen兩個變量隨年份變化的連線標繪圖,繪制結果如圖2.45所示。

graph twoway connected shanghai shenzhen year,title("案例結果")xlabel(2010(1)2020) ylabel(500(100)900) ytick(500(50)900)

本命令的含義是繪制shanghai、shenzhen兩個變量隨年份變化的連線標繪圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標簽,取值為500~900,間距為100,為Y軸添加刻度,間距為50,繪制結果如圖2.46所示。

圖2.45 連線標繪圖1

圖2.46 連線標繪圖2

graph twoway connected shanghai shenzhen year,title("案例結果")xlabel(2010(1)2020) ylabel(500(100)900) ytick(500(50)900) clpattern(dash)

本命令的含義是繪制shanghai、shenzhen兩個變量隨年份變化的連線標繪圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標簽,取值為500~900,間距為100,為Y軸添加刻度,間距為50,同時使“上海”的曲線變?yōu)樘摼€, 繪制結果如圖2.47所示。

graph twoway connected shanghai shenzhen year,title("案例結果")xlabel(2010(1)2020) ylabel(500(100)900) ytick(500(50)900) clpattern(dash)msymbol(D)

本命令的含義是繪制shanghai、shenzhen兩個變量隨年份變化的連線標繪圖,并給圖形增加標題名“案例結果”,為X軸添加數(shù)值標簽,取值為2010~2020,間距為1,為Y軸添加數(shù)值標簽,取值為500~900,間距為100,為Y軸添加刻度,間距為50,同時使“上海”的曲線變?yōu)樘摼€,使連線標繪圖中散點標志的形狀變?yōu)閷嵭牧庑危L制結果如圖2.48所示。

圖2.47 連線標繪圖3

圖2.48 連線標繪圖4

2.3.6 箱圖

下載資源:\video\第2章\…

下載資源:\sample\第2章\數(shù)據(jù)2I

箱圖(Box-Plot)又稱為盒須圖、盒式圖或箱線圖,是一種用于顯示一組數(shù)據(jù)分散情況的統(tǒng)計圖。箱圖很形象地分為中心、延伸以及分部狀態(tài)的全部范圍,提供了一種只用5個點總結數(shù)據(jù)集的方式,這5個點包括中點、Q1、Q3、分部狀態(tài)的高位和低位。數(shù)據(jù)分析者通過繪制箱圖不僅可以直觀明了地識別數(shù)據(jù)中的異常值,還可以判斷數(shù)據(jù)的偏態(tài)、尾重以及比較幾批數(shù)據(jù)的形狀。

繪制箱圖的命令及其語法格式如下:

graph box yvars [if] [in] [weight] [,options]

graph hbox yvars [if] [in] [weight] [,options]

其中graph box用來繪制縱向箱圖,graph hbox用于繪制橫向箱圖,yvars是將要繪制箱圖的變量,[if]為條件表達式,[in]用于設置樣本范圍,[weight]用于設置權重。

下面使用“數(shù)據(jù)2I”數(shù)據(jù)文件為例進行說明,“數(shù)據(jù)2I”中有3個變量,分別是place、amount、grade,如圖2.49所示。

圖2.49 “數(shù)據(jù)2I”中的數(shù)據(jù)內容

打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:

graph box amount

本命令的含義是繪制amount變量的箱圖,繪制結果如圖2.50所示。箱圖把所有的數(shù)據(jù)分成了4部分,第1部分是從頂線到箱子的上部,這部分數(shù)據(jù)值在全體數(shù)據(jù)中排名前25%;第2部分是從箱子的上部到箱子中間的線,這部分數(shù)據(jù)值在全體數(shù)據(jù)中排名25%以下、50%以上;第3部分是從箱子中間的線到箱子的下部,這部分數(shù)據(jù)值在全體數(shù)據(jù)中排名50%以下、75%以上;第4部分是從箱子的底部到底線,這部分數(shù)據(jù)值在全體數(shù)據(jù)中排名后25%。頂線與底線的間距在一定程度上表示了數(shù)據(jù)的離散程度,間距越大就越離散。

graph box amount,over( grade)

本命令的含義是繪制amount變量的箱圖,但是按照grade變量分別列出,繪制結果如圖2.51所示。

圖2.50 箱圖1

圖2.51 箱圖2

2.3.7 餅圖

下載資源:\video\第2章\…

下載資源:\sample\第2章\數(shù)據(jù)2J

餅圖是數(shù)據(jù)分析中常見的一種經(jīng)典圖形,因其外形類似于圓餅而得名。在數(shù)據(jù)分析中,很多時候需要分析數(shù)據(jù)總體的各個組成部分的占比,我們可以通過各個部分與總額相除來計算,但這種數(shù)學比例的表示方法相對抽象。Stata 16.0提供了餅形制圖工具,能夠直接以圖形的方式顯示各個組成部分所占的比例,更為重要的是,由于采用圖形的方式,因此更加形象直觀。

下面介紹繪制餅圖的命令。

1)餅圖中的切片作為每個變量的總數(shù)或百分比,該命令的語法格式如下:

graph pie varlist [if] [in] [weight] [,options]

2)餅圖中的切片作為over(varname )類別中的總數(shù)或百分比,該命令的語法格式如下:

graph pie varname [if] [in] [weight], over(varname) [options]

3)餅圖中的切片作為over(varname )類別中的頻數(shù),該命令的語法格式如下:

graph pie [if] [in] [weight], over(varname) [options]

這3個命令表達的基本含義是一致的,只是在餅圖具體繪制時有所區(qū)別。varlist/varname表示將要繪制圖形的變量,[if]為條件表達式,[in]用于設置樣本范圍,[,options]為可選項,具體含義如表2.14所示。

表2.14 [,options]可選項及其含義

以“數(shù)據(jù)2J”數(shù)據(jù)文件為例進行講解,在“數(shù)據(jù)2J”中設置了4個變量,分別是province、amount2018、amount2019、amount2020,如圖2.52所示。

圖2.52 “數(shù)據(jù)2J”的數(shù)據(jù)內容

打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:

graph pie amount2018 amount2019 amount2020

本命令的含義是繪制amount2018、amount2019、amount2020三個變量的餅圖,繪制結果如圖2.53所示。

graph pie amount2018 amount2019 amount2020,pie(1,explode) pie(2,color(yellow))plabel(1 percent,gap(20)) plabel(2 percent,gap(20))

本命令的含義是繪制amount2018、amount2019、amount2020三個變量的餅圖。要突出顯示amount2018的占比,把amount2019的切片顏色改為黃色,給amount2018和amount2019的切片在距中心20個相對半徑單位的位置處加上百分比標簽,繪制結果如圖2.54所示。

圖2.53 餅圖1

圖2.54 餅圖2

graph pie amount2018 amount2019 amount2020,pie(1,explode) pie(2,color(yellow))plabel(1 percent,gap(20)) plabel(2 percent,gap(20)) by( province)

本命令的含義是繪制amount2018、amount2019、amount2020三個變量的餅圖。要突出顯示amount2018的占比,把amount2019的切片顏色改為黃色,給amount2018和amount2019的切片在距中心20個相對半徑單位的位置處加上百分比標簽,并按province變量分別列出,繪制結果如圖2.55所示。

圖2.55 餅圖3

2.3.8 條形圖

下載資源:\video\第2章\…

下載資源:\sample\第2章\數(shù)據(jù)2K

相對于前面提到的箱圖,條形圖(Bar Chart)本身所包含的信息相對較少,但是它仍然為平均數(shù)、中位數(shù)、合計數(shù)或計數(shù)等多種概要統(tǒng)計提供了簡單又多樣化的展示,所以條形圖也深受研究者的喜愛,經(jīng)常出現(xiàn)在研究者的論文或者調查報告中。

下面介紹繪制條形圖的基本命令。

1)繪制縱向條形圖的命令及其語法格式:

graph bar yvars [if] [in] [weight] [,options]

2)繪制橫向條形圖的命令及其語法格式:

graph hbar yvars [if] [in] [weight] [,options]

在命令中,[if] 為條件表達式,[in]用于設置樣本范圍。

yvar是將要繪制圖形的變量,可以是變量列表的值:(asis) varlist,也可以是變量列表值的百分比(percent) [varlist],或變量列表值的計數(shù)(count) [varlist],還可以是變量名或變量列表的指定統(tǒng)計量:

[(stat)] varname [[(stat)]…]

[(stat)] varlist [[(stat)]…]

[(stat)] [name=]varname […] [[(stat)]…]

默認顯示均值(mean)統(tǒng)計量,繪制條形圖常用的統(tǒng)計量如表2.15所示。

表2.15 繪制條形圖常用的統(tǒng)計量

[,options]包括6大類,每一個大類又有一些子類,常用的可選項如表2.16所示。

表2.16 常用的可選項具體選項

下面以“數(shù)據(jù)2K”數(shù)據(jù)文件為例進行說明,數(shù)據(jù)中有3個變量,分別是group、amount、people,如圖2.56所示。

圖2.56 “數(shù)據(jù)2K”中的數(shù)據(jù)內容

打開上述數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:

graph bar amount,over(group)

本命令的含義是繪制變量amount的條形圖,以group變量作為分組變量,繪制結果如圖2.57所示。

graph bar amount,over(group) title("案例結果") ylabel(1000(1000)7000)ytick(1000(500)7000)

本命令的含義是繪制變量amount的條形圖,以group變量作為分組變量,并給圖形增加標題名“案例結果”,為Y軸添加數(shù)值標簽,取值為1000~7000,間距為1000,為Y軸添加刻度,間距為500,繪制結果如圖2.58所示。

圖2.57 條形圖1

圖2.58 條形圖2

graph bar amount people,over(group) title("案例結果") ylabel(1000(1000)7000)ytick(1000(500)7000)

本命令的含義是繪制變量amount、people的條形圖,以group變量作為分組變量,并給圖形增加標題名“案例結果”,為Y軸添加數(shù)值標簽,取值為1000~7000,間距為1000,為Y軸添加刻度,間距為500,繪制結果如圖2.59所示。

graph bar(median) amount(median) people,over(group) title("案例結果")ylabel(1000(1000)7000) ytick(1000(500)7000)

本命令的含義是繪制變量amount、people的條形圖,使用的統(tǒng)計量不再是變量amount、people的均值,而是它們的中位數(shù),以group變量作為分組變量,并給圖形增加標題名“案例結果”,為Y軸添加數(shù)值標簽,取值為1000~7000,間距為1000,為Y軸添加刻度,間距為500,繪制結果如圖2.60所示。

圖2.59 條形圖3

圖2.60 條形圖3

2.3.9 點圖

下載資源:\video\第2章\…

下載資源:\sample\第2章\數(shù)據(jù)2K

點圖(Dot Plot)的功能與作用與前面提到的條形圖類似,都是用來直觀地比較一個或者多個變量的概要統(tǒng)計情況。

繪制點圖的命令的語法格式為:

graph dot yvars [if] [in] [weight] [,options]

下面繼續(xù)沿用“數(shù)據(jù)2K”數(shù)據(jù)文件為例,打開該數(shù)據(jù)文件之后,在主界面的命令窗口中依次輸入以下命令:

graph dot amount people,over(group)

本命令的含義是繪制amount和people兩個變量的點圖,并以group為分組變量,繪制結果如圖2.61所示。

graph dot amount people,over(group) title("案例結果")

本命令的含義是繪制amount和people兩個變量的點圖,并以group為分組變量,給圖形增加標題名“案例結果”,繪制結果如圖2.62所示。

圖2.61 點圖1

圖2.62 點圖2

graph dot amount people,over(group) title("案例結果") marker(1,msymbol(D))marker(2,msymbol(T))

本命令的含義是繪制amount和people兩個變量的點圖,并以group為分組變量,給圖形增加標題“案例結果”,使圖中amount變量散點標志的形狀變?yōu)閷嵭牧庑危箞D中people變量散點標志的形狀變?yōu)閷嵭娜牵L制結果如圖2.63所示。

圖2.63 點圖3

主站蜘蛛池模板: 高淳县| 莎车县| 阜新市| 广安市| 凌海市| 德格县| 张家港市| 吐鲁番市| 海阳市| 三台县| 法库县| 凤山市| 济阳县| 犍为县| 松潘县| 新民市| 安福县| 丰都县| 青海省| 金山区| 济阳县| 金湖县| 同德县| 陆丰市| 苍山县| 望奎县| 宁武县| 得荣县| 平邑县| 墨玉县| 宿迁市| 南川市| 神池县| 长沙县| 阿拉善左旗| 寿阳县| 萨嘎县| 永福县| 行唐县| 那坡县| 隆林|