官术网_书友最值得收藏!

2.6 數據的展示——統計圖

統計圖是利用點、線、面、體等繪制成幾何圖形,以表示統計數據大小關系和變動情況的各種圖形的總稱。在數據分析中,把利用統計圖形展現統計數據的方法叫作統計圖示法,由于該方法具有形象具體、簡明生動、通俗易懂、一目了然等特點,因此在描述性數據分析中得到了廣泛的應用。常用的統計圖有條形圖、扇形圖、折線圖、箱線圖、莖葉圖和直方圖等。

2.6.1 條形圖與扇形圖

條形圖是一種以長方形的長度為變量的統計圖表。條形圖可以清楚地表明各種數量的多少,易于比較數據之間的差別。條形圖是統計圖資料分析中最常用的圖形,如圖2.18所示。

圖2.18 三國人物各國分布情況條形圖

扇形圖是用整個圓形表示總數,用圓形內各個扇形的大小表示各部分數量占總數的百分比。扇形圖可以很清楚地表示出各部分數量同總數之間的關系,如圖2.19所示。

圖2.19 三國人物各國分布情況扇形圖

條形圖和扇形圖在描述數據時,一次不能描述過多的變量,通常用于較小的數據集分析,使用Excel可以很方便地實現條形圖和扇形圖的繪制,本書不做贅述。在進行數據分析時,對于定性數據一般使用條形圖或扇形圖進行刻畫,可以達到簡單易懂、一目了然的目的。

2.6.2 折線圖

折線圖是利用線形的升降起伏(上升或下降)來表示統計數據的增減變化的統計圖。與條形圖比較,折線圖不僅可以表示數量的多少,還可以反映同一事物在不同時間里的發展變化情況。折線圖在生活中運用得較為廣泛,其主要用于顯示時間數列的數據,如圖2.20所示。

圖2.20 1991—2013年全國商品住宅平均銷售價格折線圖

2.6.3 莖葉圖

莖葉圖又稱“枝葉圖”,由統計學家約翰托奇設計,它的設計思路是將數組中的數按位數進行比較,將數的大小基本不變或變化不大的位作為一個主干(莖),將數變化大的位作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個主干后面有幾個數,每個數具體是多少。莖葉圖能直觀地反映數據的集中趨勢。

1.莖葉圖的畫法

在繪制莖葉圖時,一般將每個數據分為莖(高位)和葉(低位)兩部分。在繪制過程中,主要是設計好莖,當數據是兩位整數時,莖為十位上的數字,葉為個位上的數字;當數據是由整數部分和小數部分組成時,可以把整數部分作為莖,小數部分作為葉。下面以一個具體的例子來描述莖葉圖的繪制思路。

例2.7 某生產車間30名工人某日加工零件的個數如下:

134 112 117 126 128 124 122 116 113 107

116 132 127 128 126 121 120 118 108 110

133 130 124 116 117 123 122 120 112 112

請設計適當的莖葉圖表示這組數據,并根據莖葉圖說明一下這個車間此日的生產情況。

解析:以前兩位數為莖,個位數為葉,可以畫出相應的莖葉圖,從而可根據莖葉圖分析數據的特征。畫出的莖葉圖如圖2.21所示。

百位十位個位

圖2.21 莖葉圖

從莖葉圖上看,該生產車間的工人加工零件數大多都在110~130,且分布較對稱、集中,這說明該生產車間每日生產情況穩定。

2.使用SPSS畫莖葉圖

下面以三國時期魏國人物武力為例,講述使用SPSS畫莖葉圖的過程,步驟如下。

(1)使用“三國人物數據.xlsx”文件中的數據,從中篩選出魏、蜀、吳三個國家的人物武力數據,其中國家1為魏國,國家2為蜀國,國家3為吳國,將數據從Excel中復制到SPSS中,切換到變量視圖,修改SPSS中變量名稱和小數位數,如圖2.22所示。

圖2.22 變量視圖

切換到數據視圖,單擊“分析—描述統計—探索”命令,如圖2.23所示。

圖2.23 選擇“探索”

(2)在彈出的“探索”對話框中,將變量“魏”移到因變量列表中,選中左下方的“圖”單選框,如圖2.24所示。

圖2.24 “探索”對話框

(3)單擊右上方的“繪制”按鈕,在“探索:圖”對話框中,勾選“莖葉圖”復選框,單擊“繼續”按鈕,如圖2.25所示。

圖2.25 “探索:圖”對話框

(4)在“探索”對話框中單擊“確定”按鈕,SPSS就輸出了魏國人物武力的莖葉圖,如圖2.26所示。

圖2.26 SPSS生成的莖葉圖

2.6.4 箱線圖

箱線圖又稱為盒須圖、盒式圖或箱形圖,是一種用于顯示一組數據分散情況的統計圖。其繪制需要使用描述性統計分析的大部分測度值,最適宜提供有關數據的位置和分散情況的參考,尤其對不同的總體數據更可表現其差異。箱線圖因形狀像箱子而得名,在各種數據分析領域經常被使用,如品質管理分析、異常值檢查。

如圖2.27所示,其中標示了每條線表示的含義,這里應用了分位數的概念。

箱線圖主要包含六個數據節點,將一組數據從大到小排列,分別計算出它的上邊緣、上四分位數、中位數、下四分位數、下邊緣,還有異常值。上四分位數(Q3)、下四分位數(Q1)、中位數在前面已經描述過,此處不再復述。圖中的上邊緣,有時也叫上界,其計算公式為:上邊緣值=Q3+1.5(Q3-Q1),其中Q3為上四分位數,Q1為下四分位數;圖中的下邊緣,有時也叫下界,其計算公式為:下邊緣值=Q1-1.5(Q3-Q1)。

圖2.27 箱線圖

異常值是指超出上界或下界的數據點,它分成兩種類型。一種是極端異常值,即超出四分位數差(Q3-Q1)3倍距離的異常值,用“*”表示;另一類是較為溫和的異常值,即處于1.5~3倍四分位數差(Q3-Q1)的異常值,用實心點“●”表示。

1.箱線圖的畫法

箱線圖的繪制步驟如下。

(1)將一組數據從大到小排列,通過百分位計算方法,計算六種數據節點。

(2)畫數軸,度量單位大小和所研究的數據對象的單位一致,起點比最小值略小,長度比研究的數據系列的全距略長。

(3)畫一個矩形盒,兩端邊的位置分別對應數據系列的上下四分位數(即Q1和Q3)。在矩形盒內部中位數的位置畫一條線段為中位線。

(4)從矩形盒兩端邊向外各畫一條線段直到不是異常值的最遠點,表示該批數據正常值的分布區間。

(5)用“●”標出溫和的異常值,用“*”標出極端的異常值。相同值的數據點并列標在同一數據線位置上,不同值的數據點標在不同數據線的位置上。

2.使用SPSS做箱線圖

下面以三國時期魏、蜀、吳人物武力數據為例,講述SPSS畫箱線圖的過程,步驟如下。

(1)將數據輸入到SPSS的過程和上述繪制莖葉圖的過程一樣,輸入完成后,單擊“分析—描述統計—探索”命令,如圖2.28所示。

圖2.28 選擇“探索”命令

(2)在彈出的“探索”對話框中,將變量“魏”、“蜀”、“吳”移到因變量列表中,選中左下方的“圖”單選框,如圖2.29所示。

圖2.29 “探索”對話框

(3)單擊右上方“繪圖”按鈕,在“探索:圖”對話框中,選中“不分組”單選框,單擊“繼續”按鈕,如圖2.30所示。

圖2.30 “探索:圖”對話框

(4)在“探索:圖”對話框中單擊“確定”按鈕,之后SPSS就輸出了三個國家人物武力箱線圖,如圖2.31所示。

圖2.31 三個國家人物武力對比箱線圖

從圖2.31可以看出,吳國箱體較小,說明其50%的人物武力比較集中,并且中位線最高,說明平均值應比較大;蜀國箱體較大,說明其50%的人物武力比較分散;而魏國的中位線最低,說明其平均值應比較小。

2.6.5 統計圖小結

面對一組數據,選擇恰當的統計圖來表達數據分析的目標,是數據分析人員必須要掌握的一項技能。統計圖有其不同的適用范圍,本節進行簡要歸納,如表2-8所示。

表2-8 各類統計圖對比

統計圖使用注意事項:

(1)圖是語言的一種重要形式,如果運用得當,則比起表格來更能明快清晰地進行溝通。

(2)決定統計圖形式的不是數據,也不是尺寸,而是你想說明的主題和你想指出的內容要點。

(3)統計圖在于精,而不在于多,只有當統計圖能夠幫助你表達所想的主題時才使用。

(4)統計圖是直觀教具,它不能取代書寫和講述,只有在幫助你傳達主題時,它才起作用。

主站蜘蛛池模板: 阳山县| 淳化县| 安远县| 湖口县| 宜兴市| 麻阳| 崇阳县| 平陆县| 株洲市| 油尖旺区| 隆安县| 宜君县| 厦门市| 天津市| 鲁山县| 冷水江市| 临桂县| 霍城县| 庐江县| 习水县| 社旗县| 洪湖市| 万载县| 腾冲县| 兴化市| 林甸县| 大邑县| 黔南| 行唐县| 叶城县| 饶平县| 从化市| 雷波县| 清流县| 香格里拉县| 湘阴县| 资中县| 阳西县| 来宾市| 贵州省| 九寨沟县|