官术网_书友最值得收藏!

1.2.1 量性數據

量性數據是按數字尺度測量的觀察值,其結果表現為具體的數值,如人數、錢數、地理面積等都是量性數據。離散型數據是指數值只能用自然數或整數為單位的數據,如家庭人數為1人或2人,不會有1.5人。而連續型數據是指用小數為單位可無限拆分的數據,如體重可以被細化至小數點后N位數。那么在可視化呈現上二者的區別在哪里呢?我們來看以下兩個例子。

圖1.2.4中x軸為年級序列、y軸為學生的平均身高。隨著年級數的增長,學生的身高呈現持續增長的趨勢。使用折線圖能很好地表達這種持續增長的關系。

圖1.2.4

圖1.2.5為某家庭成員人數變化的趨勢,同樣是表示數據持續增長,但因為y軸為家庭人數,為離散性數據,用折線圖表示每年的變化會導致一個問題,即年與年之間的變化表達并不精確,例如在2012—2013年間,家庭人數不可能為2.5人。

圖1.2.5

為了更為準確地表達家庭人數的變化趨勢,我們采用柱狀圖(見圖1.2.6),每一年的數值都是相對獨立的,這樣的表達效果更為清晰。

圖1.2.6

值得注意的是,數值型數據和分類型數據可以互相轉換,例如身高,年齡這類數據既可以是數值型數據也可以被轉化為分類型數據。

圖1.2.7為客戶年齡的分布統計,該圖的x軸為客戶的年齡值(數值型數據),y軸為客戶的計數。如果希望進一步分析人數最多的客戶群,就需要將該數值型數據轉換為分類型數據。

圖1.2.7

主站蜘蛛池模板: 绥滨县| 临江市| 方正县| 榆中县| 耿马| 宜川县| 藁城市| 通海县| 遂平县| 沧源| 屏东县| 申扎县| 长沙市| 张北县| 平武县| 松原市| 巫山县| 华安县| 沙田区| 阳西县| 屏边| 分宜县| 汝州市| 凤山县| 云浮市| 鹿邑县| 龙游县| 呼玛县| 张北县| 屯昌县| 静宁县| 奉新县| 林周县| 满洲里市| 静宁县| 太康县| 策勒县| 平定县| 阜宁县| 忻州市| 德阳市|