- 數據可視化原理與實戰:基于Power BI
- 雷元
- 537字
- 2023-08-25 11:40:20
1.2.1 量性數據
量性數據是按數字尺度測量的觀察值,其結果表現為具體的數值,如人數、錢數、地理面積等都是量性數據。離散型數據是指數值只能用自然數或整數為單位的數據,如家庭人數為1人或2人,不會有1.5人。而連續型數據是指用小數為單位可無限拆分的數據,如體重可以被細化至小數點后N位數。那么在可視化呈現上二者的區別在哪里呢?我們來看以下兩個例子。
圖1.2.4中x軸為年級序列、y軸為學生的平均身高。隨著年級數的增長,學生的身高呈現持續增長的趨勢。使用折線圖能很好地表達這種持續增長的關系。

圖1.2.4
圖1.2.5為某家庭成員人數變化的趨勢,同樣是表示數據持續增長,但因為y軸為家庭人數,為離散性數據,用折線圖表示每年的變化會導致一個問題,即年與年之間的變化表達并不精確,例如在2012—2013年間,家庭人數不可能為2.5人。

圖1.2.5
為了更為準確地表達家庭人數的變化趨勢,我們采用柱狀圖(見圖1.2.6),每一年的數值都是相對獨立的,這樣的表達效果更為清晰。

圖1.2.6
值得注意的是,數值型數據和分類型數據可以互相轉換,例如身高,年齡這類數據既可以是數值型數據也可以被轉化為分類型數據。
圖1.2.7為客戶年齡的分布統計,該圖的x軸為客戶的年齡值(數值型數據),y軸為客戶的計數。如果希望進一步分析人數最多的客戶群,就需要將該數值型數據轉換為分類型數據。

圖1.2.7