- 商業(yè)智能工具應用與數(shù)據(jù)可視化
- 王佳東
- 1646字
- 2020-09-09 10:38:35
2.2 數(shù)據(jù)可視化介紹
下面從數(shù)據(jù)可視化的框架、方法和流程三個方面介紹如何進行數(shù)據(jù)可視化。
2.2.1 數(shù)據(jù)可視化的框架
一個完整的數(shù)據(jù)可視化作品應具備數(shù)據(jù)處理、圖形展示、圖形映射、輔助信息四個模塊,如圖2-1所示。其中,數(shù)據(jù)處理模塊主要用一些數(shù)據(jù)處理方法對數(shù)據(jù)進行加工;圖形展示模塊可決定使用的圖形種類;圖形映射模塊則將數(shù)據(jù)映射成顏色、位置、大小等圖形視覺特征;輔助信息模塊用于添加一些輔助信息以幫助讀者理解可視化作品。

圖2-1 數(shù)據(jù)可視化的框架
例如,我們在統(tǒng)計某企業(yè)的員工年齡分布時,通過數(shù)據(jù)處理模塊對年齡段進行分組、排序等;通過圖形展示模塊選擇圖形形狀,如可以選擇柱形圖來展示年齡分布;通過圖形映射模塊將不同年齡段的柱子用不同的顏色加以區(qū)分;通過輔助信息模塊調整相應的輔助信息,如加上圖例、修改值軸單位等。最終,通過使用這四個模塊,我們得到了完整的員工年齡分布可視化結果。
2.2.2 數(shù)據(jù)可視化的方法
按照不同的分類方式,數(shù)據(jù)可視化的方法類型也不同。從最終展示方式的角度來說,數(shù)據(jù)可視化的方法可以分為兩類,即統(tǒng)計圖表方法和圖方法。
1.統(tǒng)計圖表
一般來說,數(shù)據(jù)可視化常用的圖形有柱形圖、折線圖、條形圖、餅圖、面積圖、玫瑰圖、環(huán)形圖、散點圖、氣泡圖、雷達圖、股價圖、儀表盤、全距圖、組合圖、地圖、甘特圖、GIS地圖、圓環(huán)圖、漏斗圖、框架圖、矩形樹圖、詞云圖等。每一大類又細分了多種形態(tài),如柱形圖包括堆積柱形圖、百分比堆積柱形圖、三維柱形圖、三維堆積柱形圖、三維百分比堆積柱形圖等。圖2-2所示為常見的統(tǒng)計圖表樣式示例,從左到右、從上到下依次為柱形圖、玫瑰圖、組合圖、熱力圖、多系列柱形圖、矩形樹圖、瀑布圖、股價圖、倒置面積圖、多維條形圖、對比柱狀圖、面積圖、散點圖、氣泡圖、力學氣泡圖和試管型儀表盤。

圖2-2 常見統(tǒng)計圖表樣式示例
2.圖
圖方法也是數(shù)據(jù)可視化的一種重要方法。需要注意的是,這里提到的“圖”與統(tǒng)計圖表中的“圖”不同,后者主要指帶有形狀的圖形,前者則指描述現(xiàn)實世界中的關系和層級的圖,如樹狀圖、圖論中的圖、思維導圖等。
(1)樹狀圖。樹狀圖是一種數(shù)據(jù)結構,用于表示數(shù)據(jù)中的層次關系。樹由節(jié)點和父子關系構成,其按照父子關系從最頂端的根節(jié)點(也叫樹根)向下展開,形成層次結構。
(2)圖論中的圖。圖論(Graph Theory)是數(shù)學的一個分支,它以圖為研究對象。圖論中的圖是由若干給定的點及連接兩點的線所構成的圖形,這種圖形通常用來描述某些事物之間的某種特定關系,并用點代表事物,用連接兩點的線表示相應兩個事物間具有的特定關系。
(3)思維導圖。思維導圖又稱腦圖,是一種圖像式的思維工具及一種圖像式的思考輔助工具。思維導圖使用一個中心關鍵詞或想法引起我們對事物的形象化構造和分類;它用一個中心關鍵詞或想法以輻射線連接所有的代表字詞、想法、任務或其他關聯(lián)項目。
根據(jù)可視化需求的不同,選擇的數(shù)據(jù)可視化方法也應不同,其詳細的選擇過程將在后續(xù)章節(jié)介紹。
2.2.3 數(shù)據(jù)可視化的流程
數(shù)據(jù)可視化的流程可以分為以下五個步驟,但在實際操作中,數(shù)據(jù)可視化是一個反復迭代的過程,一個優(yōu)秀的可視化作品需要反復打磨。
1.明確問題
當著手一項可視化分析任務時,第一步要明確待解決的問題,也就是明確希望通過數(shù)據(jù)可視化實現(xiàn)怎樣的目標。清晰的問題和目標能夠避免后續(xù)過程出現(xiàn)不相關的操作。
2.建立初步框架
明確了問題后,可以根據(jù)需要展現(xiàn)的數(shù)據(jù)選取基本的圖形,并擬定可視化的形式,從而建立一個初步框架。
3.梳理關鍵指標
這一步是要明確傳達的信息,確定最能提供信息的指標。這是最關鍵的一個步驟,在梳理關鍵指標時,要充分了解數(shù)據(jù)庫及每個變量的含義,必要時要創(chuàng)建一些新指標。
4.選取合適的圖表類型
不同的圖形所適用的條件也不同,因此,在選擇圖形時,應針對目標選取最合適的。這樣才有助于用戶理解數(shù)據(jù)中隱含的信息和規(guī)律,從而充分發(fā)揮數(shù)據(jù)可視化的價值。
5.添加引導信息
最后,在展示數(shù)據(jù)可視化結果時,可以利用顏色、大小、比例、形狀、標簽、輔助線等元素將用戶的注意力引向關鍵的信息。例如,輔助線可以讓用戶快速地感知當前的數(shù)據(jù)處于什么水平。
- 大規(guī)模數(shù)據(jù)分析和建模:基于Spark與R
- 數(shù)據(jù)庫技術與應用教程(Access)
- 數(shù)據(jù)可視化:從小白到數(shù)據(jù)工程師的成長之路
- 計算機信息技術基礎實驗與習題
- Access 2007數(shù)據(jù)庫應用上機指導與練習
- Hadoop與大數(shù)據(jù)挖掘(第2版)
- Lego Mindstorms EV3 Essentials
- 網(wǎng)站數(shù)據(jù)庫技術
- Flutter Projects
- 信息學競賽寶典:數(shù)據(jù)結構基礎
- 科研統(tǒng)計思維與方法:SPSS實戰(zhàn)
- IPython Interactive Computing and Visualization Cookbook(Second Edition)
- 大數(shù)據(jù)技術原理與應用:概念、存儲、處理、分析與應用
- Access 2010數(shù)據(jù)庫程序設計實踐教程
- 大數(shù)據(jù)分析:R基礎及應用