官术网_书友最值得收藏!

1.3 What問題:圖表的視覺機制

圖形對象和視覺屬性

圖表使用各類圖形對象表達數值數據。常見的圖形對象包括點、線、柱(條)形、面積等。某些非常規圖表則使用顏色、角度等表達數據。在大多數可視化軟件中,圖表類型及其結構變化大多由上述圖形對象決定。例如,柱形圖和線圖的區分主要在于二者分別使用柱形和線條展現數據,其他方面并無差異。

顯然,不同的圖形對象在展示數據信息方面各有特點。點、線和柱(條)形都是通過坐標軸平面空間內的位置表達數據的,餅圖用的是扇區面積,氣泡圖用的是位置和圓圈大小,熱力圖則通過顏色區分數值的高低。表1-1對比了這些圖表類型(圖形對象)在表達數據方面的差異。

表1-1 不同圖形對象的數據表達能力

續表

同時,不同的圖形對象還擁有不同的視覺屬性,這些屬性基本上可分為形狀和顏色兩大類。前者和圖形對象的幾何特性有關,后者則一般使用不同色系或同色系但飽和度不同的顏色表達。表1-2列出了常見圖形對象的部分形狀和顏色屬性,不同的可視化軟件所提供的形狀和顏色選項或有差別。

表1-2 主要圖形對象的形狀和顏色屬性

顯然,視覺屬性由圖形對象決定。例如,數據標記、線條顏色主要適用于點圖和線圖,而不適用于柱形圖和條形圖。填充圖案僅適用于柱形圖、條形圖及面積類圖形對象等。在不同的應用場景中,形狀屬性和顏色屬性可能發揮不同的作用。在黑白印刷這樣的顏色顯示受限的情況下,會優先使用形狀屬性。在彩色印刷和多數電子屏幕中,顏色屬性則憑借其視覺吸引力更受用戶青睞。以常見的柱形圖為例,使用橫向、縱向條紋等圖案填充的柱形圖通常多在學術作品中出現,而報刊雜志及電子出版物中大多使用豐富多樣的色彩來填充。

圖形對象的形狀和顏色屬性的用處何在?對于僅包含單個數據系列即只有一種圖形對象的圖表,一個分類軸和一個數值軸(XY散點圖有兩個數值軸)就足以滿足繪圖之需。因此,視覺屬性在此類圖表中的意義不大。例如,對于圖1-3中列出的各圖表,除非有特別目的需要對不同數據點設置不同格式,否則一般情況下此舉均屬多余。

圖1-3 多余的視覺屬性

視覺屬性的意義主要體現在多數據系列的圖表中。隨著數據維度的增加,例如“不同行業板塊不同市值區間的平均市盈率分布”“不同行業板塊平均市盈率的月度變化”等,這些多維數據包含行業和市值區間、行業和月份等多個維度的分類信息,而二維圖表僅能提供一個分類軸,此時可使用形狀和顏色等屬性對多個數據系列進行區分。在此意義上,本章介紹的可視化基本原則在本質上主要適用于多系列或多維分類數據。對于諸如“某公司各季度營收變化”之類的單一分類數據(按季度分類),在遵循相同設計的前提下,使用何種圖形對象或何種圖表類型表達,差異并不顯著。

此外,拋開對“數據系列”的技術層面的理解,在許多較大的樣本數據中,如需對部分特定數據點突出顯示,也離不開對視覺屬性的合理使用。在此情形下,視覺屬性是一種有力的分組、聚類表達,在數據挖掘中也有重要用途。

圖1-4反映了28個成員國對歐盟的出口依賴及歐盟移民在本國人口中所占比例。圖中左上部分代表對歐盟出口依賴程度較低、歐盟移民占本國人口比例較大的區域。圖1-4對部分數據點即惠譽國際評級機構認定的高風險國使用特殊的顏色和形狀標記來區分。這些聚集于圖表左上區域的國家同時又具備兩個共同特點:島嶼國家、英聯邦成員國或前成員國。

圖1-4 視覺屬性在數據分組中的應用示例

由此可見,對視覺屬性的合理應用是數據可視化的關鍵環節,因此還需進一步了解其背后的視覺機制。

視覺機制和前注意過程

在人的各種感覺中,視覺是接受信息的最有效渠道。研究表明,人類70%的感覺神經都與視覺有關。視覺刺激和感知在很大程度上發生于前注意(Preattentive)過程。作為視覺感知的初期階段,前注意過程產生于意識層之下,能以極高速度捕捉視覺對象的各種信息,如顏色、位置和形狀等。與之相比,注意過程則是發生于意識層面的高級認知,例如閱讀、理解文字的含義,其效率遠遠低于前注意過程的效率。

圖1-5可用于說明注意過程和前注意過程的區別,請試著在左右兩圖中找出各有幾個數字“6”。答案雖然相同,但二者所涉及的視覺感知機制完全不同。左圖中的數字沒有呈現出任何能夠觸發前注意過程的視覺特征,因此需要在意識層面逐項計數,使用的是速度較慢的注意處理系統。相比之下,從右圖中幾乎可以瞬間得出答案,原因即在于其中的數字“6”使用了能激發前注意過程的視覺特性:僅數字“6”為黑色,其余數字均為淺灰色。兩種顏色形成了反差強烈的前景和背景效應,這是由前注意過程高效處理的。

圖1-5 注意過程和前注意過程的區別本圖參考Stephen Few的著作《秀出數據:如何設計啟迪人心的表格和圖表》。示例:找出圖中有幾個“6”

圖表展現數據形態,成功的圖表能向讀者高效地傳達數據信息和觀點,原因就在于其充分利用了視覺上的前注意處理,這個過程比有意識的認知更加迅速。為了實現高效的傳達和溝通,圖表設計和制作的關鍵是要使前注意處理盡可能發揮作用,從而引導讀者在短時間內對圖表所要表達的信息留下印象。換言之,在某種意義上,制作圖表時要用心構思,才可使讀者無須費神即可解讀。成功的圖表能夠幫助數據實現自我表達,其前提正在于充分利用視覺感知的基本原理。

當然,采用何種方式展現數據,也要視具體的應用需求而定。文字描述和表格并非一無是處。例如,當需要展現數據精度或提供準確數據供查詢時,以及對于數量級別差異懸殊的數據,信息特征不明確、缺乏任何形態或趨勢的數據,有時就更適合使用文字或表格來描述,交由注意過程的高級思維消化處理。此外,前注意處理盡管高效卻極易耗盡注意力資源,在處理視覺屬性上也存在一些重大限制。

理解視覺屬性的邊界

不幸的是,前注意過程僅在一定限制范圍內有效,超出范圍會導致其效果迅速惡化,最終不但于事無補,而且會妨礙數據表達。

首先,在圖表中使用單一視覺屬性存在數量限制。隨著數量的增加,視覺效果會顯著弱化。有研究表明,二維圖表中圖形對象的任意視覺屬性都不應超過4個,否則會造成類似“內存耗盡”的不良后果。

在圖1-6上半部分,左右兩圖分別使用了8種和4種顏色代表對應數量的數據系列。右圖包含Q1~Q4(4個季度)4個系列,想明確看出各季度具體的變化特點相當不易,左圖的數據系列數量翻倍,各系列的數據信息就更無法感知了。圖1-6下方的圖表使用了4種顏色代表4個不同的行業分組,數據信息同樣難以快速消化,而且密集的數據點進一步提高了閱讀難度。

圖1-6 單一視覺屬性的數量限制圖片來源:高盛證券研究報告。

由此可見,在顏色數量超出前注意過程處理能力的情況下,無論是應用不同顏色,還是使用強弱不同的同一個顏色,視覺效果都無法得到改善。另外,在圖表中對同一個圖形對象使用多種視覺屬性的情況下(同時使用形狀和顏色),前注意過程幾乎更是無法發揮作用。當各系列數據缺乏顯著差異時,圖表甚至會立即陷入視覺陷阱,喪失最基本的可讀性。圖1-7和圖1-8都不恰當地同時使用了形狀和顏色兩種屬性,導致圖表難以閱讀。

圖1-7 不恰當地使用多重視覺屬性(1)

圖1-8 不恰當地使用多重視覺屬性(2)

可視化的本質

一個反映時間序列的折線圖,如果缺乏明顯趨勢或信號特征不明確,則隨著數據系列數量的增加,線條的上下交錯將導致其視覺效果不斷惡化。圖1-8就是一種極端情況,此類圖表在各類研究報告中并不少見。

同樣,一個清晰美觀的單系列柱形圖或條形圖,無論數據信息有何特征,只要增加數據點和數據系列,其視覺效果就將急轉直下。原因在于隨著數據點的增加,柱形或條形的緊密堆簇會妨礙讀者對不同數據的識別和對比。隨著數據系列數量的增加,這個缺陷將變得更加明顯。因為每增加一個數據系列,就意味著圖表需要多使用一種色彩并產生大面積的顏色區域,而且顏色面積的增加和數據點的增加不成比例。

圖1-9是一個單系列條形圖,由于僅含一個數據系列,且繪圖數據事先經排序處理,所以圖中數據信息清晰簡潔,反映了2017年A股部分行業上市公司境外收入占比。

圖1-9 單系列條形圖示例

圖1-10是包含三個系列的條形圖,對比其與圖1-9的視覺效果可發現,隨著數據系列的增加,不同系列之間的干擾變得嚴重,解讀圖中數據系列的信息明顯變得困難。圖1-11則進一步表明,在分類和維度更多的數據中,柱(條)形圖的視覺效果會進一步變差。

圖1-10 多系列條形圖示例

圖1-11對比了1995年與2012年亞洲部分經濟體對中國和對日本的出口在其出口總額中所占份額的變化情況。由于繪圖數據包含經濟體、出口目的地和年份等多個維度,因此圖1-11將其處理為兩個并列的條形圖,分別與兩個年份對應。紅藍交錯的條形導致讀者在前注意過程中無法快速獲得有價值的信息。本書將在第4章進一步闡述此圖并提出可行的替代方案。

圖1-11 多維度條形圖實例

由此可見,如何在數據分類及系列數量不斷增加的情況下,確保圖表仍可被前注意過程高效處理,以保持圖表的視覺質量不被破壞、清晰傳達數據的形態信息,是數據可視化在圖表層面的核心要義。理解視覺屬性的邊界和可視化的本質,一方面能避免在圖表表達中濫用讀者的注意力資源,另一方面也會促使制圖者更注重數據本身的意義,探索和提煉更有價值的信息。

主站蜘蛛池模板: 阜新| 额敏县| 楚雄市| 汉沽区| 千阳县| 象州县| 无极县| 宾阳县| 定边县| 金溪县| 博爱县| 府谷县| 石嘴山市| 晋中市| 扎赉特旗| 河东区| 武山县| 陵水| 林西县| 西乌珠穆沁旗| 长子县| 巩义市| 缙云县| 云霄县| 保定市| 腾冲县| 绿春县| 思南县| 沁阳市| 泾阳县| 江津市| 西林县| 章丘市| 察雅县| 临泉县| 林西县| 九龙坡区| 白城市| 紫金县| 河北区| 益阳市|