- 鮮活的數據:數據可視化指南
- (美)Nathan Yau
- 3138字
- 2020-01-10 15:32:36
1.1 不只是數字
讓我們面對現實——如果在一開始我們不知道自己想了解什么,或者不知道有什么可以去了解,那么數據就是枯燥的。它不過是數字和文字的堆砌,除了冰冷的數值之外沒有任何意義。而統計與可視化的好處就在于能幫助我們觀察到更深層次的東西。請記住,數據是現實生活的一種映射,其中隱藏著許多故事,在那一堆堆的數字之間存在著實際的意義、真相和美學。而且和現實生活一樣,有些故事非常簡單直接,有些則頗為迂回費解。有些故事只會出現在教科書里,而其他一些則體裁新奇。講故事的方式完全取決于你自己,不管你的身份是統計學家、程序員、設計師還是數據研究者。
以上就是我作為一名統計學研究生所學到的第一課。我必須承認在接觸這門課之前,我一直認為統計學就是一門單純的分析學科,而數據也只不過是一種機械式作業的產物而已。的確,在很長一段時間內我都這么想——畢竟,作為一名電氣工程專業的大學畢業生,用這種眼光來看待數據是情有可原的。
不要誤解我的意思,有這種看法未必是一件壞事。但我在數年后認識到,數據雖然有很強的客觀性,但其中往往也存在著人的因素。
比如說,讓我們再來看看失業率問題。說出一個全國平均數字很容易,但正如我們所見,不同地區對每個人的意義是不一樣的,甚至連街區的遠近都會造成差異。如果你認識的某個人這兩年一直沒有工作,其實是很難把他視為一個冷冰冰的統計數字的,不是嗎?這些數字代表的是活生生的人,所以我們處理數據時必然會帶有感情因素。當然,我們也不可能講述每一個人的故事,但在“失業率攀升5個百分點”和“數十萬人失業下崗”之間還是有著微妙但重要的區別。前者讀起來只是一個沒有多少上下文背景的數字,而后者卻更能讓人產生共鳴。
1.1.1 新聞報道
在《紐約時報》的圖形設計實習機會讓我感觸頗深。雖然那只是我研二暑假期間的短短三個月而已,但它影響了我此后處理數據的方式。我學會的不僅是為新聞繪制圖表,我還學會了如何像報道新聞那樣報道數據,而這需要更多的精力去設計、組織、核查、追蹤和研究。
有一次我的任務是核實某個數據集中的三個數字,因為《紐約時報》的圖形編輯部在繪制圖表時,必須確保報道的所有數據都是準確無誤的。我們只有在確信所有數據都可靠之后,才會去考慮表現層面的問題。正是這種對細節的關注讓該報的圖表如此優秀。
《紐約時報》的任何一個圖表都是如此。它將數據表現得非常清晰、簡潔,甚至可以說是優美。這代表著什么呢?只有在閱讀這樣的圖表時,你才能理解數據的意義。重要的點或區域都帶有注釋,使用的符號和顏色都進行了詳細的說明,而且它能讓讀者輕松地了解數據中的信息。這已經不僅是圖形了,這簡直是圖形的藝術。
圖1-1就類似于你在《紐約時報》中所看到的那些圖表。它顯示了各年齡段的人在未來一年內死亡的概率。

圖1-1 不同年齡段的死亡概率
?訪問http://datafl.ws/nytimes,欣賞《紐約時報》的一些優秀圖表。
這張圖表從根本上來說只是一個折線圖(line chart)而已,但是其中的設計元素讓它顯得生動:指針和標記提供了上下文環境,便于讀者理解這些數據的有趣之處,而曲線的顏色和寬度則將他們的視線引導到重要的地方。
圖表和圖形并不只是將統計結果可視化,它們還對可視化展現的內容進行解釋。
說明 觀賞Geoff McGhee的紀錄片Journalism in the Age of Data(數據時代的新聞業),了解新聞記者是如何運用數據來報道當今事件的。片中采訪了許多業界高人。
1.1.2 藝術
《紐約時報》是客觀的。它為人們呈現數據、展現事實,而且干得很棒。但可視化的另一面則不太注重分析,而更多偏重于挖掘人類的情感,比如Jonathan Harris和Sep Kamvar的作品We Feel Fine(見圖1-2)。

圖1-2 Jonathan Harris和Sep Kamvar的作品We Feel Fine(另見彩插圖1-2)
這件交互作品可以從各個公開的個人博客中抓取詞句,然后將它們以懸浮氣泡的形式展現出來。每一個氣泡都代表著某種情緒,而且有相應的顏色標記。從整體來看,氣泡就像無數個體在空間中無止境地漂浮,但觀察一段時間之后你就會發現它們開始聚集。如果在頂部菜單中選擇各種分類,還能看到這些貌似隨機的片斷之間的聯系。點擊單獨的氣泡可以看到它自身的來龍去脈。整個作品既富有詩意又能給人以啟迪。
?訪問http://wefeelfine.org,欣賞Jonathan Harris和Sep Kamvar的在線作品,并探索人們此刻的情緒。
還有很多類似的例子,比如Golan Levin的The Dumpster(垃圾桶),它同樣也是抓取博客,但只涉及與他人斷絕關系的內容。還有Kim Asendorf的Sumedicina,講述了一個人脫離腐敗組織的虛構故事,里面沒有只言片語,只有圖形圖表。這樣的例子還包括Andreas Nicolas Fischer展現美國經濟滑坡的實體雕塑。
?訪問http://datafl.ws/art,觀看FlowingData上更多有關數據和藝術跨界的例子。
重點是,數據和可視化并不一定只能和冰冷的、不爭的事實相關。有時我們尋求的并不是分析和洞察,而是從富有情感的觀點來講述故事,鼓勵讀者對數據作出回應。并不是所有的電影都必須是紀錄片,同樣,也并不是所有的可視化都必須是傳統的圖形或圖表。
1.1.3 娛樂
在新聞報道和藝術創作之間,可視化在娛樂領域也找到了一席之地。如果我們以更為抽象的角度來看待數據,在電子表格和帶分隔符的文本之外,將照片和狀態更新也包括在內,那么就不難發現這一點。
Facebook利用人們的狀態更新來判定一年中最快樂的日子是哪一天,而在線約會網站OkCupid則根據用戶的在線信息來估算人們會怎樣夸大自己在數字世界中的形象,如圖1-3所示。這些分析并不會為網站帶來業績的提升、收入的增加,也不可能幫助排除系統故障,但它們卻因為娛樂方面的價值而像野火一樣迅速在互聯網上四處傳播。數據能在一定程度上折射出我們自身和社會的投影。

圖1-3 OkCupid上的男性身高分布
Facebook發現一年中最快樂的日子是感恩節,而OkCupid發現人們一般都會將自己的身高夸大2英寸(約5厘米)左右。
? 訪問OkCupid的博客OkTrends(http://blog.okcupid.com)以查看有關網上約會的更多發現,例如白色人種最喜歡的是什么,以及如何在細節處保持形象。
1.1.4 引人注目
當然,并不是所有的故事都以增長見聞或者娛樂大眾為目的。有時候它們是為了提出倡議或者呼吁人們作出行動。在紀錄片《難以忽視的真相》中就有令人難忘的一幕:主講人Al Gore要依靠剪叉式升降機的幫助才能靠近二氧化碳的上升曲線。
不過在我看來,卡羅琳學院的國際衛生學教授、Gapminder基金會理事Hans Rosling在這方面才是真正的無人能及。Rosling曾經運用一款叫做Trendalyzer的工具(見圖1-4),以動畫的方式來展現世界各國擺脫貧困的歷程。在他的那次演講中,所有觀眾從一開始就被深深吸引到數據的世界里,而在結束時都情不自禁地起立鼓掌喝彩。真的非常精彩,強烈建議不要錯過。

圖1-4 Gapminder基金會開發的Trendalyzer軟件(另見彩插圖1-4)
?欲知Hans Rosling如何用數據和精彩的演示贏得現場觀眾的喝彩,訪問http://datafl.ws/hans。
他運用的可視化技巧非常簡單,不過是一種可運動的圖表而已。其中的氣泡代表各個國家,根據該國的貧富程度在時間軸上移動。那他的演講為何會如此大受歡迎呢?因為Rosling在演講時充滿著信念和激情。他是在給大家講故事。我們都遇到過配有圖形圖表演示的演講者,但其中絕大多數都讓觀眾昏昏欲睡。而Rosling卻把握住了數據背后的意義,并將其作為自己的優勢,最后的吞劍表演則更是水到渠成的一筆。在看了Rosling的演講之后,我忍不住想親手把玩那些數據,重溫一遍他所講的故事。
之后我又看過Gapminder基金會的另一次演講,相同的主題、相同的可視化方式,但卻是另一位演講人。這次就不那么令人興奮了——說老實話,稱其為催眠曲也不為過。在數據中觀眾感覺不到任何情緒,也不能讓人從中感到任何信念或激情。由此可見,數據本身或許并不一定趣味盎然,令人產生深刻印象的是你設計數據和演示數據的方法。
綜上所述,我們應當以講故事的角度來思考如何可視化。你打算講一個什么樣的故事呢?它的體裁類似于報告還是小說?你是否想說服人們應當采取某種行動?
和小說中的人物成長一樣,每一個數據背后都有它自己的故事,如同書中的每一個角色都有著各自的過去、現在和未來。那些數據彼此之間充滿著互動和聯系,如何表現出這些關系則取決于你自己。這就像在動筆寫小說之前,我們必須先學會遣詞造句一樣。
- Dynamics 365 for Finance and Operations Development Cookbook(Fourth Edition)
- Rake Task Management Essentials
- Mastering Scientific Computing with R
- SAP BusinessObjects Dashboards 4.1 Cookbook
- JavaCAPS基礎、應用與案例
- Mastering Akka
- 基于SpringBoot實現:Java分布式中間件開發入門與實戰
- Android驅動開發權威指南
- Kubernetes進階實戰
- 動手打造深度學習框架
- 精通Spring:Java Web開發與Spring Boot高級功能
- 微信小程序開發邊做邊學(微課視頻版)
- 一覽眾山?。篈SP.NET Web開發修行實錄
- Spring Boot學習指南:構建云原生Java和Kotlin應用程序
- SQL Server 2014數據庫設計與開發教程(微課版)