官术网_书友最值得收藏!

2.1 用數據講故事

在第1章我們簡單介紹了數據可視化的概念,即數據可視化用圖形化的手段來讓數據有效地傳達信息。換句話說,數據可視化就是用數據講故事。我們生活中常見的可視化作品如PPT、書籍中的插圖、天氣預報圖等,它們都在講故事,都在利用可視化這一方式幫助我們理解數據背后的意義。

2.1.1 數據背后的故事

什么是數據?從專業定義的角度來說,數據是對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態及相互關系等進行記載的物理符號或這些物理符號的組合。概括來說,數據就是描述客觀事物的符號,也就是我們現實世界的一個快照。

數據是一個廣義的概念,其形式可以是數字,也可以是具有一定意義的文字、字母、圖形、圖像、視頻、音頻等。作為現實世界的一種映射,數據存在實際意義,或者說數據隱藏著故事。但是,數據本身是不會說話的,如果我們不知道自己想了解什么,或者能從數據中了解什么,那么,數據就只是一堆冰冷、枯燥且沒有意義的數字或符號而已。

雖然數據本身具有很強的客觀性,但數據背后的故事存在關于人的因素。我們會更關心自己所在城市的天氣數據,更關心家鄉的發展數據,而這些數據對于其他人來說,可能并沒有任何意義。正是因為存在人的因素,數據背后的故事才更加重要。例如,“失業率上升5%”和“數十萬人下崗失業”所帶來的沖擊力與情感共鳴是有區別的,前者并不能提供多少背景,而后者則具備更強的背景故事性。

2.1.2 視覺與圖形的力量

當我們第一次去某個城市旅游,在多個景點之間輪換時,我們需要利用當地的交通系統:公交或地鐵。這時我們會發現,路人的口述指引和網上搜索的一大段文字攻略都不如公交線路圖和地鐵線路圖好用。線路圖上不同的顏色表示了不同的路線,這樣我們可以明確知道景點所在的位置,知道在哪里上車、在哪里換乘、在哪里下車,判斷到達景點大致需要的時間,規劃最優的景點游玩路線。龐大的公交系統或地鐵系統就這樣直觀地展示在一張線路圖上,傳遞出大量的信息。

那么,為什么數據可視化能夠快速有效地傳達數據中的隱藏信息呢?這主要歸功于人類視覺與圖形的力量。

首先,人類通過視覺接收信息的速度是非常快的。科學家們經過實驗發現,人類視網膜能以大約10Mbps的速度傳達信息,這一速度是其他感官接收信息速度的10~100倍。

另外,與處理數字不同,人的右腦對圖像信息的處理速度非常快,是相同場景下處理數字速度的100倍以上。

這樣一來,龐大的信息量通過圖片的形式很快地被人接收,正如David McCandless所說,“可視化是壓縮知識的一種方式”。

2.1.3 講什么故事

一個數據可以包含大量的信息,但表現出來的往往只是一個詞語、數字、字母,或者圖形符號。而借助數據可視化,我們可以提取數據中的信息,了解數據背后的故事。那么,我們利用數據能講出什么樣的故事呢?我們通過可視化可以從數據中發現哪些信息呢?總結來說,我們通過可視化可以從數據中發現關系、規律和異常三類信息。

關系指指標之間的關聯關系或因果關系。例如,根據斯諾的霍亂地圖,我們可以發現街道水泵和霍亂死亡之間的關聯關系,從而判斷出被污染的井水是霍亂傳播的罪魁禍首。

數據中的規律也是我們比較關心的,例如,可從數據中發現銷售額隨季節變動的周期性,以及不同時間段網站訪問量的波動等。

最后,一些異常的數據也值得我們關注。異常值不一定全是錯誤值,其有可能是人為造成的或有可能是偶然情況。異常可用于分析原因和監測狀態等,例如,制造類企業就經常用到設備狀態監測和異常分析功能。

主站蜘蛛池模板: 湟中县| 青海省| 民丰县| 宜兰县| 安泽县| 合肥市| 肥城市| 芦山县| 阿拉尔市| 新乡市| 广西| 无锡市| 驻马店市| 陵水| 田林县| 青龙| 会宁县| 平谷区| 五大连池市| 靖江市| 泰宁县| 隆化县| 盐津县| 永丰县| 杨浦区| 广河县| 成武县| 四平市| 门头沟区| 株洲市| 红桥区| 灵川县| 巴楚县| 凤阳县| 永康市| 蒙自县| 桐乡市| 鹤庆县| 新宾| 苏尼特左旗| 云阳县|