- 商業智能工具應用與數據可視化
- 王佳東
- 1391字
- 2020-09-09 10:38:35
2.1 用數據講故事
在第1章我們簡單介紹了數據可視化的概念,即數據可視化用圖形化的手段來讓數據有效地傳達信息。換句話說,數據可視化就是用數據講故事。我們生活中常見的可視化作品如PPT、書籍中的插圖、天氣預報圖等,它們都在講故事,都在利用可視化這一方式幫助我們理解數據背后的意義。
2.1.1 數據背后的故事
什么是數據?從專業定義的角度來說,數據是對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態及相互關系等進行記載的物理符號或這些物理符號的組合。概括來說,數據就是描述客觀事物的符號,也就是我們現實世界的一個快照。
數據是一個廣義的概念,其形式可以是數字,也可以是具有一定意義的文字、字母、圖形、圖像、視頻、音頻等。作為現實世界的一種映射,數據存在實際意義,或者說數據隱藏著故事。但是,數據本身是不會說話的,如果我們不知道自己想了解什么,或者能從數據中了解什么,那么,數據就只是一堆冰冷、枯燥且沒有意義的數字或符號而已。
雖然數據本身具有很強的客觀性,但數據背后的故事存在關于人的因素。我們會更關心自己所在城市的天氣數據,更關心家鄉的發展數據,而這些數據對于其他人來說,可能并沒有任何意義。正是因為存在人的因素,數據背后的故事才更加重要。例如,“失業率上升5%”和“數十萬人下崗失業”所帶來的沖擊力與情感共鳴是有區別的,前者并不能提供多少背景,而后者則具備更強的背景故事性。
2.1.2 視覺與圖形的力量
當我們第一次去某個城市旅游,在多個景點之間輪換時,我們需要利用當地的交通系統:公交或地鐵。這時我們會發現,路人的口述指引和網上搜索的一大段文字攻略都不如公交線路圖和地鐵線路圖好用。線路圖上不同的顏色表示了不同的路線,這樣我們可以明確知道景點所在的位置,知道在哪里上車、在哪里換乘、在哪里下車,判斷到達景點大致需要的時間,規劃最優的景點游玩路線。龐大的公交系統或地鐵系統就這樣直觀地展示在一張線路圖上,傳遞出大量的信息。
那么,為什么數據可視化能夠快速有效地傳達數據中的隱藏信息呢?這主要歸功于人類視覺與圖形的力量。
首先,人類通過視覺接收信息的速度是非常快的。科學家們經過實驗發現,人類視網膜能以大約10Mbps的速度傳達信息,這一速度是其他感官接收信息速度的10~100倍。
另外,與處理數字不同,人的右腦對圖像信息的處理速度非常快,是相同場景下處理數字速度的100倍以上。
這樣一來,龐大的信息量通過圖片的形式很快地被人接收,正如David McCandless所說,“可視化是壓縮知識的一種方式”。
2.1.3 講什么故事
一個數據可以包含大量的信息,但表現出來的往往只是一個詞語、數字、字母,或者圖形符號。而借助數據可視化,我們可以提取數據中的信息,了解數據背后的故事。那么,我們利用數據能講出什么樣的故事呢?我們通過可視化可以從數據中發現哪些信息呢?總結來說,我們通過可視化可以從數據中發現關系、規律和異常三類信息。
關系指指標之間的關聯關系或因果關系。例如,根據斯諾的霍亂地圖,我們可以發現街道水泵和霍亂死亡之間的關聯關系,從而判斷出被污染的井水是霍亂傳播的罪魁禍首。
數據中的規律也是我們比較關心的,例如,可從數據中發現銷售額隨季節變動的周期性,以及不同時間段網站訪問量的波動等。
最后,一些異常的數據也值得我們關注。異常值不一定全是錯誤值,其有可能是人為造成的或有可能是偶然情況。異常可用于分析原因和監測狀態等,例如,制造類企業就經常用到設備狀態監測和異常分析功能。
- 我們都是數據控:用大數據改變商業、生活和思維方式
- SQL入門經典(第5版)
- 云數據中心基礎
- 數據挖掘原理與SPSS Clementine應用寶典
- MySQL 8.x從入門到精通(視頻教學版)
- SQL優化最佳實踐:構建高效率Oracle數據庫的方法與技巧
- Chef Essentials
- 數據修復技術與典型實例實戰詳解(第2版)
- 數據挖掘競賽實戰:方法與案例
- Deep Learning with R for Beginners
- Hands-On Deep Learning for Games
- 區塊鏈應用開發指南:業務場景剖析與實戰
- 大數據技術體系詳解:原理、架構與實踐
- Configuration Management with Chef-Solo
- 敏捷數據分析工具箱:深入解析ADW+OAC