- 大數據云圖:如何在大數據時代尋找下一個大機遇
- (美)大衛·芬雷布
- 601字
- 2019-01-01 00:13:21
可視化,1張圖片等于1000個字
1張圖片等于1000個字。為什么這樣說呢?正如大衛·麥克坎德萊斯(David McCandless)所說的那樣,“可視化是壓縮知識的一種方式”。減少數據量是一種壓縮方式,如采用速記、簡寫的方式來表示一個詞或者一組詞。但是,數據經過壓縮之后,雖然更容易存儲,卻讓人難以理解。然而,圖片不僅可以容納大量信息,還是一種便于理解的表現方式。在大數據里,這樣的圖片就叫作“可視化”。
地鐵圖、餅狀圖和條形圖都是可視化的表現方式。乍一看,可視化似乎很簡單。但由于種種原因,要理解起來并不容易。
首先,它很難滿足人們希望將所有數據相互銜接并出現在同一個地方的愿望。
其次,內部環境和外部環境的數據信息可能存儲在兩個不同的地方。行業數據可能存儲在市場調查報告之中,而公司的具體銷售數據則存儲在公司的數據庫中。而且,這兩種數據的存儲模式也有細微的差別。公司的銷售數據可能是按天更新存儲的,而可用的行業數據可能只有季度數據。
最后,數據信息不統一的叫法也使我們難以理解數據真正想傳達的信息。例如,硬盤驅動器在行業報告中被稱為“硬盤驅動器”,但在內部銷售數據庫中可能被叫作“產品編號”。
但是,通過獲取所有這些數據信息,并將之繪制成圖表,數據就不再是簡單的數據了,它變成了知識。可視化是一種壓縮知識的形式,因為看似簡單的圖片卻包含了大量結構化或非結構化的數據信息。它用不同的線條、顏色將這些信息進行壓縮,然后快速、有效地傳達出數據表示的含義。