- 數據可視化原理與實戰:基于Power BI
- 雷元
- 1516字
- 2023-08-25 11:40:19
1.1 數據可視化的價值
你是否認同這樣的觀點:人類歷史也是一部數據分析的歷史。自有文字記載以來,我們的祖先已懂得數據分析的重要性,并利用數據做決策分析。
齊使者如梁,孫臏以刑徒陰見,說齊使。齊使以為奇,竊載與之齊。齊將田忌善而客待之。
忌數與齊諸公子馳逐重射。孫子見其馬足不甚相遠,馬有上、中、下輩。于是孫子謂田忌曰:“君弟重射,臣能令君勝。”田忌信然之,與王及諸公子逐射千金。及臨質,孫子曰:“今以君之下駟與彼上駟,取君上駟與彼中駟,取君中駟與彼下駟。”既馳三輩畢,而田忌一不勝而再勝,卒得王千金。于是忌進孫子于威王。威王問兵法,遂以為師。
摘自《史記·孫子吳起列傳》
在這則小故事中,孫臏通過分析上、中、下三者的關系,得出了比賽可能性的最優選擇,戰勝了對手,所以古人善用數據分析的能力可見一斑。但同樣是數據分析,結果也可能是欺騙性的。例如:
后十三歲,魏與趙攻韓,韓告急于齊。齊使田忌將而往,直走大梁。魏將龐涓聞之,去韓而歸,齊軍既已過而西矣。孫子謂田忌曰:“彼三晉之兵素悍勇而輕齊,齊號為怯,善戰者因其勢而利導之。兵法,百里而趣利者蹶上將,五十里而趣利者軍半至。使齊軍入魏地為十萬灶,明日為五萬灶,又明日為三萬灶。”龐涓行三日,大喜,曰:“我固知齊軍怯,入吾地三日,士卒亡者過半矣。”乃棄其步軍,與其輕銳倍日并行逐之。
摘自《史記·孫子吳起列傳》
由此可見,在同一本書中,我們領教了數據分析的另一面。孫臏巧妙利用灶與人口的正比關系,迷惑對手得出一個錯誤的決策判斷,而結果是讓魏軍付出了慘重的代價,龐涓也命喪于此。你也許覺得龐涓太傻了,如果真的死了那么多士兵,那么尸體都去哪里了?的確,在分析的邏輯上,龐涓應該做得更加謹慎,但舉這個例子的目的是告訴我們數據分析不但能尋找“真相”也能“說謊”,因此我們應該學會用審慎的態度對待分析結果。另外,無論從正反兩方面看,孫臏真的是一位數據高人,如果活在當今,也許就是一位數據分析大師了。
今天,我們大多數人都會認為我們邁進了DT(數據技術)時代。現代人繼承了古人智慧的同時,人們不禁要問:最新的數據技術改變了什么?也許今天,我們所面對的問題不是對比幾匹馬、清點幾個灶臺,而是面對更為復雜的數據問題。因此,我們需要一種更有效的方式分析與理解數據,而數據可視化則是以可視化承載數據分析結果的一種方式。在《數據之美》一書中,作者Nathan Yau將可視化描述為對現實客觀世界的一種簡化和抽象表達。可視化數據,其實是在對現實世界的抽象表達可視化,或至少是將它的一些細微方面可視化。由于可視化是對數據的一種抽象表達,所以你得到的是一個抽象的抽象,見圖1.1.1。

圖1.1.1
筆者對Yau的觀點深以為然,即:可視化也是連接數據與人的最后一公里接口。優秀的可視化表達方式可加深人們對現實世界的正確理解。對比圖1.1.2中的兩種呈現方式,哪個更利于理解分析結果呢?

圖1.1.2
值得一提的是,即使作品是相同的數據集與可視化對象,表達效果也可以完全相反。如圖1.1.3展示的是伊拉克人員傷亡人數的可視化作品(引用南華早報2015年的圖注),盡管兩幅圖的數據集完全相同,主要可視化對象的圖型皆為柱圖,但構圖的坐標正反之差,卻顏色主題之差,卻給人帶來完全不同的感知信息:紅色主題形象地傳達了作者要表達的信息——血腥與暴力;相比之下,藍色主題給人帶來的是樂觀與和平,形象地表達死亡人數正在減少的觀點。

圖1.1.3
綜上所述,數據可視化是一種抽象呈現客觀世界的方法和手段。對于越復雜的數據問題、數據可視化的價值就越發重要。數據可視化能力將直接影響所要傳達的信息的效果。因此,我們在數據分析中必須重視可視化的制作水平,否則,即使擁有豐富的數據,也會因缺乏優秀的可視化能力,而影響整體數據分析表達的效果,可謂功虧一簣。