1.4.3 通過相關關系了解世界
傳統情況下,人類是通過因果關系了解世界的。首先,人們的直接愿望就是了解因果關系。即使無因果聯系存在,人們也還是會假定其存在。研究證明,這只是人們的認知方式,與每個人的文化背景、生長環境以及教育水平無關。當看到兩件事情接連發生的時候,人們會習慣性地從因果關系的角度來看待它們。在小數據時代,很難證明由直覺而來的因果聯系是錯誤的。
將來,大數據之間的相關關系,將經常會用來證明直覺的因果聯系是錯誤的。最終也能表明,統計關系也不蘊含多少真實的因果關系。總之,人們的快速思維模式將會遭受各種各樣的現實考驗。
與因果關系不同,證明相關關系的實驗耗資少,費時也少。與之相比,分析相關關系既有數學方法,也有統計學方法,同時,數字工具也能幫人們準確地找出相關關系。
相關關系分析本身意義重大,同時它也為研究因果關系奠定了基礎。通過找出可能相關的事物,人們可以在此基礎上進行進一步的因果關系分析。如果存在因果關系,人們再進一步找出原因,這種便捷的機制通過實驗降低了因果分析的成本。也可以從相互聯系中找到一些重要的變量,這些變量可以用到驗證因果關系的實驗中。
例如,Kaggle公司舉辦了關于二手車的質量競賽。二手車經銷商將二手車數據提供給參加比賽的統計學家,統計學家們用這些數據建立一個算法系統來預測經銷商拍賣的哪些車有可能出現質量問題。相關關系分析表明,橙色的車有質量問題的可能性只有其他車的一半。
這難道是因為橙色車的車主更愛車,所以車被保護得更好嗎?或是這種顏色的車子在制造方面更精良些嗎?還是因為橙色的車更顯眼、出車禍的概率更小,所以轉手時,各方面的性能保持得更好?
人們應該陷入各種各樣謎一樣的假設中。若要找出相關關系,可以用數學方法,但如果是因果關系的話,這卻是行不通的。所以,沒必要一定要找出相關關系背后的原因,當人們知道了“是什么”的時候,“為什么”其實沒那么重要了,否則就會催生一些滑稽的想法。比方說上面提到的例子里,是不是應該建議車主把車漆成橙色呢?畢竟,
考慮到這些,如果把以確鑿數據為基礎的相關關系和通過快速思維構想出的因果關系相比,前者就更具有說服力。但在越來越多的情況下,快速清晰的相關關系分析甚至比慢速的因果分析更有用和更有效。慢速的因果分析集中體現為通過嚴格控制的實驗來驗證的因果關系,而這必然是非常耗時耗力的。
在大多數情況下,一旦完成了對大數據的相關關系分析,而又不再滿足于僅僅知道“是什么”時,人們就會繼續向更深層次研究因果關系,找出背后的“為什么”。
因果關系還是有用的,但是它將不再被看成是意義來源的基礎。在大數據時代,即使很多情況下,我們依然指望用因果關系來說明所發現的相互聯系,但是,我們知道因果關系只是一種特殊的相關關系。相反,大數據推動了相關關系分析。相關關系分析通常情況下能取代因果關系起作用,即使不可取代的情況下,它也能指導因果關系起作用。
- 區塊鏈技術基礎教程:原理、方法及實踐
- 證券投資學(數字教材版)
- 鄒為誠《綜合英語教程(4)》(第3版)學習指南【詞匯短語+課文精解+全文翻譯+練習答案】
- Protel 99 SE應用教程
- 中外高等服裝教育比較
- 消費者行為學(第2版)
- 李廉錕《結構力學》(第5版)(上冊)配套題庫【名校考研真題+課后習題+章節題庫+模擬試題】
- 西北師范大學外語學院211翻譯碩士英語[專業碩士]歷年考研真題及詳解
- 范健《商法》(第4版)【教材精講+考研真題解析】講義與視頻課程【40小時高清視頻】
- 女裝工業款式圖設計5000例(上裝篇)
- 大數據導論
- 服裝廿念
- 浙江師范大學法政學院437社會工作實務[專業碩士]歷年考研真題及詳解
- 數字電路與邏輯設計
- 進出口貿易實務教程