1.2.3 全數據模式:樣本=總體
采樣的目的是用最少的數據得到最多的信息,而當人們可以獲得海量數據時,采樣也就失去了意義。如今,感應器、手機導航、網站點擊和微信等被動地搜集了大量數據,而計算機可以輕易地對這些數據進行處理——數據處理技術已經發生了翻天覆地的改變。
在很多領域,從搜集部分數據到搜集盡可能多的數據的轉變已經發生。如果可能,人們會搜集所有的數據,即“樣本=總體”,這是指人們能對數據進行深度探討。
分析整個數據庫,而不是對一個小樣本進行分析,能夠提高微觀層面分析的準確性。所以,人們經常會放棄樣本分析這條捷徑,而選擇搜集全面而完整的數據。人們需要足夠的數據處理和存儲能力,也需要最先進的分析技術。同時,簡單廉價的數據搜集方法也很重要。過去,這些問題中的任何一個都很棘手。在一個資源有限的時代,要解決這些問題需要付出很高的代價。但現在,解決這些難題已經變得簡單容易得多。曾經只有大公司才能做到的事情,現在絕大部分的公司都可以做到。