官术网_书友最值得收藏!

1.4 數據分析的常規分析流程

我們再來回顧一下數據分析的概念,數據分析是指分析人員借助合適的工具幫助公司發現數據背后隱藏的信息,對這些隱藏的信息進行挖掘,然后幫助公司改善其業務發展。基于此,數據分析主要分為以下幾個流程。

1.4.1 熟悉工具

數據分析的第一步就是熟悉工具,俗話說得好,“工欲善其事,必先利其器”。同樣地,只有對工具掌握得足夠熟練,才能更好地處理數據、分析數據。

1.4.2 明確目的

做任何事情都需要明確目的,數據分析也一樣,首先我們要明確數據分析的目的,即希望通過數據分析得出什么結果。比如,希望通過數據分析找出流失用戶都有哪些特征、銷量上漲/下滑的原因。

1.4.3 獲取數據

明確了目標以后我們就要獲取數據,在獲取數據之前還需要明確以下幾點:

? 需要獲取什么指標;

? 需要獲取什么時間段的數據;

? 這些數據都存放在哪個數據庫、哪張表中;

? 如何獲取數據,是自己寫SQL代碼還是可以直接從公司ERP系統中下載。

1.4.4 熟悉數據

獲取數據以后,我們需要熟悉數據,熟悉數據就是看一下有多少數據,這些數據都是什么類型的,是類別型還是數值型的,每個指標大概都有哪些值,這些數據是否能夠滿足我們的需求,如果不能,那么還需要獲取哪些數據。

獲取數據和熟悉數據是一個雙向進行的過程,而且貫穿在整個數據分析過程中。

1.4.5 處理數據

我們獲取到的數據是原始數據,這些數據中一般都會有一些特殊數據的存在,所以我們需要對這些數據進行預處理,常見的特殊數據主要有以下幾種:

? 異常數據;

? 重復數據;

? 缺失數據;

? 測試數據。

對重復數據、測試數據,我們一般都是進行刪除處理。

如果缺失數據的缺失比例高于30%,我們會選擇放棄這個指標,即進行刪除處理;而對缺失比例低于30%的指標,我們一般進行填充處理,可以使用0,也可以使用平均值、眾數等進行填充。

對異常數據,我們需要結合具體業務進行處理,如果讀者是一個電商平臺的數據分析師,要分析并找出平臺上的刷單商戶,這個時候異常值是讀者要重點研究的對象,假如要分析用戶的年齡,那么小于0的數據就要刪除。

1.4.6 分析數據

分析數據主要圍繞前面幾個數據分析指標進行,在分析過程中采取的一種方法就是下鉆法,比如,我們發現某一天的銷量突然上漲/下滑,那么我們會去看是哪個地區的銷量出現上漲/下滑,進而再看是哪個品類、哪個產品的銷量出現上漲/下滑,這樣層層下鉆,最后找到問題發生的真正原因。

1.4.7 得出結論

通過對數據進行分析,我們就可以得出結論。

1.4.8 驗證結論

有時候看到的不一定是對的,即通過分析數據得出的結論不一定正確,所以需要和實際業務相聯系,驗證得出的結論是否正確。

比如,你在進行新媒體的數據分析,通過分析發現情感類的文章更容易引起讀者共鳴,點贊量、轉發量更高,這只是你的分析結論,然后你需要驗證你的結論是否正確,這時你可以再寫幾篇情感類文章來驗證,看是否點贊量和轉發量更高。

1.4.9 展現結論

我們在分析出結論,并且結論得到驗證以后就可以把該結論拿給相關人員去看,你的領導或者業務人員就需要考慮如何展現結果,以什么樣的形式展現,即數據可視化。

主站蜘蛛池模板: 乌鲁木齐县| 冷水江市| 新泰市| 天津市| 清原| 松江区| 岗巴县| 花莲县| 峡江县| 富蕴县| 康保县| 广水市| 驻马店市| 津南区| 兴海县| 临汾市| 辽宁省| 建德市| 老河口市| 龙南县| 密山市| 布拖县| 湛江市| 通河县| 克拉玛依市| 花莲市| 辽阳县| 当雄县| 孝昌县| 昌乐县| 揭阳市| 富锦市| 林芝县| 海淀区| 宁阳县| 新竹县| 馆陶县| 宜宾市| 盐边县| 平谷区| 新巴尔虎左旗|