官术网_书友最值得收藏!

1.4 數據分析的常規流程

我們再來回顧一下數據分析的概念,數據分析是借助合適的工具去幫助公司發現數據背后隱藏的信息,對這些隱藏的信息進行挖掘,從而促進業務發展。基于此,可以將數據分析分為以下幾個步驟。

1.4.1 熟悉工具

數據分析是利用合適的工具和合適的理論挖掘隱藏在數據背后的信息,因此數據分析的第一步就是要熟悉工具。工欲善其事,必先利其器,只有熟練使用工具,才能更好地處理數據、分析數據。

1.4.2 明確目的

做任何事情都要目的明確,數據分析也一樣,首先要明確數據分析的目的,即希望通過數據分析得出什么。例如,希望通過數據分析發現流失用戶都有哪些特征,希望通過數據分析找到銷量上漲的原因。

1.4.3 獲取數據

目的明確后我們就要獲取數據,在獲取數據之前還需要明確以下幾點。

● 需要什么指標。

● 需要什么時間段的數據。

● 這些數據都存在哪個數據庫或哪個表中。

● 怎么提取,是自己寫Sql還是可以直接從ERP系統中下載。

1.4.4 熟悉數據

拿到數據以后,我們要去熟悉數據,熟悉數據就是看一下有多少數據,這些數據是類別型還是數值型的;每個指標大概有哪些值,這些數據能不能滿足我們的需求,如果不夠,那么還需要哪些數據。

獲取數據和熟悉數據是一個雙向的過程,當你熟悉完數據以后發現當前數據維度不夠,那就需要重新獲取;當你獲取到新的數據以后,需要再去熟悉,所以獲取數據和熟悉數據會貫穿在整個數據分析過程中。

1.4.5 處理數據

獲取到的數據是原始數據,這些數據中一般會有一些特殊數據,我們需要對這些數據進行提前處理,常見的特殊數據主要有以下幾種。

● 異常數據。

● 重復數據。

● 缺失數據。

● 測試數據。

對于重復數據、測試數據我們一般都是做刪除處理的。

對于缺失數據,如果缺失比例高于30%,那么我們會選擇放棄這個指標,即做刪除處理。而對于缺失比例低于30%的指標,我們一般進行填充處理,即使用0、均值或者眾數等進行填充。

對于異常數據,需要結合具體業務進行處理,如果你是一個電商平臺的數據分析師,你要找出平臺上的刷單商戶,那么異常值就是你要重點研究的對象了;假如你要分析用戶的年齡,那么一些大于100或者是小于0的數據,就要刪除。

1.4.6 分析數據

分析數據主要圍繞上節介紹的數據分析指標展開。在分析過程中經常采用的一個方法就是下鉆法,例如當我們發現某一天的銷量突然上漲/下滑時,我們會去看是哪個地區的銷量上漲/下滑,進而再看哪個品類、哪個產品的銷量出現上漲/下滑,層層下鉆,最后找到問題產生的真正原因。

1.4.7 得出結論

通過分析數據,我們就可以得出結論。

1.4.8 驗證結論

有的時候即使是通過數據分析出來的結論也不一定成立,所以我們要把數據分析和實際業務相聯系,去驗證結論是否正確。

例如,做新媒體數據分析,你通過分析發現情感類文章的點贊量、轉發量更高,這只是你的分析結論,但是這個結論正確嗎?你可以再寫幾篇情感類文章驗證一下。

1.4.9 展示結論

我們在分析出結論,并且結論得到驗證以后就可以把這個結論分享給相關人員,例如領導或者業務人員。這個時候就需要考慮如何展示結論,以什么樣的形式展現,這就要用到數據可視化了。

主站蜘蛛池模板: 麻阳| 高密市| 建德市| 丰台区| 滁州市| 长沙市| 独山县| 张家川| 三都| 仲巴县| 沙湾县| 泸溪县| 厦门市| 宁津县| 桃源县| 遂昌县| 南和县| 东乌珠穆沁旗| 修武县| 黎城县| 台江县| 长汀县| 措勤县| 四平市| 奇台县| 宜春市| 定结县| 阿拉善右旗| 喀喇沁旗| 桑日县| 瓮安县| 庆元县| 嵩明县| 泰顺县| 台江县| 北宁市| 海宁市| 雅安市| 瑞丽市| 奇台县| 香河县|