官术网_书友最值得收藏!

1.1.3 數據分析的流程

數據是客觀的事實,但是數據本身并不會告訴人們它的價值,其蘊涵的信息需要分析師進行挖掘。數據分析的流程分為8個步驟,如圖1-5所示。

圖1-5 數據分析的流程

1.明確目標

數據分析是一種有目的的行為,比如,你想要了解銷售情況,或者想找到數據之間的某種規律,一切行為操作都針對某個目標展開。因此進行數據分析的基礎是目標明確,沒有明確的目標,任何分析操作都可能是做無用功。

2.明確分析維度和指標

圍繞目標選定進行數據分析的維度和指標,只有選定了范圍才可以有目的地收集數據,并進行分析。明確的分析范圍能避免分析報告內容太多、不深入。

例1-3:分析目標是了解新上線的詳情頁的效果,為此選定分析的維度和指標。

解:分析的維度有日期、頁面,指標有停留時間、轉化率。

3.數據采集

數據是數據分析的基礎,沒有數據就無法開展數據分析工作,數據采集是將目標數據收集到計算機硬盤等存儲空間中。基礎的數據采集可采用Excel、八爪魚、火車采集器、碼棧等軟件,進階的數據采集可使用Python。

4.數據清洗

采集到的數據一般會有一部分“臟數據”,所以不能直接用于數據分析,如果不處理它們將會影響分析結果。所以在進行分析前需要對數據進行檢查,如果發現“臟數據”就必須進行清洗。

例1-4:表1-1所示為從淘寶生意參謀下載的店鋪經營數據,其中第三行觀測值中存在以“—”為標記的缺失值,如果不處理此類缺失值將無法進行下一步操作,因此需將數據中的“—”替換為數字“0”。

表1-1 店鋪經營數據

數據清洗可使用Excel、Python等工具,亦可使用專業的ETL(Extract Transform Load,抽取、轉換、裝載)工具。利用Excel中的Power Query組件(Office 2016及以上版本自帶該組件),可實現大量數據的清洗。

5.數據整理

因為收集到的數據一般都是零散或者雜亂的,直接觀察數據難以洞察出有效信息,所以只有對其進行整理,才能保證后續流程順利進行。

按照某個維度匯總數據才能對其進行有效的觀察。比如,要觀察新的詳情頁上線后用戶行為的變化,可以按照上線前和上線后的用戶行為數據進行分類匯總,然后通過這兩份數據的對比來得出結論。

例1-5:表1-2所示為淘寶網女裝T恤和襯衫兩個品類在2023年1~3月的成交金額數據,將數據整理成表1-3所示的形式,更便于分析。

表1-2 未經整理的成交金額數據

表1-3 整理后的成交金額數據   單位:千萬元

6.數據分析

數據分析的目的是將數據轉變成有效的信息。前面的步驟都是為這一步做準備,信息的提煉可以采用對比法、拆分法、分組法等分析方法。

例1-6:表1-4所示為商品標題中的關鍵詞詞根分析結果。觀察表1-4中的支付買家數,可以發現“收納箱”和“大號”這兩個詞根的支付買家數為0,表示沒有用戶通過這兩個詞根產生交易,因此得到的信息是“收納箱”和“大號”這兩個詞根可以優化。

表1-4 關鍵詞詞根分析結果   單位:個

7.數據可視化

數據可視化旨在借助圖形化手段,清晰、有效地傳達信息。

例1-7:將表1-5中的數據直觀地展現出來。

表1-5 多個產品的對比數據

根據表1-5中的數據畫出雷達圖,如圖1-6所示,各個產品間的差異清晰可見。

圖1-6 雷達圖

8.數據報告撰寫

數據報告是對分析結果進行邏輯性的集中展現并闡述分析的文檔,可以采用PPT、Word文檔等形式。圖1-7所示為一份數據報告示例。

圖1-7 數據報告示例

主站蜘蛛池模板: 定兴县| 陆丰市| 普定县| 蓬莱市| 伊宁市| 张掖市| 永春县| 云梦县| 泸州市| 镇安县| 贺兰县| 开鲁县| 伊金霍洛旗| 罗城| 洪洞县| 阿克陶县| 昌吉市| 洪江市| 宣化县| 大化| 毕节市| 尼木县| 商水县| 池州市| 进贤县| 罗城| 竹溪县| 辉县市| 霍城县| 呼伦贝尔市| 遵义县| 汪清县| 肥乡县| 鄢陵县| 邯郸县| 监利县| 江达县| 阜阳市| 湖北省| 遵义县| 尼玛县|