書名: 數據分析方法論和業務實戰作者名: 陳友洋本章字數: 1349字更新時間: 2022-08-16 16:08:54
1.4 數據分析師的日常工作
如果希望從事數據分析工作,則需要了解數據分析師的日常工作內容,以便了解這些工作內容所需要的技能。那么,數據分析師的日常工作包括哪些呢?
我們來看一下各企業招聘數據分析師的要求(見圖1-12~圖1-14)。

圖1-12

圖1-13

圖1-14
我們將以上內容總結后,得到的工作內容和技能如圖1-15所示。
工作內容主要有數據體系的搭建、策略模型的搭建和專題分析評估。
1.數據體系的搭建
每一個產品的功能都需要通過數據來監控使用情況,包括用戶量的變化情況、使用的體驗情況、業務的健康情況、業務的機會點等。所以,在公司或者企業內部都會建立起一套相應的數據體系來幫助監控產品各個功能模塊的情況。
什么是數據體系?下面先從指標的定義說起。
指標:指標是通過數據計算得出,用于衡量業務情況的,常見的指標有新增用戶數、日活躍用戶數、周活躍用戶數、活躍時長、付費人數。
數據體系:把指標通過一定的方法論體系組織起來,比如,拼多多的數據體系就包括拼多多新增相關指標、活躍相關指標、留存相關指標、付費相關指標等。

圖1-15
數據體系的搭建就是幫助某種業務建立一套完整的指標體系,幫助業務人員監控業務的走勢,及時發現問題。
數據體系的搭建過程如圖1-16所示。

圖1-16
(1)數據上報。一般通過埋點的方式上報需要的數據。數據上報的方式一般有客戶端上報和后臺上報。有些數據只能從客戶端獲取,所以只能通過客戶端來上報,比如,前端的某個按鈕的曝光情況。
(2)數據指標。根據上報的數據、業務的計算口徑及需求,我們按照一定的方法計算對應的數據指標,比如,某個按鈕的曝光點擊比就是按鈕點擊的次數/按鈕曝光的次數。
(3)數據報表。這些數據指標通過一定的展示和組織形成報表,常規的數據指標的展示方式有表格、折線圖、餅圖等。
(4)數據體系。數據報表按照一定的邏輯進行組織就形成了數據體系,比如,按照新增、活躍、留存、付費、轉發的AARRR模型進行組織。
2.策略模型的搭建
針對業務的需求,幫助業務方解決業務問題,我們需要搭建相對應的策略模型。
針對付費的業務,需要搭建付費預測模型,預測未來哪一批用戶會付費,哪一些用戶會流失。這樣就可以針對即將要流失的用戶提前做挽留,對已經流失的用戶利用禮包等策略進行召回。搭建付費預測模型主要采用機器學習中的分類模型方法,常見的有決策樹、邏輯回歸模型等。可以將用戶付費相關的行為作為特征,比如,用戶的活躍行為、活躍時長、年齡、性別、過去付費的行為。
針對用戶增長的業務,需要搭建用戶流失預警模型,預測未來哪些用戶會流失,這樣業務方可以對即將要流失的用戶利用運營的手段進行挽留。
用戶流失預警模型的搭建和付費預測模型的搭建過程類似,都需要采用機器學習中的分類模型方法來解決。但是,對于一些用戶分層的問題,分類模型解決不了,就需要用聚類模型,常用的聚類模型有k-means、DBSCAN等。
針對指標預測的問題,常用的方法有時間序列預測法。
3.專題分析評估
專題分析評估主要是針對業務中的一些問題開展的專題分析,常見的專題分析評估如下。
(1)波動歸因:針對指標的波動,開展專題分析,挖掘波動的原因,并給出建議。
(2)專題評估:針對產品功能上線,評估迭代效果、活動上線效果,以及策略上線效果。
(3)專題探索:例如,用戶留存專題探索,包括什么因素是用戶留存的關鍵抓手、用戶增長探索,以及挖掘增長的一些關鍵行為抓手。