- 數據分析師手記:數據分析72個核心問題精解
- 劉林 李朝成 餅干哥哥
- 1993字
- 2024-12-28 12:15:51
第3問:什么是數據指標?
導讀:了解完數據分析的發展后,本問開始,將從數據分析的核心—“數據指標”切入,建立全面的數據分析底層認知。數據指標是業務現狀的反映,而數據分析也正是基于對業務現狀的準確透視才能做出有效決策,因此,數據指標的重要性不言而喻。
為了建立對數據指標的完整認知,我們把數據指標拆成“數據”與“指標”,指標是數據之間的運算,是“衡量”事物發展程度的“模型”。也就是說通過“建立指標”評估“業務發展”是一個建模的過程,是把業務發展從物理世界映射到數據空間,只有這樣才能使得“萬物皆可計算”,這就是數據分析的基礎。
為了厘清從數據到指標的建模過程,我們需要先對“數據”的概念進行討論。
1.什么是“數據”?
數據是被存儲起來的信息。從應用的角度看,數據是把事物做量化處理的工具。萬物皆可數據化,數值是數據,文本、圖像、視頻等同樣也是數據。
(1)按字段類型劃分,可以把數據分為:
文本類:常見于描述性字段,如姓名、地址、備注等。
數值類:最為常見,用于描述量化屬性,如成交金額、商品數量等。
時間類:僅用于描述事件發生的時間,是重要的分析維度(如同比、環比、累計等)。
(2)按結構劃分,可以把數據分為:
結構化數據:通常指以關系數據庫方式記錄的數據。
半結構化數據:如日志、網頁數據。
非結構化數據:如語音、圖片、視頻等形式的數據。
(3)根據數據連續的屬性不同,可以把數據分為:
連續型數據:在任意區間可以無限取值,例如年齡、身高。
離散型數據:常見于分類數據,例如性別、年級。
2.如何理解“指標”?
指標的作用是“度量”業務,可以從三個角度對指標進行拆解:指標=維度+匯總方式+量度。
維度:從什么角度去衡量問題。
匯總方式:用什么方法去統計問題。
量度:目標是什么。
下面舉兩個例子。
訂單數是指統計周期內,用戶完成支付的訂單數量總和。從維度、匯總方式、量度三個角度將訂單數拆解,如下圖所示。

復購率是指統計周期內,重復消費用戶數(消費兩次以上的用戶)在總消費用戶數中的占比。從維度、匯總方式、量度三個角度將復購率拆解,如下圖所示。

3.數據指標如何落地使用?
了解完指標的底層邏輯(理論)后,更重要的是將指標在業務中落地。筆者團隊結合數據分析經驗,總結了以下數據指標的落地建議:
(1)指標基建—確保數據的完整、準確。
為了打下指標模型的穩固基礎,需要對數據底層進行檢視:
① 檢視數據源頭:埋點收集的事件數據是否足以支撐所需指標的建模。
② 臟數據清洗邏輯,也就是數據倉庫中常見的ETL(Extract-Transform-Load,抽取-轉換-加載)概念。
(2)從業務層面理解指標。
理解業務是數據分析落地的前提,有效地使用指標也同樣如此,要求熟悉數據指標背后的業務含義。例如“會員成單數”這個指標本身有很多含義(針對以購買會員為主要商業模式的App):
● 直接含義:整個團隊的業務完成能力。
● 會員成單數+成本:企業的盈利能力。
● 會員成單數+產品:產品暢銷程度。
● 會員成單數+用戶分層:用戶的需求。
(3)從指標的變動中做決策。
為了判斷業務現狀的好壞、趨勢,需要建立衡量標準,數據指標的使用同樣如此。
通過某個孤立的指標不能反映現實,例如小明身高165cm,我們看不出小明的身高特征,但是當走來一個身高180cm的人時,我們就能判斷小明相對比較矮,或者當我們拿到全國平均身高水平是167cm時,也能得出同樣的結論。這就是利用對比思維建立標準的過程,對比的客體可以是橫向的同屬性對象、總體平均,也可以是縱向的歷史數據。
如果是周期性變化,那很有可能是正常波動,可以初步判作“正常”。如果是“突發+下跌”,那很有可能是異常的波動,可以初步判作“問題”。
(4)指標的生命周期—不同階段使用不同指標。
既然指標的作用在于反映業務,而業務的發展存在生命周期,那指標的使用也應存在時效性,即指標的生命周期。
沿著產品的生命周期來看,不同階段使用的指標差異如下:
① 導入期:業務目標在于建立知名度,通過口碑引流,著重關注新注冊人數、分享率指標。
② 成長期:業務目標在于通過不同渠道布局推廣最大限度占有市場,著重關注新會員來源渠道占比等指標。
③ 成熟期:業務目標在于將前期流量變現,確保盈利規模,著重關注付費率、毛利率等指標。
④ 衰退期:此時,市場增量收縮,要求對存量人群精細化運營,著重關注復購率、重購金額占比等指標。
4.小結
在一定程度上,“數據指標”能揭示出產品用戶的行為和業務水平狀況。當然,我們也不能完全迷失在數據中,應注意以下幾點:
● 數據不等同于實際場景,實際場景往往比數據更加復雜,分析時需要了解具象化的場景,而不是抽象的數據。
● 數據本身沒有觀點,分析時不能預設觀點,只傾向于那些能夠支持自己觀點的數據。
● 數據具備一定的時效性,不同情況下,一些曾經的數據可能不再適用,需要找到新的數據指標。
總之,精確的數據無法代替大方向上的判斷,不要過分迷戀數據,要做到具體問題具體分析,形成發現問題、分析問題、總結問題、解決問題的思路閉環。