- 數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow
- 謝梁 繆瑩瑩 高梓堯 王子玲等
- 3926字
- 2021-06-24 11:29:41
3.1 用戶長期價值的概念和商業應用
本節主要介紹用戶長期價值的概念及它在現代商業活動中的重要地位和應用場景。
3.1.1 用戶長期價值
2019年是首次公開募股(IPO)創紀錄的一年,在新科技的帶動下,新的經濟模式造就了新的獨角獸。從網約車、共享單車投入巨額補貼搶占市場,到美團、餓了么、京東新零售圈地,再到抖音、快手的短視頻大戰以及各大互聯網巨頭布局在線醫療和教育,更有隨之而來的無數創業公司紛紛涌入市場。然而,這些商業模式,或者新興的公司/部門創造了多少價值呢?數據分析師可以通過考察潛在市場,分析公司經營情況、財務情況以及過往業績等方面進行評估,但這類方法不能準確預測公司的未來價值,因為影響公司未來價值最重要的因素—用戶行為,被忽略了。
賓夕法尼亞大學沃頓商學院彼得·費德教授據此提出了基于用戶行為的公司估值法。他認為,如果能預測所有用戶未來的價值,并且對這個價值求和,就能對公司的整體價值進行較好的評估。具體說來,該方法有五大元素:用戶獲取、用戶留存、用戶下單、用戶消費以及邊際利潤。運用這些元素可以對用戶的長期價值進行預測,并以此對公司進行估值。費德教授在零售業、媒體行業、金融服務業、制藥業應用了該方法,取得了一系列成功。現在,以用戶為中心,基于用戶長期價值的公司估值以及業務評估正在發揮越來越大的影響。用戶長期價值這個概念在商業活動中逐漸占據不可替代的地位。
為什么用戶的價值能在很大程度上決定企業的價值呢?我們知道,企業經營的最終目的是盈利,在企業的各種經營活動中,吸引新客戶、增加交易規模、提高生產效率、優化用戶體驗等手段都是為了盈利。用戶群是公司商業價值的最終來源,也在各方面指引著公司的產品設計和運營策略。大部分行業都會把用戶置于一切業務運營的中心,通過建立和實施長期的用戶戰略,實現企業價值最大化。在精細化運營越來越重要、獲客成本越來越高的互聯網時代,企業會把盈利目標細化到用戶維度,以此估計每個用戶所能帶來的價值,由此引出了用戶長期價值的概念:用戶的長期價值(Life-Time Value,LTV)是用戶和企業所產生的交易活動所能帶來的全部經濟收益的總和。其中“長期”指的是用戶的生命周期或較長的一段經營時間。下文我們均用LTV來指代用戶長期價值。
LTV是市場營銷和其他企業經營活動中非常重要的一個概念。LTV實際上是基于用戶和企業關系現金流的一種貨幣化。不同的行業、不同的商業模式和策略之間存在著巨大的差別。但LTV提供了一把標尺,可以從統一的視角衡量不同的經營活動、部門或公司整體的商業價值。另外,因為LTV采用的是長期視角,不會被短期利益所蒙蔽,所以能較為合理地衡量企業的用戶潛力。從這個角度看,LTV提供了一種將長期用戶價值和短期用戶價值進行比較的途徑。研究用戶過去的行為,便能比較準確地預測他們未來能夠帶來的經濟收益,企業就能夠更長遠、更全面地做出經營決策,獲得更長久和穩定的商業收益。
3.1.2 用戶生命周期和用戶長期價值
圖3-1所示是用戶在商業平臺進行互動的整個生命周期,展示了所產生的價值中用戶付費隨時間的變化。

圖3-1 用戶付費曲線(上圖)和典型LTV曲線(下圖)
圖3-1上圖中,橫軸代表時間,縱軸代表用戶每一次付費的額度。我們可以看到,用戶的整個生命周期可以分為引入期、成長期、成熟期、休眠期和流失期。
- 引入期:用戶首次交易后,成為新客戶,這一時期是用戶對商品從不熟悉到熟悉的過程。
- 成長期:用戶多次購買商品,對企業的產品、品牌等各方面逐漸熟悉,購買或使用頻次逐漸增加。
- 成熟期:產品已經融入用戶的生活,用戶能夠以一定頻率持續復購。
- 休眠期:用戶購買頻率下降(受競品或其他替代因素影響),逐漸進入休眠期。
- 流失期:用戶購買頻次出現大幅度下降,最終不再復購。
以上這5個時期之間并不存在明顯的分界線,不同時期的持續時間和企業所處行業、運營策略、地域、用戶屬性有著密切關系。在整個用戶生命周期中,付費曲線下的面積,就是這個用戶給商家帶來的貨幣化價值,即LTV。
3.1.3 LTV的特點
LTV具備如下兩個特點。
1. 長期性
嚴格來講,在用戶進入流失期之前,我們是無法計算用戶對商業平臺的貨幣貢獻的。只有在用戶離開平臺,即流失之后,才能準確計算其貨幣貢獻,這個時間跨度可能很大,可能只有幾個月,也可能需要幾年。
2. 變化性
因為用戶群體和企業經營策略不是一成不變的,所以LTV也會產生變化。初創企業和成熟企業采用的運營策略是不同的,處于創業階段的企業,擴大規模往往是最重要的,所以企業需要大量獲客,但并不特別在意用戶的留存。對于穩定發展的大公司而言,提高用戶的穩定留存、提升用戶的平臺價值則具有核心地位。好的產品和運營策略,可以增強用戶黏性,延長LTV。
在一些行業,比如鐵路、航空,存在一定程度的壟斷情況,整個市場或許由一兩家較大的企業占據大部分份額,用戶很難離開這些企業的服務。在這種情況下,往往需要在一個時間段內考察和定義LTV。比如,我們可以把用戶90天的付費總額定義為LTV90,或者半年的LTV定義為LTV180,也可以采用更久的時間去定義。這些LTV可以在相當長的一段時間內刻畫用戶的價值特征,從而指導企業運營。
3.1.4 LTV分析能解決的問題
LTV可以幫助我們更好地回答以下問題。
- 如何找出最有價值的用戶?
- 企業怎樣才能產生讓用戶長期喜愛和依賴的產品?
- 影響用戶購買行為的因素都有哪些?如何更好地滿足不同用戶的需求?
- 如何制定獲客預算?
建立LTV模型能夠幫助我們找到客戶特征和企業貨幣化價值之間的聯系,讓我們更好地了解用戶,了解用戶價值,并以此制定更好的運營和產品策略,更準確地命中商業運作的優化目標,創造更大的商業價值。
3.1.5 LTV的計算方法
LTV在商業分析中的地位很重要,計算LTV的方法有很多。
1. 簡單算術公式
假設用戶中各類人群的比例不變,如果單位時間內每個用戶給平臺帶來的收入是R,用戶在單位時間內的流失率為cr(churn rate),則:
LTV = R/cr
這個方法假定用戶的人群比例是穩定不變的,這樣得出的LTV實際上是一個平均值,并不能體現用戶個體的差異。另外,一旦公司的運營策略發生變化,使用這種方法就會產生較大的誤差。因為它實際上是一個簡單的描述性模型,描述的是當前的規律,規律發生改變的時候,誤差突然變大是不可避免的。這類公式可以通過引入一些變量加以修正,比如增長率、風險因子折扣、平均用戶付費、活躍用戶量、獲客成本等。引入這些變量,就可以通過靈活的參數擬合得到較為復雜的趨勢線,獲得比線性擬合更好的效果。
2. 線性回歸
線性回歸在商業領域有著廣泛的應用,可以用來計算LTV:
LTV = β0 + β1x1 + β2x2 + …
這類模型中最簡單的就是純時間序列,比如,可以采用最近幾個月的用戶付費作為獨立變量(即忽略它們的相關性),然后預測未來一年的LTV。線性回歸方法比較簡單,但框架清晰,在很多時候也非常有效。如果要進一步考慮其他因素,也可以方便地加入方程中。
線性回歸方法也有缺點,就是LTV本身很復雜,很難用一些簡單的線性關系進行概括,因此線性回歸給出的結果準確度較低。另外,若采用線性回歸方法,在各變量不滿足獨立性的前提下,對模型進行分析和解釋也是一個很大的挑戰。對于這類模型,也有一些擴展,如加入一些非線性項,或使用一些基于動態參數的序列模型,在保留可解釋性的同時,追求更高的準確率。這類模型能夠捕捉LTV曲線影響因素中的某些周期性,并能較好地貼近一些非線性項。這類模型基于一些已知模型的組合,表達力雖然比線性模型更加豐富,但總體來說仍難以確保準確度。
3. 統計學模型
這種方法來自統計學,因為大量個體的行為往往在很大程度上符合統計規律,所以比起上面簡單計算邏輯形式的方法,這種通過數據計算的方法有更大的優勢。首先,這種方法得出的結果更加準確,其中的統計學參數可以在很大程度上捕捉到群體的某種共性特點。另外,這類模型能從統計學層面對一些影響因素加以解釋,往往建立在一些統計假設之上,例如,較常見的BG/NBD模型就基于以下一些假設。
- 在活躍狀態下,用戶在一段時間內的交易次數呈泊松分布。
- 不同用戶的交易率之差遵循gamma分布。
- 用戶在每次購買后,會以p的概率變為不活躍用戶。
- 不同用戶p的差別遵循gamma分布。
在這些假設的基礎上,模型能在很大范圍內給出比較可靠的預測。不僅如此,由于結合了統計學的一些參數方法,對于數據量比較匱乏的場景,模型也能給出相對較好的擬合和分析。這類模型還可以進行擴展和復雜化,比如,BG/NBD模型只考慮了交易次數,并沒有考慮每一次交易的價值是不同的。相應地,Gamma-Gamma模型考慮到了這一點,在某些場合可以達到更優的效果,但它仍然假設購買頻次和交易價值是獨立的。另外,從貝葉斯統計角度看,也有一些框架把上面的模型和用戶生存概率相結合,比如Abe提出了一個“異質”的模型Hierarchical Bayesian,使用馬爾可夫鏈蒙特卡洛方法確定一些參數,期望達到更好的效果。
4. 基于機器學習的模型
機器學習模型具有豐富的參數,且這些參數由訓練確定。這種從數據中找規律的方式和前面的模型很相似,但機器學習的參數比簡單的商業公式或統計模型要多得多,所以也會達到更好的計算效果。由于引入了過多參數,其可解釋性會相應下降。常見的模型有基于貝葉斯結構化時間序列的動態回歸,通過吉布斯采樣,構造馬爾可夫鏈,更新模型參數。
基于機器學習的模型目前還在進一步發展中,因為需要通過采樣進行貝葉斯迭代,所以計算量往往非常大。
5. 基于神經網絡的模型
神經網絡也是機器學習的一種,但神經網絡具有很多獨到的特點。對于一般的機器學習任務,神經網絡未必是能給出最好結果的那個,但它能處理各種各樣的數據,適用性非常強,已經成為最近幾年機器學習的熱門領域。
神經網絡已經發展出各種各樣的局部結構或特定類型的網絡,能夠有效應用于特定領域。神經網絡一般可以得到較好的準確度,但缺點在于可解釋性較差,且需要大量數據進行訓練。本章主要使用神經網絡構建LTV模型。有關神經網絡的基礎知識,讀者可查閱相關資料,這里限于篇幅,不再贅述。
- Hands-On Data Structures and Algorithms with Rust
- 虛擬化與云計算
- MongoDB管理與開發精要
- Redis應用實例
- 揭秘云計算與大數據
- 數據化網站運營深度剖析
- 數據要素五論:信息、權屬、價值、安全、交易
- 數據庫應用基礎教程(Visual FoxPro 9.0)
- 深入淺出MySQL:數據庫開發、優化與管理維護(第2版)
- 大話Oracle Grid:云時代的RAC
- “互聯網+”時代立體化計算機組
- 數據庫原理與設計(第2版)
- 大數據架構商業之路:從業務需求到技術方案
- IPython Interactive Computing and Visualization Cookbook(Second Edition)
- 區塊鏈技術應用與實踐案例