- 風(fēng)控:大數(shù)據(jù)時(shí)代下的信貸風(fēng)險(xiǎn)管理和實(shí)踐(第2版)
- 王軍偉
- 4216字
- 2024-01-18 11:42:04
第3章 信貸分析秘密武器——Cohort分析
統(tǒng)計(jì)學(xué)家是下一個(gè)性感的工作。
——Google首席經(jīng)濟(jì)學(xué)家 哈爾·瓦里安
在信貸過(guò)程中,人們常常會(huì)使用很多分析方法,如在獲客階段使用漏斗分析、在審批階段使用交叉驗(yàn)證分析、在存量階段使用RFM分析[1]、在貸后階段使用VINTANGE分析等。在統(tǒng)計(jì)學(xué)課程“試驗(yàn)設(shè)計(jì)”中,對(duì)各種正交設(shè)計(jì)、區(qū)組設(shè)計(jì)、飽和設(shè)計(jì)、超飽和設(shè)計(jì)、參數(shù)設(shè)計(jì)、回歸設(shè)計(jì)、均勻設(shè)計(jì)等隨機(jī)試驗(yàn)的數(shù)據(jù)提供了相應(yīng)的統(tǒng)計(jì)分析方法[6],這些方法可估算不同影響因子的效果。在信息技術(shù)中,A/B測(cè)試用于選擇不同的頁(yè)面設(shè)計(jì)、流程設(shè)計(jì)等達(dá)到客戶體驗(yàn)最好;而在風(fēng)險(xiǎn)管理中,模型或規(guī)則的挑戰(zhàn)者和冠軍之間的對(duì)比測(cè)試是根據(jù)其效果來(lái)決定是否采用挑戰(zhàn)者模型或規(guī)則,同時(shí)模型或規(guī)則本身涉及很多方法,如Logistics回歸、優(yōu)化算法等。這些方法受到重視并不斷優(yōu)化,但要分拆出時(shí)長(zhǎng)效應(yīng)、時(shí)期效應(yīng)、同群(Cohort)效應(yīng)并估計(jì)它們具體的效果,通過(guò)上述方法是無(wú)法徹底解決的,而這3種效應(yīng)將貫穿信貸始終,估計(jì)這3種效應(yīng)需要應(yīng)用同群分析(Cohort分析)。
Cohort分析可以幫助風(fēng)險(xiǎn)管理人員理解不同效應(yīng)變化的根源和性質(zhì)。Cohort的含義包括軍隊(duì)、同伙、共犯等,也有翻譯為“世代”的。例如,於嘉將“Cohort Analysis”翻譯為“世代分析”[7]。無(wú)論如何翻譯,這些翻譯都無(wú)法達(dá)到其意境,“世代”翻譯為英文是“age”或“generations”,正如Kosei Fukuda[8]所說(shuō),“generations”和“cohort”是不完全一樣的,而根據(jù)《韋氏詞典》,“cohort”具有如下含義:①一群或簇;②聯(lián)合會(huì);③任意一組士兵;④一個(gè)幫兇或共犯;⑤一群具有特定統(tǒng)計(jì)學(xué)意義或人口學(xué)特征的人;⑥生物學(xué)上,同一物種的一群人中的個(gè)體。這里Cohort的意思是“一群具有特定統(tǒng)計(jì)學(xué)意義或人口學(xué)特征的人”。為了保證相關(guān)含義的完整性,這里我們直接用“Cohort分析”這個(gè)名稱。
Cohort分析的定義:對(duì)人群、物或主題在特定時(shí)期內(nèi)具有相同經(jīng)歷的結(jié)果進(jìn)行分析。例如,在電商中,可應(yīng)用Cohort分析對(duì)同一天或同一周引入新用戶后續(xù)轉(zhuǎn)化的分析,評(píng)估出時(shí)長(zhǎng)效應(yīng)、時(shí)期效應(yīng)、Cohort效應(yīng)。其中,時(shí)長(zhǎng)就是物或人為得到相關(guān)服務(wù)或成為企業(yè)/組織/客戶的時(shí)間長(zhǎng)度,如為一個(gè)用戶服務(wù)的時(shí)長(zhǎng)就是以用戶注冊(cè)、下單時(shí)間為標(biāo)準(zhǔn),自用戶注冊(cè)或下單的時(shí)間點(diǎn)開(kāi)始計(jì)算,到統(tǒng)計(jì)分析時(shí)間點(diǎn)為止,兩個(gè)時(shí)間點(diǎn)之間的間隔;時(shí)期是結(jié)果產(chǎn)生的日歷時(shí)期,如都是在2016年10月成為某企業(yè)或組織的客戶;Cohort是一群具有特定統(tǒng)計(jì)學(xué)意義或人口學(xué)特征的人,一般以時(shí)間起點(diǎn)為唯一變量(時(shí)間長(zhǎng)度相同,其他條件也相同)的用戶群。
截至2020年11月24日,通過(guò)百度學(xué)術(shù)可以查到“Cohort analysis”在2000—2020年共有約3.85萬(wàn)個(gè)相關(guān)文獻(xiàn),如圖3-1所示。但99%的文獻(xiàn)主要集中在醫(yī)學(xué)、生物學(xué)、藥學(xué)、心理學(xué)、教育學(xué)以及數(shù)學(xué)等方面,而經(jīng)濟(jì)、金融方面的文獻(xiàn)相對(duì)比較少,占比約為1%。但這不代表Cohort分析在經(jīng)濟(jì)、金融方面不重要,在人口學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)和金融學(xué)都會(huì)遇到個(gè)人或群體的時(shí)間序列數(shù)據(jù),各種現(xiàn)象中的時(shí)長(zhǎng)效應(yīng)、時(shí)期效應(yīng)、Cohort效應(yīng)的變化如何,對(duì)于相應(yīng)的專家或研究者、實(shí)踐者來(lái)說(shuō)都是非常重要的。

圖3-1 Cohort分析在經(jīng)濟(jì)、金融方面的文獻(xiàn)比較少
本章主要介紹Cohort分析在經(jīng)濟(jì)、金融,尤其在風(fēng)控中的應(yīng)用。但是,為了更好地理解Cohort分析,我們先從理論上對(duì)其進(jìn)行闡述與說(shuō)明。
Cohort分析在市場(chǎng)運(yùn)營(yíng)中的應(yīng)用,主要體現(xiàn)在Kosei Fukuda[8]使用Cohort分析并提供一些證據(jù)來(lái)說(shuō)明時(shí)長(zhǎng)效應(yīng)和Cohort效應(yīng)上。這對(duì)于市場(chǎng)研究具有重要的影響,為了分析出相應(yīng)的效應(yīng),相應(yīng)的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)監(jiān)測(cè)在初始階段就需要做好準(zhǔn)備。例如,利用Cohort分析可以衡量客戶參與情況是否變好,基于注冊(cè)或進(jìn)入時(shí)間來(lái)對(duì)客戶進(jìn)行分組,從而比較不同時(shí)期進(jìn)入客戶的參與情況,同時(shí)可以從參與度中拆分出增長(zhǎng)率,這對(duì)于運(yùn)營(yíng)來(lái)說(shuō)非常重要,因?yàn)樵鲩L(zhǎng)很容易掩蓋參與問(wèn)題。
對(duì)于衡量廣告、營(yíng)銷(xiāo)效果來(lái)說(shuō),Cohort分析也是一種有效的方法。一般對(duì)廣告、營(yíng)銷(xiāo)效果的衡量,主要以在廣告或營(yíng)銷(xiāo)之前30天內(nèi)的平均量作為基準(zhǔn),自廣告或營(yíng)銷(xiāo)開(kāi)始到結(jié)束當(dāng)天的平均量與基準(zhǔn)進(jìn)行比較,高出某個(gè)設(shè)定的預(yù)期值就認(rèn)為比較好。但是,這樣不能確認(rèn)到底是自然流量帶來(lái)的增長(zhǎng),還是廣告或營(yíng)銷(xiāo)帶來(lái)的增長(zhǎng);也不能確認(rèn)廣告或營(yíng)銷(xiāo)帶來(lái)的客戶參與度如何,更不能給出哪些營(yíng)銷(xiāo)策略需要改進(jìn),以及改進(jìn)的方向。Cohort分析可以分拆出時(shí)長(zhǎng)效應(yīng)、時(shí)期效應(yīng)和Cohort效應(yīng),加上廣告或營(yíng)銷(xiāo)時(shí)期與非廣告時(shí)期的比較,從而判斷廣告或營(yíng)銷(xiāo)效果。當(dāng)然,也可比較不同營(yíng)銷(xiāo)策略下的客戶參與情況,從而判斷哪些營(yíng)銷(xiāo)策略是有效的,以及不同營(yíng)銷(xiāo)策略的可改進(jìn)之處。
對(duì)于現(xiàn)金流、收益來(lái)說(shuō),Cohort分析也是一種有效的方法,可以判斷現(xiàn)金流是否來(lái)自我們相關(guān)產(chǎn)品或重點(diǎn)產(chǎn)品,以及看到不同年齡層的客戶對(duì)公司的利潤(rùn)貢獻(xiàn)度并及時(shí)調(diào)整戰(zhàn)略。
對(duì)于產(chǎn)品、技術(shù)來(lái)說(shuō),Cohort分析也是非常有效的方法,可識(shí)別出在上線新版本的前后客戶留存情況,以及對(duì)公司現(xiàn)金流、利潤(rùn)貢獻(xiàn)度等變化,從而判斷是否采用新技術(shù)。
很多“互聯(lián)網(wǎng)+”相關(guān)的企業(yè)為獲得風(fēng)險(xiǎn)投資(Venture Capital,VC)/私募股權(quán)(Private Equity,PE)的青睞,花了很多錢(qián)拉“新”——通過(guò)營(yíng)銷(xiāo)運(yùn)營(yíng)手段獲得新客戶,如通過(guò)“注冊(cè)就送100元”“注冊(cè)就獲加息券”的活動(dòng)獲得新客戶。在此,同時(shí)虛擬成立的兩家互聯(lián)網(wǎng)保險(xiǎn)公司,分別是Y和Z,它們都擁有2000萬(wàn)戶的注冊(cè)客戶,客戶平均保費(fèi)1元/單,理賠率都為75%,投資收益都是10%,它們是一樣好嗎?
表3-1和表3-2所示分別為Y和Z的注冊(cè)客戶及投保的轉(zhuǎn)化情況,這是虛構(gòu)的數(shù)據(jù)表。
表3-1 Y的注冊(cè)客戶及投保的轉(zhuǎn)化情況

由表3-1和表3-2可知,Y和Z兩家保險(xiǎn)公司擁有相同的客戶注冊(cè)數(shù),但第1個(gè)月的成功投保客戶數(shù)分別為1755萬(wàn)戶、1950萬(wàn)戶,這說(shuō)明Z的注冊(cè)投保轉(zhuǎn)化率高,即從這個(gè)角度來(lái)看,Z更好;注冊(cè)后第2個(gè)月的成功投保客戶數(shù)分別為1120萬(wàn)戶、1791萬(wàn)戶,以及留存率分別為64%、92%,這說(shuō)明Z的留存做得很好;注冊(cè)后第6個(gè)月的成功投保客戶數(shù)分別為50萬(wàn)戶、560萬(wàn)戶,以及留存率分別為50%、93%,Z在留存方面做得非常好。
表3-2 Z的注冊(cè)客戶及投保的轉(zhuǎn)化情況

然而,實(shí)際上,Z在新增客戶方面做得不如Y,而Y的留存客戶做得不如Z。作為風(fēng)險(xiǎn)投資/私募股權(quán),如果一定要在兩者中選擇其一的話,Z是優(yōu)于Y的,因?yàn)樵谝患以缙诠荆a(chǎn)品和客戶留存的重要性是優(yōu)于其他的。如果留存做得足夠好,只要公司掌握或采取恰當(dāng)?shù)倪\(yùn)營(yíng)方式,那么就能夠厚積薄發(fā);反之,如果只有增長(zhǎng)、沒(méi)有留存——典型的“狗熊掰棒子”,就很可能永遠(yuǎn)都抓不住客戶真正的痛點(diǎn),最后什么都沒(méi)有。
使用Cohort分析剖析數(shù)據(jù)主要分為兩步。第一,需要制作Cohort表,就像表3-1和表3-2的結(jié)構(gòu)一樣。表中第一列應(yīng)以研究目的為核心,選擇時(shí)間維度所對(duì)應(yīng)的月份或周進(jìn)行排列。如果所做的表是給投資人看的,那么時(shí)間長(zhǎng)度一般以月為單位比較合理;如果只是用于企業(yè)自己進(jìn)行監(jiān)控,那么以周為單位更加合理,這是因?yàn)橐灾転閱挝坏臄?shù)據(jù)更加敏感,同時(shí)保證了穩(wěn)定性,而以月為單位的數(shù)據(jù)穩(wěn)定但敏感性不足,以天為單位則過(guò)于敏感而缺乏穩(wěn)定性。表中第二列對(duì)應(yīng)每個(gè)自然月的新增客戶數(shù)或金額,右側(cè)的表格為當(dāng)月新增的客戶數(shù)或金額在后續(xù)每個(gè)月的留存情況,如表3-1中第1個(gè)月Y新增客戶數(shù)100萬(wàn)戶,在當(dāng)月流失了5萬(wàn)戶,剩余95萬(wàn)戶,在第2個(gè)月又流失了5萬(wàn)戶還剩下90萬(wàn)戶,以此類(lèi)推,最終客戶將流失殆盡。第二,基于Cohort表進(jìn)行分析,主要可以進(jìn)行橫向比較分析和縱向比較分析。橫向比較分析主要可以看出相應(yīng)企業(yè)或組織的每月新增客戶數(shù)在后續(xù)各月的留存情況,而縱向比較分析可以看出不同月份新增客戶數(shù),分別在當(dāng)月、下個(gè)月、下下個(gè)月等的留存表現(xiàn)如何。
因此,不同企業(yè)通過(guò)Cohort分析會(huì)看到不同的趨勢(shì)和問(wèn)題。以表3-2為例,從橫向比較分析來(lái)看,其留存數(shù)據(jù)最終會(huì)在某個(gè)月份之后停留在一個(gè)固定的留存率上,如某個(gè)月獲取的600萬(wàn)客戶,在半年后每個(gè)月的留存率都穩(wěn)定在92%左右,這就說(shuō)明這批客戶對(duì)企業(yè)具有黏性,能夠穩(wěn)定留存下來(lái),否則企業(yè)的留存率是一直下降的,哪怕流失的速度很慢,客戶也會(huì)在未來(lái)某個(gè)時(shí)間點(diǎn)流失殆盡。也就是說(shuō),不管新增多少客戶,最終也會(huì)沒(méi)有客戶的。從縱向比較分析來(lái)看,其留存數(shù)據(jù)應(yīng)該是越來(lái)越好的,因?yàn)楣緫?yīng)該不斷地根據(jù)歷史情況改進(jìn)產(chǎn)品、提高客戶體驗(yàn)等,所以往后加入的客戶將享受到更好的產(chǎn)品和服務(wù),擁有更好的體驗(yàn),后續(xù)幾個(gè)月的留存率就應(yīng)該呈上升趨勢(shì)。
通過(guò)以上橫向比較和縱向比較以及表格中的數(shù)據(jù)可以看出,Z還可以做得更好,因?yàn)樗總€(gè)月的留存率相對(duì)穩(wěn)定,而每個(gè)月的新增客戶數(shù)有所下降,這可能是市場(chǎng)容量有限等原因造成的。對(duì)于風(fēng)險(xiǎn)投資/私募股權(quán)來(lái)說(shuō),這樣的分析結(jié)果是非常好的,因?yàn)樗麄兡軌蚍浅G逦乜吹矫考移髽I(yè)的問(wèn)題和機(jī)會(huì),從而做出更加有利的選擇和決策。
在金融及經(jīng)濟(jì)中,Cohort分析就更能顯示自己的價(jià)值。例如,在股票中,金融分析師可以通過(guò)Cohort分析,分析出不同行業(yè)之間的時(shí)長(zhǎng)效應(yīng)、時(shí)期效應(yīng)和Cohort效應(yīng),從而找到不同行業(yè)之間的差異,也可以分析同一行業(yè)中不同企業(yè)之間“三效應(yīng)”差異。
Claudio Sapelli[9]基于智利1902—1978年的收入,利用Cohort分析研究收入分布的進(jìn)化情況,將這種進(jìn)化分解為Cohort、年齡和年的效應(yīng),主要采用基尼系數(shù)(Gini index)和泰爾指數(shù)(Theil index)來(lái)衡量收入分布,并以基尼系數(shù)和泰爾指數(shù)來(lái)觀察Cohort效應(yīng)的趨勢(shì),發(fā)現(xiàn)在開(kāi)始時(shí)上升,而后下降,最后發(fā)現(xiàn)教育平均水平和離散度都不能很好地解釋Cohort效應(yīng)。后續(xù)他將數(shù)據(jù)分成了3個(gè)時(shí)間段,通過(guò)回歸分析發(fā)現(xiàn),收入分布的進(jìn)化中上升的部分可以通過(guò)教育及相關(guān)變量解釋,下降的部分可以通過(guò)經(jīng)驗(yàn)來(lái)解釋。Cesar G Victora等[10]研究了低收入或中等收入國(guó)家中食物和營(yíng)養(yǎng)不良對(duì)人力資源及成人疾病的影響。
Erica Segall[11]認(rèn)為購(gòu)物模式隨時(shí)間發(fā)生變化有很多潛在的解釋,但多少是時(shí)長(zhǎng)造成的,多少是歷史的特殊時(shí)點(diǎn)或環(huán)境造成的,要分解不同的效應(yīng),來(lái)幫助我們看到購(gòu)物模式與年齡或時(shí)長(zhǎng)、消費(fèi)形成和偏好方式的關(guān)聯(lián),而且分析長(zhǎng)期消費(fèi)模式中的這些效應(yīng),我們可以區(qū)分出不同的趨勢(shì),有助于了解客戶的情況。Erica Segall將APC模型和需求模型相結(jié)合,發(fā)現(xiàn)Cohort效應(yīng)顯著提高了需求模型的預(yù)測(cè)能力,結(jié)果顯示不同時(shí)期出生的人形成Cohort偏好將影響人一生的購(gòu)買(mǎi)偏好,而且一些事件對(duì)人的影響效果是非均勻的。
在此,更值得關(guān)注的是,Cohort分析在風(fēng)險(xiǎn)管理中的應(yīng)用。在信用分析過(guò)程中,尤其是貸后管理,Vintage分析是關(guān)鍵。在審批階段,同一個(gè)月或周的進(jìn)件在未來(lái)一段時(shí)間內(nèi)逾期率如何變化,而每個(gè)月或周,相應(yīng)的審批政策或信貸政策都會(huì)發(fā)揮不同的作用,這些政策對(duì)逾期率的影響到底有多大?Vintage分析更多的是趨勢(shì)分析和判斷,而不能比較準(zhǔn)確地判斷時(shí)長(zhǎng)效應(yīng)、時(shí)期效應(yīng)、Cohort效應(yīng),不夠細(xì)化而造成策略制定和應(yīng)對(duì)措施的不足。正如Merijn Bosman[12]所說(shuō),當(dāng)從Cohort分析的視角來(lái)審視Vintage分析時(shí),Cohort分析可以通過(guò)拆分時(shí)長(zhǎng)效應(yīng)、時(shí)期效應(yīng)、Cohort效應(yīng)來(lái)增進(jìn)Vintage分析過(guò)程,分別量化出時(shí)長(zhǎng)效應(yīng)、時(shí)期效應(yīng)和Cohort效應(yīng),有助于信貸負(fù)責(zé)人更好地理解信貸的歷史表現(xiàn)和預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。
- 應(yīng)用江恩、波浪理論獲利
- IPO審核:審核要點(diǎn)、應(yīng)對(duì)策略、案例分析
- 周期真實(shí)義4:宿命與反抗(濤動(dòng)周期錄)
- 完勝資本2:公司投融資模式流程完全操作指南(第四版)
- 中國(guó)對(duì)外投資季度報(bào)告(2015年第2季度)
- 螞蟻金服:科技金融獨(dú)角獸的崛起
- 新時(shí)代中國(guó)資本市場(chǎng):創(chuàng)新發(fā)展、治理與開(kāi)放
- 險(xiǎn)資運(yùn)用新時(shí)代:國(guó)際模式與中國(guó)實(shí)踐
- 房地產(chǎn)信托業(yè)務(wù)投融資實(shí)務(wù)(第2版)
- 眾籌:傳統(tǒng)融資模式顛覆與創(chuàng)新
- 超腦行為金融學(xué)
- 我國(guó)國(guó)有商業(yè)銀行激勵(lì)與約束機(jī)制研究
- 長(zhǎng)期投資
- 金融科技概論
- 中國(guó)互聯(lián)網(wǎng)金融研究報(bào)告2015