- 金融商業算法建模:基于Python和SAS
- 趙仁乾 田建中 葉本華 常國珍
- 1182字
- 2021-11-05 17:52:01
1.3.2 描述性——無監督學習
描述性分析指的是分析具有多個屬性的數據集,找出潛在的模式并進行分類。描述性分析是一種無監督的學習過程。區別于有監督的學習,無監督學習算法沒有參照指標,需要結合業務經驗來判斷數據分類是否正確。無監督學習比較耗時,而且對建模人員的業務素質要求較高。
描述性分析主要應用于以下兩種場景:第一種是觀察個體之間的相似程度,如根據年齡、性別、收入等進行客戶細分;第二種是根據客戶購買的多個產品發現產品之間的相關性,主要算法包括樣本聚類、關聯規則等。
(1)樣本聚類
根據個體之間的相似性對個體進行分類,即樣本聚類算法。這種算法被大量使用在客戶細分場景中。如圖1-14所示,根據信用卡客戶6個月內的循環信用次數和交易次數,將客戶分為6個細分群體,并對其規模進行描述。

圖1-14 信用卡客戶細分模型描述
以往企業的客戶分析往往是單維度的。例如,電信企業VIP用戶等級是根據消費金額劃分的。上述信用卡例子只是二維的聚類情況。這種情況其實并不需要聚類算法,只要將客戶分布情況展現在二維平面圖上就可以。當維度增加時,我們難以使用圖像的方式形象地描述客戶類型,只能使用聚類算法。
(2)關聯規則
根據客戶對商品的購買發現商品之間的相關性。例如關聯規則,這類分析方法可以方便地展現產品與產品之間的相關關系?!捌【婆c尿布”是最著名的使用關聯規則的案例之一。零售超市通過分析客戶購買清單發現,啤酒和尿布這兩個產品經常同時銷售,于是超市通過改變物品碼放的位置提高了銷售業績。這類算法在電商中運用十分廣泛,如京東商城和淘寶,它們根據客戶瀏覽及購買歷史來推薦商品。同樣,金融領域也常用此類算法向客戶推薦不同的理財產品。如下面的示例,在購買基金的客戶中,有大約22%的客戶購買了集合資產管理計劃教程。而全體客戶中購買了集合資產管理計劃教程的只有9.7%。因此,其提升度約為2.26(22/9.7)。這個提升度是很有意義的,表明向基金用戶營銷集合資產管理計劃將有更高的響應率。同理,在購買基金的客戶中營銷黃金理財方案也會有較高的響應率。
購買了基金的客戶還購買下列產品的可能性為28%,如圖1-15所示。

圖1-15 購買基金的客戶同時購買其他理財產品的情況
雖然根據該算法可以得到很多有價值的知識,但是該算法并不能給出因果關系。因此,在“啤酒與尿布”案例中,零售超市使用關聯規則得到某些推定結果就會有一些困難。零售超市可能有兩個訴求:一個是提高客戶購物的便捷性,另一個就是提高客戶的即興購物量。這就需要搞清楚啤酒和尿布之間的關系。如果兩者是強互補品,而且當地只有一家超市,那么超市完全可以把兩個商品擺放在較遠的距離。如果兩者并不是強互補品,只不過是一定條件下出現的結果,例如,啤酒不過是年輕父親出門買尿布時方便獲取的一種遮羞物品,那么將兩者擺放在一起更好。而關聯規則顯然沒有辦法說明零售超市提供啤酒和尿布之間是否具有因果關系,無法為超市決策提供更明顯的指向性。