- 智能風控:評分卡建模原理、方法與風控策略構建
- 張偉
- 2789字
- 2021-12-01 14:05:15
前言
為什么要寫本書
近些年來,智能風控技術在金融風險管理中的應用越來越廣泛。智能風控利用金融大數據、機器學習、深度學習、強化學習、時序數據分析、異常檢測、社交網絡分析、圖深度學習、知識圖譜、自然語言處理、文本挖掘等智能分析建模技術,以及分布式計算、實時流式計算、實時決策引擎、設備行為分析等數據工程技術,賦能金融風控管理,極大地提升了風險決策的準確性和效率。而評分卡模型作為智能風控技術的基礎部分,以其良好的可解釋性和穩定性廣泛應用于金融領域。系統地掌握評分卡建模技術是很有必要的,既有助于直接進行量化建模,為金融風控提供決策支持,又有助于加深對風險建模的理解和認識,提升風險建模能力。
十多年前我初入金融風控領域,便是從評分卡建模開始上手的,至今一直從事風險量化建模、風控策略設計、風險解決方案相關工作。在早期做評分卡建模時,我對評分卡沒有太深刻的認識。正所謂“無知者無畏”,我認為評分卡建模是很簡單的事情。隨著工作經驗的不斷積累,我逐漸嘗試從更高層面分析和建模:1)從宏觀建模全生命周期流程及全面風控體系的角度構建模型;2)開始深入探究和思考建模的技術細節;3)更加重視從業務角度(而非純技術角度)思考建模問題。此外,我開始更深刻地理解評分卡建模技術的精妙之處,并對建模技術進行了系統性的思考、梳理和總結,也正是因為有了系統性的思考和總結,才有了本書的初稿。
近幾年我經常參加智能風控和數據分析的線下交流活動,也曾受邀作為講師為金融機構做內部風控培訓,了解到很多風險建模人員都對評分卡建模缺乏深刻的理解。市面上已有的介紹評分卡建模技術的圖書或者側重理論介紹,實戰內容很少,或者過于聚焦零散的技術片段和細枝末節,不夠系統。不少朋友希望能有一本全面系統地介紹建模全流程和方法的圖書,并能兼顧業務和技術,本書就是在此背景下完成的。
我曾在FICO和Accenture任職十余年,熟悉銀行傳統風控體系的思想、方法、技術和工具,近幾年我又在國內領先的金融科技公司負責智能風控解決方案、風險策略設計和風險建模技術的創新研究,深刻體會到,在理解金融風險業務本質特征的基礎上,既能繼承傳統金融風控核心技術,又能在人工智能背景下創新智能風控技術,實現“傳統風控+智能風控”雙引擎驅動,對從事金融風控的人員而言是很有必要的。在本書策劃編輯楊福川的邀請下,我基于這些工作經驗以及對智能風控的理解寫了本書,供廣大已從事或擬從事智能風控工作的讀者參考,以期促進行業交流和人才技能提升。
讀者對象
本書主要面向以下讀者:
- 在金融機構(特別是商業銀行、信用卡中心、持牌消費金融機構等)從事風險量化建模、風險數據分析、風控業務策略設計的人員;
- 在金融科技公司、互聯網公司等科技類公司從事風險量化建模、風險數據分析、風控業務策略設計的人員;
- 對智能風控技術感興趣的其他人員;
- 智能風控相關專業的在校學生。
本書特色
- 注重實戰,代碼豐富:本書基于作者十余年風險建模和風控策略經驗,對評分卡建模技術進行了系統的梳理和總結,所介紹的內容都是實際風險建模工作中能用到的。另外還給出了豐富的Python代碼示例,具有較強的實踐性。
- 結構清晰,邏輯嚴謹:本書不僅包括模型本身的設計、開發、驗證,還包括模型的工程部署、監控和優化,按建模方法論的流程對建模的各環節依次進行介紹。
- 新視角、新觀點、新思考:本書在部分技術點上提出了一些新看法和新觀點,特別是我對模型的系統化思考、對拒絕推斷的理解、對業務需求的理解等方面,以期拋磚引玉,引起更廣泛的交流和探討。
- 融入最新建模技術:評分卡建模是相對傳統的建模技術,我結合當前機器學習領域熱點技術,介紹了特征工程、高維機器學習等最新技術。
如何閱讀本書
本書內容分為6個部分。
第1章介紹評分卡入門知識,包括評分卡模型的概念和定義、評分卡建模全流程、對模型的評價等,以概念性內容介紹為主,幫助讀者初步了解評分卡的基本概念。
第2章介紹零售信貸業務基礎知識,包括銀行零售信貸領域產品特征、業務流程,以及信用風險概念、欺詐風險概念,幫助讀者理解評分卡的應用場景和要解決的業務問題。
第3~11章介紹評分卡建模全流程,是全書核心內容,覆蓋業務需求理解、數據理解、特征工程、模型設計、模型開發、模型驗證、模型部署、模型監控、模型優化等模型全生命周期的各個環節。該部分以技術介紹為主,幫助讀者系統地掌握模型需求、設計、開發、測試、部署和應用全流程技術。
第12~14章介紹評分卡建模關鍵問題,包括拒絕推斷問題、可解釋性問題,以及模型開發過程中諸如分布不均衡、模型性能下降等常見問題及應對方案。
第15章介紹高維機器學習,討論了當前業界除評分卡外使用頻率較高的高維機器學習技術,并重點介紹了XGBoost和LightGBM模型。
第16章介紹風險策略應用,以貸前自動化審批場景為例,介紹了基于風險評分的自動化審批策略構建方法,幫助讀者理解評分卡模型在風險策略設計中的應用。
本書是量化建模方法論的系統性總結和介紹,無論是對于已經從事評分卡建模多年的“老兵”,還是剛入行或即將入行的“新手”,都具有較好的參考價值。本書既可以作為系統性介紹評分卡建模技術的教科書,帶領讀者進行系統學習,也可以作為案頭工具書,供讀者在工作過程中隨時查閱和參考。
勘誤和支持
由于作者的水平有限,加之撰寫時間倉促,書中難免會出現一些錯誤、疏漏或者不準確的地方,歡迎各位讀者和專家批評指正??梢酝ㄟ^如下方式與作者交流或獲得支持。
- 本書專屬代碼托管GitHub:https://github.com/jackzhang83/ScoreCard。
- 知乎:https://www.zhihu.com/people/boypet。
致謝
本書內容基于我十余年風險建模和風控策略經驗。首先要感謝領我進門的前輩,既包括我工作過的公司的領導、技術專家和業務專家,也包括在我參與過的20余個大中型銀行項目實施過程中與我深入交流的行方領導和業務專家。
特別感謝上海交通大學上海高級金融學院李祥林(David X. Li)教授、樂信集團首席風控官喬楊先生和同盾科技副總裁余旭鑫博士百忙之中抽出時間為本書作序。李祥林教授是信用風險特別是信用衍生品估值定價領域的知名學者和行業領先實踐者,其基于Copula的信用衍生品定價原理在行業得到廣泛應用。喬楊先生曾在Discover和京東數科工作多年,他撰寫的《數據化風控》是風控建模從業者必讀參考書。余旭鑫博士很重視咨詢的專業性和價值,對于模型風險有獨到見解,是國內模型風險管理(MRM)的積極倡導者。
其次感謝來自智能風控和數據分析行業交流圈的朋友。我一直推崇“三人行,必有吾師”之訓,非常樂于參與或組織行業交流,也有幸認識了許多業內同行,在交流過程中思想的碰撞對我有很大啟發。
感謝機械工業出版社華章公司的策劃編輯楊福川,他在近一年的時間中不斷地鼓勵我,并對本書的寫作提出了一些建設性的意見。感謝本書責任編輯韓蕊,她認真審校了全書,并提出了不少中肯的建議。
最后感謝我的妻子邢夢娟和我的女兒。寫作需要犧牲不少陪伴家人的時間,她們非常理解和支持我;寫作是一個既享受又折磨人的過程,她們給予我不少鼓勵和督促。
張偉(筆名:上善若愚)
2021年11月