官术网_书友最值得收藏!

1.2 金融數據價值挖掘的聯邦學習實踐

銀行、證券、保險、信托等不同金融領域的企業,由于業務發展的需要,對與外部開展數據共享、流通、交易有著巨大而強烈的需求。數據只有通過共享、流通才能體現出自身巨大的價值,進而賦能金融行業,然而數據泄露事件不斷發生,引起各界廣泛關注。數據所有權的確定、數據所有權和數據使用權的分離,成了數據流通首先需要解決的嚴峻問題。

聯邦學習為數據共享、流通、交易提供了一種可行的支撐技術和解決方案,包括聯合學習、隱私計算技術在內的多種技術和概念,引起了金融行業和金融科技行業的廣泛關注,被寄予厚望。

數字化轉型是中國經濟發展的重要動力和途徑,金融行業是這輪數字化轉型的重點領域。結合金融行業的應用,在數據聯合查詢、聯合統計和聯合建模等多種數據應用場景中,在風險管理控制、客戶運營、產品推薦和營銷等典型業務應用場景中,聯邦學習技術都有強烈的應用需求和巨大的應用潛力。

2020年9月14日,中國人民銀行副行長、國家外匯管理局局長潘功勝表示,我國金融行業實行的是分業經營、分業監管模式。金融控股公司是國際上的主要經濟體廣泛采用的一種模式,由金融子公司實行分業經營[39]。潘功勝指出,這種制度框架具有簡單明晰、可識別的股權和組織架構,對金融行業的風險隔離有優勢。隨著經濟的發展,特別是金融行業的發展,我國的金融改革不斷深入。近年來,金融行業出現了一些新的情況:一方面,一些大型金融機構開展跨行業投資,形成金融集團;另一方面,部分非金融企業,通過股權投資等多種形式控股了多家不同業務領域的金融機構,事實上具有了金融控股公司的特征。這一變化已經引起了政府部門和監管機構的高度重視。加強對金融控股公司的治理和風險管控,符合現代金融監管的要求。

隨著金融行業模式的不斷創新,在國內已經出現的跨多個傳統金融領域的大型金融控股集團中,常常包括銀行、證券、保險、信托等多種金融企業。中信集團、中國光大集團等在金融行業之外,還涵蓋了健康、旅游、環保等多個非傳統金融行業。隨著數據挖掘、人工智能等技術日趨成熟且應用廣泛,各類數據的數量呈現幾何級數增長,大數據已成為企業重要的基礎性資源。對于一個集團的長期發展來說,數據不僅是基礎性資源,還是可以深挖價值、給集團帶來直接經濟利益的資產。在大數據時代,數據的生產要素化將成為衡量企業價值的重要標準,企業在未來競爭格局中的地位在很大程度上由其決定。

數據具有的屬性眾多,常見的分類包括物理屬性、存在屬性和信息屬性等。物理屬性是指數據需占用物理的存儲介質,可傳輸、可度量。存在屬性是指數據以人類可感知的形式存在。信息屬性是指數據本身所代表的含義。數據的價值在于能夠通過分析和挖掘的過程來消除信息的不對稱,從而獲取信息,推動業務發展,實現盈利,而這些預期需求的實現都需要數據存在且能夠帶來正確、有效的信息,要保證數據的質量。數據治理是保證數據質量的必需手段,同時也是多機構集團型企業提升管理能力的重要任務。

然而,由于集團型企業廣泛存在著業態多樣、人員分散、管理流程和模式差異大的特點,集團型企業內部的數據治理工作面臨巨大的困難和挑戰。金融控股集團內各個子公司的主營業務相差巨大,行業細分的數據標準和規范各有特點、不盡相同,從而增加了不同企業間數據互聯互通和共享創造價值的復雜度,數據多源異構現象和“信息孤島”現象普遍存在。此外,成員企業的信息化、數字化水平和發展階段各不相同。對于個別傳統業務來說,企業的信息化水平較為薄弱,數據的采集和整理甚至還停留在手工錄入傳遞階段,導致了數據質量在各個源頭就不能得到有效保障。因此,集團的數據治理需要按照相應的標準、規范、流程和方法等,確保數據統一管理和高效流動,讓數據用起來,在使用的過程中挖掘出數據資產價值。擁有數據,并不意味著就擁有了數據資產。只有通過創新性的方法聯合各方有效、準確的數據,在數據中挖掘到有效的信息,數據才能算資產。

通過參照國際數據管理協會(DAMA)、數據治理研究所(DGI)等權威機構構建的包括數據管理能力成熟度評估模型(DCMM)在內的權威方法論,結合金融控股集團自身多業態、多法人、信息化水平參差不齊等特點,可以構建具有金融控股集團特色的數據治理架構,如圖1-2-1所示。

img

圖1-2-1 金融控股集團的數據治理架構(以中國光大集團為例)

在跨機構數據治理實踐中,中國光大集團以組織架構、參與角色的權利與責任為基礎組織保障,在數據合規和數據安全的前提下開展數據資產管理工作,通過制定數據標準提升數據質量,創造數據價值,逐步實現“看見—看清—看懂—決策”的經營管理目標,進而實現建設一個開放、共享、合規、智能的“數字光大”生態圈的戰略愿景[39]

為了打破“數據孤島”的現實局面,同時最大限度地整合、復用各機構內外部的數據資源,推進數據價值創新、創造,建立跨機構的數據港平臺是最佳的解決方式。特別是在多業務、多機構的金融控股集團內部,以中國光大集團的實踐為例,統一的集團數據港平臺在數據價值挖掘和為集團戰略轉型賦能的過程中應運而生。

數據港平臺計劃匯集集團內外分散的各類數據,建設數據資產全生命周期、數據標準與質量閉環、數據合規與安全管理等管理機制,最大限度地復用資源,加速前端業務創新。數據港平臺是集團科技助力業務創新的基礎,其核心能力包括基礎能力、融合能力、可視化能力和智能化能力。

數據港平臺用大數據技術構建基礎平臺,針對數據工作的流程特點,分別對接全面服務:通過數據采集平臺與成員企業統一部署采集模式,進行數據存儲與元數據管理;通過外部數據平臺統一外部數據管理機制,對成員企業提供外部數據接口與服務;通過數據資產平臺進行數據質量檢核,整合指標數據的管理與加工,提供數據資產地圖服務;通過數據模型實驗室搭建自然語言處理、機器學習等基礎環境,進行數據模型訓練和數據挖掘工作。

在數據挖掘的過程中,跨機構的客戶和產品的數據具有更大的可挖掘價值,但數據的敏感性也更強。隨著大眾對用戶隱私保護的要求越來越高,各地的監管機構針對個人隱私數據的擁有權和安全性出臺了強監管的法規。企業必須滿足客戶對數據隱私保護的要求,加強對數據安全和用戶隱私的保護。基于數據合規和行業監管的要求,客戶、產品數據的上收存在著法律規范上的困難,數據源之間的壁壘很難被打破。

大數據是人工智能的基礎,研究表明模型的準確率與訓練數據量成正比,在金融領域中對數據的強監管限制了數據的融合與使用。為了解決此類問題,聯邦學習正好可以發揮自己的作用,在保護數據隱私的前提下實現數據分析和數據價值挖掘。聯邦學習本身是一種在保護隱私的前提下,進行機器學習的方式。數據的擁有方完全可以在數據不出本地的情況下,聯合訓練,建立模型,各方根據自己本地的數據在模型訓練中計算模型參數的更新量,然后將更新結果進行聚合,如此一直迭代到收斂停機。聯邦學習既保證了每個終端的用戶數據不出本地,各個終端又可以同時共享一個通用的模型。在實現模型訓練的同時,聯邦學習框架提供的一系列算法,可以實現在各方明細數據不出本地的情況下的樣本對齊和相關統計量計算。例如,中國光大集團基于集團數據港的聯邦學習平臺,以客戶為中心,以聯邦學習為核心技術支撐實現了客戶拉通、客戶交叉營銷和風控,從而實現了智能、高效的業務協同[39]

主站蜘蛛池模板: 芒康县| 武乡县| 聊城市| 青冈县| 安达市| 兰考县| 长葛市| 井陉县| 宁德市| 望江县| 崇仁县| 蓝山县| 余庆县| 远安县| 延川县| 朝阳区| 满洲里市| 岗巴县| 昭通市| 西贡区| 九龙坡区| 兴城市| 吉安县| 嫩江县| 综艺| 彝良县| 科技| 石城县| 吐鲁番市| 扬州市| 达孜县| 福州市| 中西区| 沈丘县| 开化县| 巴里| 金门县| 炎陵县| 灵川县| 东方市| 延边|