- 隱私計(jì)算:推進(jìn)數(shù)據(jù)“可用不可見”的關(guān)鍵技術(shù)
- 閆樹等
- 1274字
- 2022-05-06 17:14:40
? 聯(lián)邦學(xué)習(xí)的起源
相比于多方安全計(jì)算和可信執(zhí)行環(huán)境,聯(lián)邦學(xué)習(xí)絕對(duì)是最熱門的一類隱私計(jì)算。忽如一夜春風(fēng)來(lái),布局或應(yīng)用聯(lián)邦學(xué)習(xí)的企業(yè)沒有百家也有幾十家,除了互聯(lián)網(wǎng)大廠和技術(shù)研發(fā)企業(yè),很多傳統(tǒng)的金融機(jī)構(gòu)也都開始研究和關(guān)注聯(lián)邦學(xué)習(xí)。這是為什么?
聯(lián)邦學(xué)習(xí)底座的形態(tài)是一種分布式機(jī)器學(xué)習(xí),而人工智能的火熱自然成為聯(lián)邦學(xué)習(xí)發(fā)展的鋪墊。2012年以來(lái),人工智能的各類應(yīng)用逐步深入人們的生產(chǎn)生活。但人工智能有一個(gè)很重要的因素就是數(shù)據(jù),只有匯聚大量、優(yōu)質(zhì)的數(shù)據(jù),才能支撐模型應(yīng)用的效果。一個(gè)人工智能項(xiàng)目通常需要融合多個(gè)企業(yè)、多個(gè)部門或者多個(gè)地域的數(shù)據(jù),比如模擬用戶的消費(fèi)習(xí)慣,就需要其在不同平臺(tái)通過(guò)不同方式進(jìn)行消費(fèi)的記錄。但事實(shí)上,目前的情況是大部分企業(yè)內(nèi)部擁有的數(shù)據(jù)是規(guī)模小且特征維度不足的。如果想要直接匯聚、整合多個(gè)企業(yè)的數(shù)據(jù),就更困難,主要的掣肘是數(shù)據(jù)安全隱患和合規(guī)監(jiān)管要求。
站在公司商業(yè)利益的角度,已知其內(nèi)部自有的數(shù)據(jù)具有很大潛在價(jià)值,如果對(duì)外輸出數(shù)據(jù)進(jìn)行跨公司間的合作,將極大程度暴露自己的數(shù)據(jù)資源儲(chǔ)備,數(shù)據(jù)安全風(fēng)險(xiǎn)極大,必會(huì)損害企業(yè)利益。與此同時(shí),2016年歐盟通過(guò)《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,簡(jiǎn)稱GDPR)嚴(yán)格約束個(gè)人隱私數(shù)據(jù)的收集、傳輸、保留和處理,到美國(guó)《加州消費(fèi)者隱私法案》(California Consumer Privacy Act,簡(jiǎn)稱CCPA),再到我國(guó)網(wǎng)信辦起草的《數(shù)據(jù)安全管理辦法(征求意見稿)》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》出臺(tái),國(guó)內(nèi)外均在加強(qiáng)數(shù)據(jù)監(jiān)管,因此數(shù)據(jù)流通應(yīng)用必須在合規(guī)前提下是大勢(shì)所趨。
基于以上幾個(gè)方面,為了打通企業(yè)間的數(shù)據(jù)孤島、增強(qiáng)數(shù)據(jù)融合時(shí)的隱私保護(hù)問(wèn)題,聯(lián)邦學(xué)習(xí)應(yīng)運(yùn)而生。也正如國(guó)內(nèi)聯(lián)邦學(xué)習(xí)的倡導(dǎo)者、微眾銀行首席AI官楊強(qiáng)老師所說(shuō):聯(lián)邦學(xué)習(xí)將“領(lǐng)跑人工智能最后一公里”。
2016年,谷歌建立基于分布在多個(gè)設(shè)備上的數(shù)據(jù)集的機(jī)器學(xué)習(xí)模型,同時(shí)防止數(shù)據(jù)泄露。其初衷是針對(duì)多個(gè)手機(jī)終端,各自利用其本地?cái)?shù)據(jù),共同訓(xùn)練一個(gè)模型,保護(hù)終端數(shù)據(jù)和個(gè)人數(shù)據(jù)隱私,在終端數(shù)據(jù)不離開本地的前提下完成建模。事實(shí)上,聯(lián)邦學(xué)習(xí)的概念在機(jī)器學(xué)習(xí)的發(fā)展歷程中曾多次以不同的形式出現(xiàn),如面向隱私保護(hù)的機(jī)器學(xué)習(xí)(Privacy-Preserving Machine Learning)、分布式機(jī)器學(xué)習(xí)(Distributed Machine Learning)等。2016年歐盟《通用數(shù)據(jù)保護(hù)條例》出臺(tái),在數(shù)據(jù)合規(guī)監(jiān)管力度明顯增強(qiáng)的背景下,谷歌將聯(lián)邦學(xué)習(xí)的概念單獨(dú)拋出,重點(diǎn)強(qiáng)調(diào)隱私保護(hù),其相關(guān)的技術(shù)方案才受到更廣泛的關(guān)注。
在提出概念兩年后,谷歌又通過(guò)Towards Federated Learning at Scale:System Design發(fā)布了基于TensorFlow構(gòu)建的聯(lián)邦學(xué)習(xí)系統(tǒng),支持在數(shù)千萬(wàn)臺(tái)手機(jī)上搭載以實(shí)現(xiàn)可擴(kuò)展的、大規(guī)模的移動(dòng)端聯(lián)邦學(xué)習(xí)。
自聯(lián)邦學(xué)習(xí)提出之后,其場(chǎng)景范圍越來(lái)越廣泛,不同的技術(shù)提供方給出了各類相似的方案,比如微眾銀行參考谷歌的架構(gòu)在國(guó)內(nèi)推廣聯(lián)邦學(xué)習(xí)、螞蟻集團(tuán)融合MPC和TEE提出了“共享學(xué)習(xí)”、平安科技在聯(lián)邦學(xué)習(xí)的基礎(chǔ)上增加數(shù)據(jù)聯(lián)盟和聯(lián)邦推理業(yè)務(wù)并稱為“聯(lián)邦智能”、同盾科技也在聯(lián)邦學(xué)習(xí)的基礎(chǔ)上增加知識(shí)推理提出了“知識(shí)聯(lián)邦”。隨著近兩年市場(chǎng)對(duì)技術(shù)的認(rèn)知逐步普及,各類方案的名稱逐步統(tǒng)一。目前,在需要融合多方數(shù)據(jù)建模的場(chǎng)景下,能夠保護(hù)各參與方的本地?cái)?shù)據(jù)和模型訓(xùn)練的中間結(jié)果等隱私數(shù)據(jù)不被泄露的聯(lián)合建模都可以稱為聯(lián)邦學(xué)習(xí)。
- 攻守道:企業(yè)數(shù)字業(yè)務(wù)安全風(fēng)險(xiǎn)與防范
- 網(wǎng)絡(luò)安全與管理
- 科技安全:戰(zhàn)略實(shí)踐與展望
- 數(shù)字身份與元宇宙信任治理
- 計(jì)算機(jī)網(wǎng)絡(luò)安全技術(shù)(第6版·慕課版)
- API安全實(shí)戰(zhàn)
- Practical Network Scanning
- 等級(jí)保護(hù)測(cè)評(píng)理論及應(yīng)用
- 安全實(shí)戰(zhàn)之滲透測(cè)試
- 隱私計(jì)算
- 數(shù)字政府網(wǎng)絡(luò)安全合規(guī)性建設(shè)指南:密碼應(yīng)用與數(shù)據(jù)安全
- 交換機(jī)·路由器·防火墻(第2版)
- Securing Network Infrastructure
- CCNA Security 210-260 Certification Guide
- 大數(shù)據(jù)安全治理與防范:反欺詐體系建設(shè)