官术网_书友最值得收藏!

? 聯(lián)邦學(xué)習(xí)的起源

相比于多方安全計(jì)算和可信執(zhí)行環(huán)境,聯(lián)邦學(xué)習(xí)絕對(duì)是最熱門的一類隱私計(jì)算。忽如一夜春風(fēng)來(lái),布局或應(yīng)用聯(lián)邦學(xué)習(xí)的企業(yè)沒有百家也有幾十家,除了互聯(lián)網(wǎng)大廠和技術(shù)研發(fā)企業(yè),很多傳統(tǒng)的金融機(jī)構(gòu)也都開始研究和關(guān)注聯(lián)邦學(xué)習(xí)。這是為什么?

聯(lián)邦學(xué)習(xí)底座的形態(tài)是一種分布式機(jī)器學(xué)習(xí),而人工智能的火熱自然成為聯(lián)邦學(xué)習(xí)發(fā)展的鋪墊。2012年以來(lái),人工智能的各類應(yīng)用逐步深入人們的生產(chǎn)生活。但人工智能有一個(gè)很重要的因素就是數(shù)據(jù),只有匯聚大量、優(yōu)質(zhì)的數(shù)據(jù),才能支撐模型應(yīng)用的效果。一個(gè)人工智能項(xiàng)目通常需要融合多個(gè)企業(yè)、多個(gè)部門或者多個(gè)地域的數(shù)據(jù),比如模擬用戶的消費(fèi)習(xí)慣,就需要其在不同平臺(tái)通過(guò)不同方式進(jìn)行消費(fèi)的記錄。但事實(shí)上,目前的情況是大部分企業(yè)內(nèi)部擁有的數(shù)據(jù)是規(guī)模小且特征維度不足的。如果想要直接匯聚、整合多個(gè)企業(yè)的數(shù)據(jù),就更困難,主要的掣肘是數(shù)據(jù)安全隱患和合規(guī)監(jiān)管要求。

站在公司商業(yè)利益的角度,已知其內(nèi)部自有的數(shù)據(jù)具有很大潛在價(jià)值,如果對(duì)外輸出數(shù)據(jù)進(jìn)行跨公司間的合作,將極大程度暴露自己的數(shù)據(jù)資源儲(chǔ)備,數(shù)據(jù)安全風(fēng)險(xiǎn)極大,必會(huì)損害企業(yè)利益。與此同時(shí),2016年歐盟通過(guò)《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,簡(jiǎn)稱GDPR)嚴(yán)格約束個(gè)人隱私數(shù)據(jù)的收集、傳輸、保留和處理,到美國(guó)《加州消費(fèi)者隱私法案》(California Consumer Privacy Act,簡(jiǎn)稱CCPA),再到我國(guó)網(wǎng)信辦起草的《數(shù)據(jù)安全管理辦法(征求意見稿)》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》出臺(tái),國(guó)內(nèi)外均在加強(qiáng)數(shù)據(jù)監(jiān)管,因此數(shù)據(jù)流通應(yīng)用必須在合規(guī)前提下是大勢(shì)所趨。

基于以上幾個(gè)方面,為了打通企業(yè)間的數(shù)據(jù)孤島、增強(qiáng)數(shù)據(jù)融合時(shí)的隱私保護(hù)問(wèn)題,聯(lián)邦學(xué)習(xí)應(yīng)運(yùn)而生。也正如國(guó)內(nèi)聯(lián)邦學(xué)習(xí)的倡導(dǎo)者、微眾銀行首席AI官楊強(qiáng)老師所說(shuō):聯(lián)邦學(xué)習(xí)將“領(lǐng)跑人工智能最后一公里”。

2016年,谷歌建立基于分布在多個(gè)設(shè)備上的數(shù)據(jù)集的機(jī)器學(xué)習(xí)模型,同時(shí)防止數(shù)據(jù)泄露。其初衷是針對(duì)多個(gè)手機(jī)終端,各自利用其本地?cái)?shù)據(jù),共同訓(xùn)練一個(gè)模型,保護(hù)終端數(shù)據(jù)和個(gè)人數(shù)據(jù)隱私,在終端數(shù)據(jù)不離開本地的前提下完成建模。事實(shí)上,聯(lián)邦學(xué)習(xí)的概念在機(jī)器學(xué)習(xí)的發(fā)展歷程中曾多次以不同的形式出現(xiàn),如面向隱私保護(hù)的機(jī)器學(xué)習(xí)(Privacy-Preserving Machine Learning)、分布式機(jī)器學(xué)習(xí)(Distributed Machine Learning)等。2016年歐盟《通用數(shù)據(jù)保護(hù)條例》出臺(tái),在數(shù)據(jù)合規(guī)監(jiān)管力度明顯增強(qiáng)的背景下,谷歌將聯(lián)邦學(xué)習(xí)的概念單獨(dú)拋出,重點(diǎn)強(qiáng)調(diào)隱私保護(hù),其相關(guān)的技術(shù)方案才受到更廣泛的關(guān)注。

在提出概念兩年后,谷歌又通過(guò)Towards Federated Learning at Scale:System Design發(fā)布了基于TensorFlow構(gòu)建的聯(lián)邦學(xué)習(xí)系統(tǒng),支持在數(shù)千萬(wàn)臺(tái)手機(jī)上搭載以實(shí)現(xiàn)可擴(kuò)展的、大規(guī)模的移動(dòng)端聯(lián)邦學(xué)習(xí)。

自聯(lián)邦學(xué)習(xí)提出之后,其場(chǎng)景范圍越來(lái)越廣泛,不同的技術(shù)提供方給出了各類相似的方案,比如微眾銀行參考谷歌的架構(gòu)在國(guó)內(nèi)推廣聯(lián)邦學(xué)習(xí)、螞蟻集團(tuán)融合MPC和TEE提出了“共享學(xué)習(xí)”、平安科技在聯(lián)邦學(xué)習(xí)的基礎(chǔ)上增加數(shù)據(jù)聯(lián)盟和聯(lián)邦推理業(yè)務(wù)并稱為“聯(lián)邦智能”、同盾科技也在聯(lián)邦學(xué)習(xí)的基礎(chǔ)上增加知識(shí)推理提出了“知識(shí)聯(lián)邦”。隨著近兩年市場(chǎng)對(duì)技術(shù)的認(rèn)知逐步普及,各類方案的名稱逐步統(tǒng)一。目前,在需要融合多方數(shù)據(jù)建模的場(chǎng)景下,能夠保護(hù)各參與方的本地?cái)?shù)據(jù)和模型訓(xùn)練的中間結(jié)果等隱私數(shù)據(jù)不被泄露的聯(lián)合建模都可以稱為聯(lián)邦學(xué)習(xí)。

主站蜘蛛池模板: 上高县| 饶平县| 富裕县| 竹溪县| 尉犁县| 万盛区| 天门市| 大足县| 辽阳县| 水城县| 抚远县| 新疆| 新田县| 黑河市| 香港 | 砀山县| 建湖县| 通许县| 比如县| 松溪县| 临颍县| 洪雅县| 横峰县| 天门市| 十堰市| 鄂州市| 柳江县| 吉水县| 阿巴嘎旗| 泰兴市| 宜兰市| 清苑县| 高台县| 镇雄县| 定结县| 洪雅县| 五莲县| 新昌县| 鄂尔多斯市| 泰州市| 广州市|