最招财财神爷图片大全卡通

書名：隱私計(jì)算：推進(jìn)數(shù)據(jù)“可用不可見”的關(guān)鍵技術(shù)
作者名：閆樹等
本章字?jǐn)?shù)： 1274字
更新時(shí)間： 2022-05-06 17:14:40

? 聯(lián)邦學(xué)習(xí)的起源

相比于多方安全計(jì)算和可信執(zhí)行環(huán)境，聯(lián)邦學(xué)習(xí)絕對(duì)是最熱門的一類隱私計(jì)算。忽如一夜春風(fēng)來(lái)，布局或應(yīng)用聯(lián)邦學(xué)習(xí)的企業(yè)沒有百家也有幾十家，除了互聯(lián)網(wǎng)大廠和技術(shù)研發(fā)企業(yè)，很多傳統(tǒng)的金融機(jī)構(gòu)也都開始研究和關(guān)注聯(lián)邦學(xué)習(xí)。這是為什么？

聯(lián)邦學(xué)習(xí)底座的形態(tài)是一種分布式機(jī)器學(xué)習(xí)，而人工智能的火熱自然成為聯(lián)邦學(xué)習(xí)發(fā)展的鋪墊。2012年以來(lái)，人工智能的各類應(yīng)用逐步深入人們的生產(chǎn)生活。但人工智能有一個(gè)很重要的因素就是數(shù)據(jù)，只有匯聚大量、優(yōu)質(zhì)的數(shù)據(jù)，才能支撐模型應(yīng)用的效果。一個(gè)人工智能項(xiàng)目通常需要融合多個(gè)企業(yè)、多個(gè)部門或者多個(gè)地域的數(shù)據(jù)，比如模擬用戶的消費(fèi)習(xí)慣，就需要其在不同平臺(tái)通過(guò)不同方式進(jìn)行消費(fèi)的記錄。但事實(shí)上，目前的情況是大部分企業(yè)內(nèi)部擁有的數(shù)據(jù)是規(guī)模小且特征維度不足的。如果想要直接匯聚、整合多個(gè)企業(yè)的數(shù)據(jù)，就更困難，主要的掣肘是數(shù)據(jù)安全隱患和合規(guī)監(jiān)管要求。

站在公司商業(yè)利益的角度，已知其內(nèi)部自有的數(shù)據(jù)具有很大潛在價(jià)值，如果對(duì)外輸出數(shù)據(jù)進(jìn)行跨公司間的合作，將極大程度暴露自己的數(shù)據(jù)資源儲(chǔ)備，數(shù)據(jù)安全風(fēng)險(xiǎn)極大，必會(huì)損害企業(yè)利益。與此同時(shí)，2016年歐盟通過(guò)《通用數(shù)據(jù)保護(hù)條例》（General Data Protection Regulation，簡(jiǎn)稱GDPR）嚴(yán)格約束個(gè)人隱私數(shù)據(jù)的收集、傳輸、保留和處理，到美國(guó)《加州消費(fèi)者隱私法案》（California Consumer Privacy Act，簡(jiǎn)稱CCPA），再到我國(guó)網(wǎng)信辦起草的《數(shù)據(jù)安全管理辦法（征求意見稿）》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》出臺(tái)，國(guó)內(nèi)外均在加強(qiáng)數(shù)據(jù)監(jiān)管，因此數(shù)據(jù)流通應(yīng)用必須在合規(guī)前提下是大勢(shì)所趨。

基于以上幾個(gè)方面，為了打通企業(yè)間的數(shù)據(jù)孤島、增強(qiáng)數(shù)據(jù)融合時(shí)的隱私保護(hù)問(wèn)題，聯(lián)邦學(xué)習(xí)應(yīng)運(yùn)而生。也正如國(guó)內(nèi)聯(lián)邦學(xué)習(xí)的倡導(dǎo)者、微眾銀行首席AI官楊強(qiáng)老師所說(shuō)：聯(lián)邦學(xué)習(xí)將“領(lǐng)跑人工智能最后一公里”。

2016年，谷歌建立基于分布在多個(gè)設(shè)備上的數(shù)據(jù)集的機(jī)器學(xué)習(xí)模型，同時(shí)防止數(shù)據(jù)泄露。其初衷是針對(duì)多個(gè)手機(jī)終端，各自利用其本地?cái)?shù)據(jù)，共同訓(xùn)練一個(gè)模型，保護(hù)終端數(shù)據(jù)和個(gè)人數(shù)據(jù)隱私，在終端數(shù)據(jù)不離開本地的前提下完成建模。事實(shí)上，聯(lián)邦學(xué)習(xí)的概念在機(jī)器學(xué)習(xí)的發(fā)展歷程中曾多次以不同的形式出現(xiàn)，如面向隱私保護(hù)的機(jī)器學(xué)習(xí)（Privacy-Preserving Machine Learning）、分布式機(jī)器學(xué)習(xí)（Distributed Machine Learning）等。2016年歐盟《通用數(shù)據(jù)保護(hù)條例》出臺(tái)，在數(shù)據(jù)合規(guī)監(jiān)管力度明顯增強(qiáng)的背景下，谷歌將聯(lián)邦學(xué)習(xí)的概念單獨(dú)拋出，重點(diǎn)強(qiáng)調(diào)隱私保護(hù)，其相關(guān)的技術(shù)方案才受到更廣泛的關(guān)注。

在提出概念兩年后，谷歌又通過(guò)Towards Federated Learning at Scale：System Design發(fā)布了基于TensorFlow構(gòu)建的聯(lián)邦學(xué)習(xí)系統(tǒng)，支持在數(shù)千萬(wàn)臺(tái)手機(jī)上搭載以實(shí)現(xiàn)可擴(kuò)展的、大規(guī)模的移動(dòng)端聯(lián)邦學(xué)習(xí)。

自聯(lián)邦學(xué)習(xí)提出之后，其場(chǎng)景范圍越來(lái)越廣泛，不同的技術(shù)提供方給出了各類相似的方案，比如微眾銀行參考谷歌的架構(gòu)在國(guó)內(nèi)推廣聯(lián)邦學(xué)習(xí)、螞蟻集團(tuán)融合MPC和TEE提出了“共享學(xué)習(xí)”、平安科技在聯(lián)邦學(xué)習(xí)的基礎(chǔ)上增加數(shù)據(jù)聯(lián)盟和聯(lián)邦推理業(yè)務(wù)并稱為“聯(lián)邦智能”、同盾科技也在聯(lián)邦學(xué)習(xí)的基礎(chǔ)上增加知識(shí)推理提出了“知識(shí)聯(lián)邦”。隨著近兩年市場(chǎng)對(duì)技術(shù)的認(rèn)知逐步普及，各類方案的名稱逐步統(tǒng)一。目前，在需要融合多方數(shù)據(jù)建模的場(chǎng)景下，能夠保護(hù)各參與方的本地?cái)?shù)據(jù)和模型訓(xùn)練的中間結(jié)果等隱私數(shù)據(jù)不被泄露的聯(lián)合建模都可以稱為聯(lián)邦學(xué)習(xí)。

官术网_书友最值得收藏!

隱私計(jì)算：推進(jìn)數(shù)據(jù)“可用不可見”的關(guān)鍵技術(shù)

? 聯(lián)邦學(xué)習(xí)的起源