官术网_书友最值得收藏!

1.1 背景

2017年5月,《經(jīng)濟學人》(The Economist)發(fā)表封面文章,將數(shù)據(jù)比作“這個時代最寶貴的資源”[1]?;ヂ?lián)網(wǎng)時代,一切基于數(shù)據(jù)。人們在日常生活的各個環(huán)節(jié)中,無時無刻不在產(chǎn)生數(shù)據(jù),同時也在消費數(shù)據(jù)。隨著人工智能的興起,數(shù)據(jù)的巨大價值被前所未有地發(fā)掘出來。2019年9月,在杭州召開的云棲大會上,阿里巴巴董事局主席張勇表示:“如果說大數(shù)據(jù)是石油,算力就是發(fā)動機,它們共同構(gòu)成面向數(shù)字經(jīng)濟時代的核心能力?!碑斆β档陌最I(lǐng)在午間打開外賣App,挑選著平臺推薦的美食的時候,當辛苦經(jīng)營的小商戶通過網(wǎng)上銀行,享受著安全快捷便利的金融服務(wù)的時候,當出租車司機根據(jù)導(dǎo)航軟件挑選最優(yōu)駕駛路線的時候,大數(shù)據(jù)和人工智能都在這些場景的背后起到了關(guān)鍵的作用。

隨著大數(shù)據(jù)與人工智能全面和深入的發(fā)展,數(shù)據(jù)孤島成為一個橫亙在前進道路上的巨大障礙。例如,當一個醫(yī)學研究者試圖通過人工智能的方式來攻克一個疑難雜癥的智能診療方案時,他需要大量的詳盡的該病癥的病例信息,但是這些信息散落在各個醫(yī)院和醫(yī)療機構(gòu)之中,由于該病癥的稀有性,任何一家醫(yī)院或者機構(gòu)都無法憑借自身的數(shù)據(jù)單獨完成該項工作的研究。很顯然,如果各家醫(yī)院可以打破數(shù)據(jù)孤島,共享數(shù)據(jù),共同來完成這項研究,將是該病癥患者的一大福音。除此之外,數(shù)據(jù)共享還擴大了訓(xùn)練樣本的規(guī)模,提高了人工智能模型的預(yù)測準確度和泛化能力,從而達到“1+1>2”的效果??傊?,多方之間的數(shù)據(jù)共享已經(jīng)成為使得數(shù)據(jù)價值能夠得到更加充分發(fā)揮的至關(guān)重要的一環(huán)。

然而,越來越多的事實表明,數(shù)據(jù)共享在產(chǎn)生巨大經(jīng)濟價值與社會價值的同時,也帶來了個人隱私泄露與數(shù)據(jù)濫用等巨大的風險。信息時代,個人信息泄露事件時有發(fā)生:2006年,美國在線(American Online,AOL)公開了包括65萬用戶數(shù)據(jù)的匿名搜索記錄以用于學術(shù)研究。雖然出于保護用戶隱私的需要,該公司在公布數(shù)據(jù)時將用戶的姓名替換成了匿名ID,但是后續(xù)研究發(fā)現(xiàn),事實上,無須用戶姓名也能通過搜索關(guān)鍵字將匿名ID匹配到真實用戶。最終,AOL為此受到起訴并付出了高達500萬美元的賠償;2018年3月,英美媒體曝出美國社交媒體臉書(Facebook)多達5000萬用戶信息泄露;2019年12月,Elastic-search數(shù)據(jù)庫泄露,包括27億個電子郵件地址,其中10億個密碼都是以簡單的明文存儲的;2020年2月,美高梅公司超過1060萬酒店客人的個人信息泄露,包括客人的姓名、家庭地址、電話號碼、電子郵件和出生日期等。這些隱私泄露的惡性事件在給受害者本身造成傷害的同時,也引發(fā)了普通民眾對于信息社會中個人數(shù)據(jù)安全的擔憂。從長遠來看,對于數(shù)據(jù)隱私的保護不但使人們應(yīng)有的隱私權(quán)益免受侵害,也有利于整個大數(shù)據(jù)和人工智能行業(yè)的健康平穩(wěn)發(fā)展。

因此,如何在保護隱私的情況下,進行數(shù)據(jù)共享,完成多方聯(lián)合智能計算,成為當前學術(shù)界與工業(yè)界的熱門課題。我們把在有多方參與且各方互相不信任的場景下,能夠聚合多方信息,并保護數(shù)據(jù)隱私的智能計算范式,稱為隱私保護機器學習??晒蚕砼c安全性是隱私保護機器學習的重要特點。

主站蜘蛛池模板: 托里县| 容城县| 密山市| 石楼县| 焦作市| 嘉鱼县| 息烽县| 四川省| 寿宁县| 姜堰市| 上高县| 辉县市| 铜梁县| 新宁县| 宾阳县| 威海市| 民权县| 土默特左旗| 安溪县| 平潭县| 万全县| 墨竹工卡县| 广东省| 内江市| 怀集县| 赤峰市| 罗平县| 淮安市| 石棉县| 湖南省| 桃园市| 湖州市| 从江县| 文成县| 衡山县| 青神县| 平果县| 南华县| 饶平县| 绵阳市| 融水|