官术网_书友最值得收藏!

  • 動手學差分隱私
  • (美)約瑟夫·P.尼爾等
  • 980字
  • 2024-05-11 19:14:11

第1章 引言

這是一本面向程序員的差分隱私書籍。本書旨在介紹數(shù)據(jù)隱私保護領(lǐng)域所面臨的挑戰(zhàn),描述為解決這些挑戰(zhàn)而提出的技術(shù),并幫助讀者理解如何實現(xiàn)其中的一部分技術(shù)。

本書包含很多示例,也包含很多概念的具體實現(xiàn),這些示例和實現(xiàn)都是用可以實際運行的程序撰寫的。每一章都由一個獨立的Jupyter筆記本(Jupyter Notebook)文件生成。你可以在本書網(wǎng)站https://programming-dp.com單擊相應章節(jié)右上角的“下載”圖標并選擇“.ipynb”,從而下載此章的Jupyter筆記本文件,并親手執(zhí)行這些示例。章節(jié)中的很多示例都是用代碼生成的。為了便于閱讀,我們將這些代碼隱藏了起來。你可以在網(wǎng)站上通過單擊示例單元格下方的“點擊顯示”(Click to show)按鈕顯示隱藏在背后的代碼。

本書假定你可以使用Python語言編寫和運行程序,并掌握Pandas和NumPy的一些基本概念。如果你具有離散數(shù)學和概率論相關(guān)背景知識,那你會更加輕松地理解本書的內(nèi)容。不必擔心,本科課程所教授的離散數(shù)學和概率論知識對學習本書來說已經(jīng)綽綽有余了。

本書英文版已開源,可以從本書網(wǎng)站在線獲取本書的最新版本。你可以在GitHub(https://github.com.uvm-plaid/programming-dp)上獲取本書的源代碼。如果你找到一處筆誤、想要提出一處改進建議或報告一個程序錯誤,可以在GitHub上提交問題。

本書描述的技術(shù)是從數(shù)據(jù)隱私(data privacy)領(lǐng)域的研究中發(fā)展得來的。從本書的撰寫目的出發(fā),我們將按照下述方式定義數(shù)據(jù)隱私。

定義

數(shù)據(jù)隱私技術(shù)的目標是允許數(shù)據(jù)分析方獲取隱私數(shù)據(jù)中蘊含的趨勢,但不會泄露特定個體的信息。

這是一個寬泛的數(shù)據(jù)隱私定義,很多不同的技術(shù)都是圍繞這個定義提出的。但要特別注意的是,這一定義不包括保證安全性的技術(shù),如加密技術(shù)。加密數(shù)據(jù)不會泄露任何信息,因此加密技術(shù)不能滿足定義的前半部分要求。我們需要特別注意安全與隱私之間的差異:隱私技術(shù)涉及故意發(fā)布信息,并試圖控制從發(fā)布信息中學到什么。安全技術(shù)通常會阻止信息的泄露,并控制數(shù)據(jù)可以被誰訪問。本書主要涵蓋的是隱私技術(shù)。只有當安全對隱私有重要影響時,我們才會討論相應的安全技術(shù)。

本書主要聚焦于差分隱私(differential privacy)。我們將在前幾章概述本書聚焦差分隱私的部分原因:差分隱私(及其變體)是我們已知的唯一能從數(shù)學角度提供可證明隱私保護能力的方法。去標識化、聚合等技術(shù)是人們這十幾年來常用的隱私技術(shù)。這些技術(shù)近期已被證明無法抵御復雜的隱私攻擊。如k-匿名性等更先進的隱私技術(shù)也無法抵御特定的攻擊。因此,差分隱私正迅速成為隱私保護的黃金標準,這也是本書重點介紹的隱私技術(shù)。

主站蜘蛛池模板: 连云港市| 那曲县| 雅江县| 古田县| 团风县| 区。| 西峡县| 旬邑县| 垣曲县| 华安县| 临颍县| 夏邑县| 嘉兴市| 厦门市| 那坡县| 微山县| 当阳市| 富顺县| 浦北县| 余干县| 武隆县| 永修县| 玉屏| 淳化县| 汉川市| 海宁市| 拉萨市| 毕节市| 青岛市| 汶上县| 阿合奇县| 凤山县| 景宁| 琼海市| 历史| 潮州市| 承德市| 深圳市| 哈巴河县| 土默特左旗| 临潭县|