書名：動手學差分隱私
作者名： (美)約瑟夫·P.尼爾等
本章字數(shù)： 980字
更新時間： 2024-05-11 19:14:11

第1章引言

這是一本面向程序員的差分隱私書籍。本書旨在介紹數(shù)據(jù)隱私保護領(lǐng)域所面臨的挑戰(zhàn)，描述為解決這些挑戰(zhàn)而提出的技術(shù)，并幫助讀者理解如何實現(xiàn)其中的一部分技術(shù)。

本書包含很多示例，也包含很多概念的具體實現(xiàn)，這些示例和實現(xiàn)都是用可以實際運行的程序撰寫的。每一章都由一個獨立的Jupyter筆記本（Jupyter Notebook）文件生成。你可以在本書網(wǎng)站https://programming-dp.com單擊相應章節(jié)右上角的“下載”圖標并選擇“.ipynb”，從而下載此章的Jupyter筆記本文件，并親手執(zhí)行這些示例。章節(jié)中的很多示例都是用代碼生成的。為了便于閱讀，我們將這些代碼隱藏了起來。你可以在網(wǎng)站上通過單擊示例單元格下方的“點擊顯示”（Click to show）按鈕顯示隱藏在背后的代碼。

本書假定你可以使用Python語言編寫和運行程序，并掌握Pandas和NumPy的一些基本概念。如果你具有離散數(shù)學和概率論相關(guān)背景知識，那你會更加輕松地理解本書的內(nèi)容。不必擔心，本科課程所教授的離散數(shù)學和概率論知識對學習本書來說已經(jīng)綽綽有余了。

本書英文版已開源，可以從本書網(wǎng)站在線獲取本書的最新版本。你可以在GitHub（https://github.com.uvm-plaid/programming-dp）上獲取本書的源代碼。如果你找到一處筆誤、想要提出一處改進建議或報告一個程序錯誤，可以在GitHub上提交問題。

本書描述的技術(shù)是從數(shù)據(jù)隱私（data privacy）領(lǐng)域的研究中發(fā)展得來的。從本書的撰寫目的出發(fā)，我們將按照下述方式定義數(shù)據(jù)隱私。

定義

數(shù)據(jù)隱私技術(shù)的目標是允許數(shù)據(jù)分析方獲取隱私數(shù)據(jù)中蘊含的趨勢，但不會泄露特定個體的信息。

這是一個寬泛的數(shù)據(jù)隱私定義，很多不同的技術(shù)都是圍繞這個定義提出的。但要特別注意的是，這一定義不包括保證安全性的技術(shù)，如加密技術(shù)。加密數(shù)據(jù)不會泄露任何信息，因此加密技術(shù)不能滿足定義的前半部分要求。我們需要特別注意安全與隱私之間的差異：隱私技術(shù)涉及故意發(fā)布信息，并試圖控制從發(fā)布信息中學到什么。安全技術(shù)通常會阻止信息的泄露，并控制數(shù)據(jù)可以被誰訪問。本書主要涵蓋的是隱私技術(shù)。只有當安全對隱私有重要影響時，我們才會討論相應的安全技術(shù)。

本書主要聚焦于差分隱私（differential privacy）。我們將在前幾章概述本書聚焦差分隱私的部分原因：差分隱私（及其變體）是我們已知的唯一能從數(shù)學角度提供可證明隱私保護能力的方法。去標識化、聚合等技術(shù)是人們這十幾年來常用的隱私技術(shù)。這些技術(shù)近期已被證明無法抵御復雜的隱私攻擊。如k-匿名性等更先進的隱私技術(shù)也無法抵御特定的攻擊。因此，差分隱私正迅速成為隱私保護的黃金標準，這也是本書重點介紹的隱私技術(shù)。

官术网_书友最值得收藏!

動手學差分隱私

第1章 引言

第1章引言