- 動手學差分隱私
- (美)約瑟夫·P.尼爾等
- 980字
- 2024-05-11 19:14:11
第1章 引言
這是一本面向程序員的差分隱私書籍。本書旨在介紹數(shù)據(jù)隱私保護領(lǐng)域所面臨的挑戰(zhàn),描述為解決這些挑戰(zhàn)而提出的技術(shù),并幫助讀者理解如何實現(xiàn)其中的一部分技術(shù)。
本書包含很多示例,也包含很多概念的具體實現(xiàn),這些示例和實現(xiàn)都是用可以實際運行的程序撰寫的。每一章都由一個獨立的Jupyter筆記本(Jupyter Notebook)文件生成。你可以在本書網(wǎng)站https://programming-dp.com單擊相應章節(jié)右上角的“下載”圖標并選擇“.ipynb”,從而下載此章的Jupyter筆記本文件,并親手執(zhí)行這些示例。章節(jié)中的很多示例都是用代碼生成的。為了便于閱讀,我們將這些代碼隱藏了起來。你可以在網(wǎng)站上通過單擊示例單元格下方的“點擊顯示”(Click to show)按鈕顯示隱藏在背后的代碼。
本書假定你可以使用Python語言編寫和運行程序,并掌握Pandas和NumPy的一些基本概念。如果你具有離散數(shù)學和概率論相關(guān)背景知識,那你會更加輕松地理解本書的內(nèi)容。不必擔心,本科課程所教授的離散數(shù)學和概率論知識對學習本書來說已經(jīng)綽綽有余了。
本書英文版已開源,可以從本書網(wǎng)站在線獲取本書的最新版本。你可以在GitHub(https://github.com.uvm-plaid/programming-dp)上獲取本書的源代碼。如果你找到一處筆誤、想要提出一處改進建議或報告一個程序錯誤,可以在GitHub上提交問題。
本書描述的技術(shù)是從數(shù)據(jù)隱私(data privacy)領(lǐng)域的研究中發(fā)展得來的。從本書的撰寫目的出發(fā),我們將按照下述方式定義數(shù)據(jù)隱私。
定義
數(shù)據(jù)隱私技術(shù)的目標是允許數(shù)據(jù)分析方獲取隱私數(shù)據(jù)中蘊含的趨勢,但不會泄露特定個體的信息。
這是一個寬泛的數(shù)據(jù)隱私定義,很多不同的技術(shù)都是圍繞這個定義提出的。但要特別注意的是,這一定義不包括保證安全性的技術(shù),如加密技術(shù)。加密數(shù)據(jù)不會泄露任何信息,因此加密技術(shù)不能滿足定義的前半部分要求。我們需要特別注意安全與隱私之間的差異:隱私技術(shù)涉及故意發(fā)布信息,并試圖控制從發(fā)布信息中學到什么。安全技術(shù)通常會阻止信息的泄露,并控制數(shù)據(jù)可以被誰訪問。本書主要涵蓋的是隱私技術(shù)。只有當安全對隱私有重要影響時,我們才會討論相應的安全技術(shù)。
本書主要聚焦于差分隱私(differential privacy)。我們將在前幾章概述本書聚焦差分隱私的部分原因:差分隱私(及其變體)是我們已知的唯一能從數(shù)學角度提供可證明隱私保護能力的方法。去標識化、聚合等技術(shù)是人們這十幾年來常用的隱私技術(shù)。這些技術(shù)近期已被證明無法抵御復雜的隱私攻擊。如k-匿名性等更先進的隱私技術(shù)也無法抵御特定的攻擊。因此,差分隱私正迅速成為隱私保護的黃金標準,這也是本書重點介紹的隱私技術(shù)。
- 信息安全導論(在線實驗+在線自測)
- Metasploit Penetration Testing Cookbook(Second Edition)
- Penetration Testing with Perl
- 計算機病毒原理與防范(第2版)
- Preventing Digital Extortion
- 軟件開發(fā)安全之道:概念、設(shè)計與實施
- Applied Network Security
- 情報驅(qū)動應急響應
- 華為防火墻實戰(zhàn)指南
- 持續(xù)集成:軟件質(zhì)量改進和風險降低之道
- 網(wǎng)絡(luò)空間安全導論
- 網(wǎng)絡(luò)攻防實戰(zhàn)研究:MySQL數(shù)據(jù)庫安全
- Learn Azure Sentinel
- 密碼朋克:自由與互聯(lián)網(wǎng)的未來
- 一本書講透混合云安全