- 動手學差分隱私
- (美)約瑟夫·P.尼爾等
- 438字
- 2024-05-11 19:14:12
第2章 去標識
去標識(de-identification)是指從數據集中刪除標識信息的過程。有時會將去標識這一術語與匿名(anonymization)和假名(pseudonymization)這兩個術語看作同義詞,表達相同的概念。
學習目標
閱讀本章后,你將能夠:
●定義并理解下述概念。
■去標識。
■重標識。
■標識信息/個人標識信息。
■關聯攻擊。
■聚合與聚合統計。
■差分攻擊。
●實施一次關聯攻擊。
●實施一次差分攻擊。
●理解去標識技術的局限性。
●理解聚合統計的局限性。
我們尚不能嚴謹地定義什么是標識信息。通常將標識信息理解為在日常生活中可以唯一標識我們自己的信息。從這個理解角度看,姓名、地址、電話號碼、電子郵箱等都屬于標識信息。稍后將會了解到,不可能為標識信息給出嚴謹的定義,因為所有信息都可以用來標識個體。一般來說,個人標識信息(Personally Identifiable Information,PII)和標識信息這兩個術語是同義詞,表達相同的概念。
如何才能對信息去標識?很簡單,直接移除包含標識信息的列就可以了。

我們將數據中一部分個體的標識信息保留下來,隨后將把這些保留的標識信息作為輔助數據(auxiliary data)來實施一次重標識(re-identification)攻擊。
推薦閱讀
- 計算機網絡安全技術(第6版·慕課版)
- Kali Linux Social Engineering
- 工業物聯網安全
- 數字化轉型浪潮下的數據安全最佳實踐指南
- 防火墻技術與應用(第2版)
- 人工智能安全(精裝版)
- VMware vCloud Security
- Mastering Linux Security and Hardening
- 網絡空間安全導論
- Hands-On Artificial Intelligence for Cybersecurity
- 網絡空間安全法律問題研究
- Instant OSSEC Host-based Intrusion Detection System
- 5G網絡安全規劃與實踐
- BeagleBone for Secret Agents
- Blockchain Development with Hyperledger