官术网_书友最值得收藏!

第2章 去標識

去標識(de-identification)是指從數據集中刪除標識信息的過程。有時會將去標識這一術語與匿名(anonymization)和假名(pseudonymization)這兩個術語看作同義詞,表達相同的概念。

學習目標

閱讀本章后,你將能夠:

●定義并理解下述概念。

■去標識。

■重標識。

■標識信息/個人標識信息。

■關聯攻擊。

■聚合與聚合統計。

■差分攻擊。

●實施一次關聯攻擊。

●實施一次差分攻擊。

●理解去標識技術的局限性。

●理解聚合統計的局限性。

我們尚不能嚴謹地定義什么是標識信息。通常將標識信息理解為在日常生活中可以唯一標識我們自己的信息。從這個理解角度看,姓名、地址、電話號碼、電子郵箱等都屬于標識信息。稍后將會了解到,不可能為標識信息給出嚴謹的定義,因為所有信息都可以用來標識個體。一般來說,個人標識信息(Personally Identifiable Information,PII)和標識信息這兩個術語是同義詞,表達相同的概念。

如何才能對信息去標識?很簡單,直接移除包含標識信息的列就可以了。

我們將數據中一部分個體的標識信息保留下來,隨后將把這些保留的標識信息作為輔助數據(auxiliary data)來實施一次重標識(re-identification)攻擊。

主站蜘蛛池模板: 新龙县| 东城区| 南陵县| 寻乌县| 讷河市| 康保县| 永靖县| 延川县| 合川市| 普兰店市| 谷城县| 南投市| 滦南县| 新蔡县| 周口市| 平陆县| 竹北市| 屏山县| 怀远县| 大荔县| 贵溪市| 公主岭市| 虎林市| 塔城市| 夏河县| 青浦区| 浮山县| 乐昌市| 祁阳县| 南部县| 石家庄市| 哈尔滨市| 西峡县| 雷波县| 原平市| 霍林郭勒市| 紫金县| 芦溪县| 叙永县| 永年县| 怀安县|