官术网_书友最值得收藏!

2.1 關(guān)聯(lián)攻擊

假設(shè)我們想從剛剛得到的去標(biāo)識數(shù)據(jù)中獲取某個(gè)朋友的收入信息。去標(biāo)識數(shù)據(jù)中的姓名一列已經(jīng)被移除了,但我們碰巧知道能幫助標(biāo)識出這位朋友的一些輔助數(shù)據(jù)。我們的這位朋友叫Karrie Trusslove,我們知道Karrie的出生日期和郵政編碼。

我們嘗試攻擊的數(shù)據(jù)集與我們知道的一些輔助信息之間存在一些重疊列,可以應(yīng)用這些重疊列來實(shí)施一次簡單的關(guān)聯(lián)攻擊(linkage attack)。在本例中,兩個(gè)數(shù)據(jù)集都包含出生日期和郵政編碼列。我們在嘗試攻擊的數(shù)據(jù)集中查找出與Karrie的出生日期和郵政編碼匹配的行。數(shù)據(jù)庫領(lǐng)域?qū)⒋祟惼ヅ洳僮鞣Q為關(guān)聯(lián)(join)兩個(gè)數(shù)據(jù)表。我們可以使用Pandas的merge函數(shù)實(shí)現(xiàn)此操作。如果只能檢索到唯一一行數(shù)據(jù),我們就從嘗試攻擊的數(shù)據(jù)集中找到了Karrie所屬的行。

我們確實(shí)只找到了一行匹配的數(shù)據(jù)。通過使用輔助數(shù)據(jù),可以在去標(biāo)識數(shù)據(jù)集中重標(biāo)識出一個(gè)個(gè)體。我們可以根據(jù)重標(biāo)識攻擊結(jié)果進(jìn)一步推斷出Karrie的收入小于5萬美元。

主站蜘蛛池模板: 宝丰县| 佛坪县| 西平县| 徐汇区| 三门峡市| 万源市| 佛坪县| 定结县| 大渡口区| 万全县| 平江县| 双牌县| 龙山县| 慈利县| 临海市| 辽中县| 克什克腾旗| 莱州市| 桃江县| 昌邑市| 五常市| 林西县| 北宁市| 拜泉县| 清涧县| 乐平市| 迁西县| 松潘县| 新邵县| 遵化市| 宜春市| 藁城市| 曲水县| 安阳市| 盐边县| 武安市| 昌邑市| 威信县| 革吉县| 全椒县| 昭通市|