- 數據隱私與數據治理:概念與技術
- 孟小峰等編著
- 878字
- 2024-04-12 19:22:57
2.2 數據隱私的定義與特征
在思考大數據隱私保護問題之前,我們首先需要了解數據隱私的特征。本節將從數據隱私的定義出發,說明數據隱私的三個基本特征,并進一步探討數據隱私和信息安全的區別。
2.2.1 數據隱私的定義
數據隱私指個人、機構等實體不希望被外界知曉的信息,如個人的薪資、醫療記錄等。圖2.1描述了與個人相關的隱私信息。在具體場景中,數據隱私的具體定義會隨著數據與數據擁有者的不同而發生改變。例如,保守的人會將社交關系視為隱私,而開放的人愿意披露自己的社交關系。
2.2.2 數據隱私的基本特征
基于上述數據隱私定義,可以發現數據隱私具有三個基本特征。
? 數據隱私的主體是個人或組織團體。
? 數據隱私的客體是個人信息或團體信息。
? 數據隱私的內容是主體不愿意泄露的事實或者行為。
此外,在大數據背景下,由于大數據具有大規模性、多樣性與高速性的獨有特征,數據隱私還具有邊界難以鑒定的特征。
2.2.3 數據隱私和信息安全的區別
2012年1月,奧巴馬在消費者隱私條例草案發布會上說:“目前比以往任何時候更需要隱私,大數據時代更加如此。”[1]先前有文獻從信息安全的角度闡述大數據管理問題[2],實際上,數據隱私和信息安全存在一定的區別。
1.二者定義的區別
數據隱私是指個人、組織機構等實體不愿意被外部知道的信息,比如,個人的行為模式、位置信息、興趣愛好、健康狀況、公司的財務狀況等,如圖2.1所示。數據隱私主要涉及數據的模糊性、隱私性、可用性。

圖2.1 與個人相關的隱私信息
信息安全是指信息及信息系統免受未經授權的訪問。未經授權的操作包括非法使用、披露、破壞、修改、記錄及銷毀等。信息安全主要涉及數據的機密性、完整性、可用性。
2.二者實施技術的區別
信息安全的實施技術包括訪問控制和密碼學;而數據隱私的實施技術包括模糊化、匿名化、差分隱私(differential privacy)以及加密等。雖然信息安全技術能夠保證基礎設施、通信與訪問過程數據的安全性,但是數據的隱私還有可能被泄露。例如,一個被授權的惡意用戶可以誤用Alice的數據并將其與其他數據融合,這些操作可能會泄露Alice的隱私。雖然數據隱私和信息安全存在以上區別,但是二者的最終目的是一致的,即數據能夠被私密地、安全地訪問和分析。