- 數據隱私與數據治理:概念與技術
- 孟小峰等編著
- 1918字
- 2024-04-12 19:22:53
前言
2021年可以說是數據隱私與數據治理元年。社會各界都在覺醒,并探討其規范與解決方案,這與2006年我開始關注這個問題時的社會環境大不相同!
在數據隱私方面,《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》相繼出臺,全面、多領域構筑了我國信息與數據安全的法律保障,隱私問題不再是模糊不清的法外之地。在數據治理方面,《“十四五”數字經濟發展規劃》《互聯網信息服務算法推薦管理規定》分別關注了數據與算法中的治理問題。而繼《中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見》提出將數據納入生產要素后,中共中央網絡安全和信息化委員會辦公室更是在《“十四五”國家信息化規劃》中進一步提出“加強數據治理”。
緊隨國家的戰略導向,企業也在不斷嘗試。在數據隱私方面,小米等手機廠商突破性地在系統中內置攔截網和隱匿面具等隱私功能,為用戶隱私保駕護航。
如何將數據隱私與數據治理從法律文字落到實際應用仍不明晰,諸多問題依賴“行業自律”,而大多數企業僅聚焦于“合規”問題。社會各界都翹首以盼一套系統講述數據隱私與數據治理概念和技術的讀本!這正是本書關注的重點,以期對當下數據要素驅動下的數字經濟所面臨的數據挑戰給出基本的應對之策。
本書由筆者的團隊依據多年的研究編寫而成,旨在從概念和技術的角度對數據隱私與數據治理進行系統闡述,為學術研究機構、政府部門、企業等梳理數據隱私與數據治理的知識體系提供入口,為提高全民的數據素養提供輔導材料。同時,要厘清問題,解決問題,需要從提升大家的“數據素養”著手。數據素養未來可能是科學素養的重要組成部分,而數據素養首要的任務就是讓大家具備對數據與隱私的認識和處置能力。這也是促使我們編寫此書的直接動力!
本書從四個方面對數據隱私與數據治理進行了深入淺出的論述。
第一篇“基礎知識”,主要闡述數據隱私與治理的基礎概念與方法體系。該篇基于對數據發展主線的認識,揭示數據隱私和治理產生的根源,并結合當下應用現狀概述隱私的構成要素、管理框架、治理體系和治理實踐。其核心要點是針對數據要素和數字經濟,提出數據隱私要由被動保護變為主動防護,數據治理要由大數據全生命周期治理轉變為后大數據時代的數據生態治理,更好地服務數字經濟的發展。該篇內容盡可能減少晦澀的專業定理與描述,從多角度講解數據隱私與數據治理,既可以幫助相關專業的技術人員建立完善的隱私保護與數據治理體系,也可以供普通用戶閱讀以增加認知。
第二篇“大數據隱私保護技術”,主要闡述面向共享與發布的隱私保護技術。該篇重點介紹當下主流的隱私保護技術,包括云平臺場景下中心化的差分隱私技術,邊緣計算場景下本地化的差分隱私技術,以及為提高數據可用性的隱私放大理論、差分隱私與密碼學相結合的混合方法等。該篇內容較為專業翔實,具備前沿性,主要面向該方向的專業人員。
第三篇“人工智能隱私保護技術”,主要闡述面向機器學習模型的隱私保護技術。該篇重點介紹集中式機器學習和聯邦學習兩種場景下的隱私方法設計,包括機器學習中存在的因數據非法竊取導致的直接隱私泄露問題和因外部隱私攻擊導致的間接隱私泄露問題,以及為提高模型可用性的個性化差分隱私方法。該篇內容與機器學習密切相關,具備前沿性,主要面向該方向的專業人員。
第四篇“數據生態與數據治理”,主要闡述面向數據市場和數據生態的治理技術。該篇基于數據要素的發展理念,重點介紹數據市場中數據交易與數據流通治理體系,以及數據生態中數據壟斷、算法公平的治理方法。其核心要點是要建立數據透明的治理體系,實現對數據全鏈條、透明化的監督治理,做到治理的事前預警、事中防護、事后溯源,為數字經濟的發展保駕護航。該篇內容從全新的視角介紹數據作為生產要素在市場流通中會產生的諸多問題,探討其可能的解決方案,可供相關領域的專業人員、政務人員,以及普通用戶閱讀,幫助他們全面認識數據治理。
總之,本書梳理了數據隱私與數據治理的基本解決之道,并打破傳統的認知體系,實現觀念、技術、架構的轉變,即觀念上從數據生命周期觀到數據生態觀的轉變、技術上從隱私保護到隱私防護(管理)的轉變和架構上從溯源問責到數據透明的轉變,才能跟上形勢,從而保證數據要素在市場中發揮關鍵作用。希望本書為教育機構的人才培養和政府部門的管理提供有價值的參考資料,促進我國數字經濟的發展。
該書構思于2020年年初,筆者與團隊中的王雷霞、劉俊旭、范卓婭、葉青青、劉立新和李梓童一起,歷經數次編撰、修改,形成了當前的版本。筆者團隊盡可能將本書中所涉及的內容描述得清晰易懂,如有疑惑,可聯系筆者團隊進行交流。希望大家都能從本書中有所收獲,能更加清晰地看到生活中無處不在的隱私問題,亦能有所行動!
孟小峰
中國人民大學
2023年1月1日