前言
隨著算法、算力的不斷提升,以及企業不斷累積的海量業務數據,人工智能正在廣泛地影響著各行各業,給人們的生活帶來便捷,比如自動駕駛、醫療輔助診斷和智能制造等。然而數據驅動的人工智能既推動著生產力的發展,也帶來了隱私泄露等方面的隱患。很多大數據公司被曝光會非法收集用戶的數據并出售用戶隱私數據牟利。越來越多的人正在倡導踐行負責任的人工智能技術(Responsible AI),保證人工智能技術的公平性、可解釋性與隱私保護性。聯邦學習正是在此背景之下發展的一項技術,主要從避免收集數據的角度出發,研究在分布式環境下全局模型的計算。與一般的分布式機器學習不同,聯邦學習對各計算節點的控制權不同,計算節點對數據擁有絕對控制權,且節點的穩定性不同、不同節點上的數據特征分布也不同。這就帶來了比一般分布式機器學習更復雜的系統層級優化挑戰。
由于不同計算節點無須分享數據,聯邦學習適用于對數據隱私敏感的系統與行業,如醫療、金融風控、智慧城市等。在這些場景中,由于商業風險、道德與法規的約束,使得這些領域的數據很難被收集到本組織以外的地方。聯邦學習的開發將打破數據壁壘,實現不同組織、不同類型數據之間的隱私保護之下的價值挖掘。
此外,中共中央、國務院2020年也發布了《關于構建更加完善的要素市場化配置體制機制的意見》,首次正式將數據視為一種新型生產要素,與傳統的土地、勞動力、資本等要素并列,并提出加快培育數據要素市場、加強企業間數據合作共贏、共同提升社會數據的資源價值。聯邦學習預計將在數據隱私與安全計算、數據價值流轉中發揮巨大的作用。
本書內容安排如下:第1章介紹聯邦學習的基礎知識,包括提出與發展的背景,從技術角度來講解其定義、分類與挑戰,以及相關的法律與社區。此外,為了方便人工智能的初學者更好地理解后面的內容,還介紹了機器學習與深度學習基礎知識。第2章介紹了現有的一些聯邦學習框架,包括其安裝與部署,并且比較了不同系統的特性,給出了使用建議。第3章深入聯邦學習技術本身,討論其主要技術,包括橫向聯邦學習、縱向聯邦學習與分割學習。第4章介紹了聯邦學習建模難點與解決方案,對應于第1章提到的性能與效率挑戰。第5章介紹了主流的隱私保護技術,這些技術可以與聯邦學習技術互為補充。第6章介紹了聯邦學習系統安全與防御算法,這是當前聯邦學習研究的熱點。第7章在計算機視覺方向進行聯邦學習實戰。第8章介紹了聯邦學習與推薦系統的相關知識。之前主要討論的學習模式是監督學習,第9章介紹了聯邦學習系統與其他深度學習模式的結合(比如多任務學習、半監督學習、強化學習、聯邦圖學習等)。第10章介紹了聯邦學習在不同行業的前景(如醫療、金融、邊緣計算、物聯網、區塊鏈等)。
本書的特色與優勢在于:第一,本書的作者是扎根于聯邦學習前沿的研究者和從業者;第二,我們參考了近兩年全新的文章和綜述,緊跟學術和業界動態。第三,我們對聯邦學習性能挑戰、安全與隱私挑戰,以及推薦系統進行了介紹。在本書的編寫過程中,我們深深地感受到聯邦學習及其相關領域技術的繁多冗雜,因此書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正。
作者
- 數據恢復方法及案例分析
- 數字身份與元宇宙信任治理
- Metasploit Penetration Testing Cookbook(Second Edition)
- API安全實戰
- 暗戰亮劍:黑客滲透與防御全程實錄
- 走進新安全:讀懂網絡安全威脅、技術與新思想
- API安全技術與實戰
- 信息安全導論(第2版)
- 解密數據恢復
- 博弈論與數據安全
- 網絡服務安全與監控
- Mastering Linux Security and Hardening
- 云計算安全:關鍵技術、原理及應用
- Securing Network Infrastructure
- CPK通向賽博安全之路:理論與實踐CPK Solution to Cyber Security:Theory and Practice