書名: 大模型RAG實戰(zhàn):RAG原理、應(yīng)用與系統(tǒng)構(gòu)建作者名: 汪鵬 谷清水 卞龍鵬本章字?jǐn)?shù): 252字更新時間: 2024-10-29 18:53:31
1.2.3 大模型的數(shù)據(jù)泄露問題
早在2020年,谷歌的科學(xué)家就進行了一項關(guān)于從大模型中挖掘隱私問題的研究——“Extracting Training Data from Large Language Models”。在這項研究中,他們以GPT-2為例探討了如何通過數(shù)據(jù)提取攻擊大模型,獲取電話、身份信息、電子郵件地址等敏感數(shù)據(jù)。如圖1-5所示,通過一定的查詢引導(dǎo),可以讓模型泄露出訓(xùn)練數(shù)據(jù)中的敏感信息。

圖1-5 通過提示詞誘導(dǎo)GPT-2輸出隱私信息
然而,在使用RAG系統(tǒng)之后,由于模型組織答案所用到的知識來源于預(yù)先提供的知識庫信息,利用個人私有數(shù)據(jù)不僅可以使模型的答案更具個性化,還能讓整個系統(tǒng)變得更加安全,降低被誘導(dǎo)輸出敏感信息的風(fēng)險。
推薦閱讀
- Kali Linux Web Penetration Testing Cookbook
- Python數(shù)據(jù)分析入門與實戰(zhàn)
- Hadoop+Spark大數(shù)據(jù)分析實戰(zhàn)
- Spring Cloud、Nginx高并發(fā)核心編程
- 零基礎(chǔ)學(xué)Java(第4版)
- YARN Essentials
- Python機器學(xué)習(xí)實戰(zhàn)
- Learning ELK Stack
- Getting Started with Laravel 4
- Mastering Android Development with Kotlin
- PySpark Cookbook
- 好好學(xué)Java:從零基礎(chǔ)到項目實戰(zhàn)
- C# and .NET Core Test Driven Development
- 超簡單:用Python讓Excel飛起來(實戰(zhàn)150例)
- 例說FPGA:可直接用于工程項目的第一手經(jīng)驗