- 聯(lián)邦學(xué)習(xí)原理與應(yīng)用(全彩版)
- 向小佳等
- 653字
- 2022-05-06 18:47:16
2.3.2 聯(lián)邦特征工程
在非聯(lián)邦機(jī)制下,特征和目標(biāo)標(biāo)簽
都是存放在一處的,可以直接計(jì)算出
和Pearson相關(guān)系數(shù)。而在聯(lián)邦機(jī)制下,由于數(shù)據(jù)分布在不同的參與方且不同的參與方之間無法進(jìn)行直接的數(shù)據(jù)交換,完成特征工程就需要在基于隱私保護(hù)的前提下對(duì)數(shù)據(jù)進(jìn)行交換和計(jì)算。以聯(lián)邦
和
的計(jì)算為例,假設(shè)A方只有特征
,B方具有
和目標(biāo)標(biāo)簽
,且
。
首先,A方和B方需要進(jìn)行基于隱私保護(hù)的樣本id對(duì)齊,通常采用RSA公鑰加密算法和哈希機(jī)制進(jìn)行隱私保護(hù)。然后,在A方和B方都獲得共有樣本id后,就可以開始進(jìn)行聯(lián)邦和
的計(jì)算,通常采用的是Paillier半同態(tài)加密算法,附錄2中有關(guān)于該算法的詳細(xì)介紹,利用Paillier半同態(tài)加密算法就可以實(shí)現(xiàn)聯(lián)邦
和
的計(jì)算,計(jì)算過程如圖2-3-2所示。
在圖2-3-2中,B方對(duì)和
做同態(tài)加密,接著將加密結(jié)果傳給A方。A方將本地的特征分組,并在組中做密文求和,得到結(jié)果后將其傳給B方。B方將接收到的結(jié)果解密,算出A方每個(gè)特征的
和
。在整個(gè)過程中,A方對(duì)特征進(jìn)行編碼化,因此A方特征
的取值是自己獨(dú)立掌握的,沒有透露給B方。B方由于提供了目標(biāo)標(biāo)簽
,進(jìn)而獨(dú)立掌握相關(guān)統(tǒng)計(jì)量的計(jì)算結(jié)果。同時(shí),需要注意的一點(diǎn)是,B方對(duì)二分類的目標(biāo)標(biāo)簽進(jìn)行加密,需要有保護(hù)隱私性的機(jī)制,以免A方根據(jù)樣本分類的不平衡性猜測(cè)出密文對(duì)應(yīng)的明文標(biāo)簽。這里采用的Paillier半同態(tài)加密,在加密的過程中引入了隨機(jī)數(shù)機(jī)制,可以保證即使對(duì)同一個(gè)數(shù)據(jù),每次的加密結(jié)果也是不一致的。

圖2-3-2 基于Paillier半同態(tài)加密算法的聯(lián)邦和
計(jì)算過程
本節(jié)以WOE和IV的計(jì)算過程為例分別介紹了非聯(lián)邦環(huán)境和聯(lián)邦環(huán)境下特征工程的實(shí)現(xiàn)方式。在IV的輔助下,后續(xù)特征選擇過程可以順利進(jìn)行。
- 主權(quán)財(cái)富基金外國投資偏好研究
- 商業(yè)銀行投貸聯(lián)動(dòng)的風(fēng)險(xiǎn)管理研究
- 移動(dòng)金融:支付革命
- 估值:難點(diǎn)、解決方案及相關(guān)案例(原書第3版)
- “一帶一路”與跨國公司金融管理
- 短線獵手
- 新技術(shù) 新業(yè)態(tài):進(jìn)化中的監(jiān)管科技及其應(yīng)用
- 戰(zhàn)斗?戰(zhàn)役!中國信達(dá)資產(chǎn)管理公司資產(chǎn)管理案例精選
- 金錢傳奇:科斯托拉尼的投資哲學(xué)
- 積極型資產(chǎn)配置指南:經(jīng)濟(jì)周期分析與六階段投資時(shí)鐘
- 2020全國注冊(cè)咨詢工程師(投資)職業(yè)資格考試考點(diǎn)突破+歷年真題+押題試卷:現(xiàn)代咨詢方法與實(shí)務(wù)
- 基于實(shí)物期權(quán)的新技術(shù)投資評(píng)估與決策研究(管理新視野)
- 吳國平操盤手記:主力選股策略(第4版)
- 銀行的末日到了嗎
- 大智慧炒股軟件從入門到精通