- 聯邦學習實戰
- 楊強等
- 260字
- 2021-05-19 18:07:05
5.3 橫向數據集切分
為了模擬橫向聯邦建模的場景,首先在本地將乳腺癌數據集切分為特征相同的橫向聯邦形式,假設當前有兩方參與橫向聯邦訓練,如圖5-3所示。

圖5-3 兩方參與的橫向聯邦訓練
取乳腺癌數據集的前469條樣本作為訓練樣本數據,后100條數據作為測試數據,數據切分的策略如下。
? 訓練數據切分:將469條數據按行切分為兩份數據,選取其中前200條作為公司A的本地數據,保存為breast_1_train.csv,將剩余的269條數據作為公司B的本地數據,保存為breast_2_train.csv。
? 測試數據集:測試數據集不需要切分,兩個參與方使用相同的一份測試數據即可,文件命名為breast_eval.csv。數據分布如圖5-4所示。

圖5-4 橫向數據分布