官术网_书友最值得收藏!

  • 聯邦學習實戰
  • 楊強等
  • 260字
  • 2021-05-19 18:07:05

5.3 橫向數據集切分

為了模擬橫向聯邦建模的場景,首先在本地將乳腺癌數據集切分為特征相同的橫向聯邦形式,假設當前有兩方參與橫向聯邦訓練,如圖5-3所示。

圖5-3 兩方參與的橫向聯邦訓練

取乳腺癌數據集的前469條樣本作為訓練樣本數據,后100條數據作為測試數據,數據切分的策略如下。

? 訓練數據切分:將469條數據按行切分為兩份數據,選取其中前200條作為公司A的本地數據,保存為breast_1_train.csv,將剩余的269條數據作為公司B的本地數據,保存為breast_2_train.csv。

? 測試數據集:測試數據集不需要切分,兩個參與方使用相同的一份測試數據即可,文件命名為breast_eval.csv。數據分布如圖5-4所示。

圖5-4 橫向數據分布

主站蜘蛛池模板: 正镶白旗| 宁武县| 肥城市| 垦利县| 泾源县| 东辽县| 通城县| 雷山县| 精河县| 明溪县| 改则县| 九龙城区| 泸溪县| 广宁县| 广元市| 襄汾县| 闵行区| 龙泉市| 闽清县| 义马市| 民县| 阳山县| 进贤县| 咸阳市| 黄陵县| 唐河县| 龙江县| 阳曲县| 固阳县| 庄河市| 精河县| 翁源县| 昔阳县| 灌阳县| 商河县| 沙田区| 大埔县| 成安县| 兴安盟| 武定县| 浦城县|