- 數據驅動的半導體制造系統調度
- 李莉 于青云 馬玉敏 喬非
- 7字
- 2021-12-24 13:32:25
3.2?數據規范化
3.2.1 數據規范化規則
數據規范化是指根據規則將數據集S的屬性數據進行縮放,使其落入特定區間。數據規范化可以消除不同屬性的量綱差異對數據分析結果的影響。實踐證明,對于采用反向傳播學習算法的多層感知機神經網絡,對訓練元組中度量每個屬性的輸入值進行規范化有助于加快學習速度;對于K均值聚類,數據規范化可以讓所有的屬性具有相同的權重。因此,數據規范化是數據分析的必要準備步驟。本節介紹兩種最常用的數據規范化方法[24],最大最小規范化和z?score規范化。
(1)最大最小規范化
x'li=(new_maxXi-new_minXi)+new_minXi(3?1)
其中,xli是變量Xi第l個觀測值,即數據集中第l條記錄的屬性i的取值;[minXi,maxXi]是隨機變量Xi在數據集S中的分布區間;[new_minXi,new_maxXi]是隨機變量Xi規范化后的分布區間。通常會把所有變量Xi歸一化在[0,1]區間內,以消除量綱的影響。
(2)z?score規范化
x'li=?(3?2)
其中,μXi是隨機變量Xi的平均值;σXi是隨機變量Xi的標準差。