官术网_书友最值得收藏!

3.2?數據規范化

3.2.1 數據規范化規則

數據規范化是指根據規則將數據集S的屬性數據進行縮放,使其落入特定區間。數據規范化可以消除不同屬性的量綱差異對數據分析結果的影響。實踐證明,對于采用反向傳播學習算法的多層感知機神經網絡,對訓練元組中度量每個屬性的輸入值進行規范化有助于加快學習速度;對于K均值聚類,數據規范化可以讓所有的屬性具有相同的權重。因此,數據規范化是數據分析的必要準備步驟。本節介紹兩種最常用的數據規范化方法[24],最大最小規范化和z?score規范化。

(1)最大最小規范化

x'li=(new_maxXi-new_minXi)+new_minXi(3?1)

其中,xli是變量Xi第l個觀測值,即數據集中第l條記錄的屬性i的取值;[minXi,maxXi]是隨機變量Xi在數據集S中的分布區間;[new_minXi,new_maxXi]是隨機變量Xi規范化后的分布區間。通常會把所有變量Xi歸一化在[0,1]區間內,以消除量綱的影響。

(2)z?score規范化

x'li=?(3?2)

其中,μXi是隨機變量Xi的平均值;σXi是隨機變量Xi的標準差。

主站蜘蛛池模板: 漾濞| 宁安市| 滕州市| 永善县| 苏尼特左旗| 新田县| 旌德县| 翁牛特旗| 麻栗坡县| 阜新市| 邵阳县| 廉江市| 泸西县| 离岛区| 霍邱县| 宾阳县| 定日县| 循化| 全州县| 绩溪县| 龙口市| 当涂县| 临桂县| 武平县| 灵丘县| 崇文区| 阿鲁科尔沁旗| 江都市| 湖南省| 浏阳市| 清水河县| 佳木斯市| 余干县| 教育| 湾仔区| 肇东市| 三河市| 永德县| 安义县| 库尔勒市| 榕江县|