官术网_书友最值得收藏!

3.2?數據規范化

3.2.1 數據規范化規則

數據規范化是指根據規則將數據集S的屬性數據進行縮放,使其落入特定區間。數據規范化可以消除不同屬性的量綱差異對數據分析結果的影響。實踐證明,對于采用反向傳播學習算法的多層感知機神經網絡,對訓練元組中度量每個屬性的輸入值進行規范化有助于加快學習速度;對于K均值聚類,數據規范化可以讓所有的屬性具有相同的權重。因此,數據規范化是數據分析的必要準備步驟。本節介紹兩種最常用的數據規范化方法[24],最大最小規范化和z?score規范化。

(1)最大最小規范化

x'li=(new_maxXi-new_minXi)+new_minXi(3?1)

其中,xli是變量Xi第l個觀測值,即數據集中第l條記錄的屬性i的取值;[minXi,maxXi]是隨機變量Xi在數據集S中的分布區間;[new_minXi,new_maxXi]是隨機變量Xi規范化后的分布區間。通常會把所有變量Xi歸一化在[0,1]區間內,以消除量綱的影響。

(2)z?score規范化

x'li=?(3?2)

其中,μXi是隨機變量Xi的平均值;σXi是隨機變量Xi的標準差。

主站蜘蛛池模板: 沅陵县| 迁安市| 邵阳市| 茶陵县| 太保市| 泗水县| 甘泉县| 周宁县| 水富县| 郧西县| 葵青区| 南阳市| 鄂托克旗| 百色市| 长汀县| 司法| 上蔡县| 桦川县| 山西省| 甘南县| 万宁市| 天全县| 满城县| 临沭县| 南平市| 维西| 大港区| 安庆市| 郸城县| 灯塔市| 怀宁县| 柘荣县| 定西市| 内乡县| 宝坻区| 囊谦县| 织金县| 安仁县| 锡林郭勒盟| 云霄县| 仲巴县|