官术网_书友最值得收藏!

3.2?數據規范化

3.2.1 數據規范化規則

數據規范化是指根據規則將數據集S的屬性數據進行縮放,使其落入特定區間。數據規范化可以消除不同屬性的量綱差異對數據分析結果的影響。實踐證明,對于采用反向傳播學習算法的多層感知機神經網絡,對訓練元組中度量每個屬性的輸入值進行規范化有助于加快學習速度;對于K均值聚類,數據規范化可以讓所有的屬性具有相同的權重。因此,數據規范化是數據分析的必要準備步驟。本節介紹兩種最常用的數據規范化方法[24],最大最小規范化和z?score規范化。

(1)最大最小規范化

x'li=(new_maxXi-new_minXi)+new_minXi(3?1)

其中,xli是變量Xi第l個觀測值,即數據集中第l條記錄的屬性i的取值;[minXi,maxXi]是隨機變量Xi在數據集S中的分布區間;[new_minXi,new_maxXi]是隨機變量Xi規范化后的分布區間。通常會把所有變量Xi歸一化在[0,1]區間內,以消除量綱的影響。

(2)z?score規范化

x'li=?(3?2)

其中,μXi是隨機變量Xi的平均值;σXi是隨機變量Xi的標準差。

主站蜘蛛池模板: 东宁县| 乳山市| 甘洛县| 普宁市| 潮州市| 东阳市| 福州市| 璧山县| 温州市| 浠水县| 兴义市| 温宿县| 蕲春县| 成武县| 和顺县| 调兵山市| 泽州县| 集贤县| 大城县| 遂宁市| 安新县| 庆元县| 定陶县| 泉州市| 伊通| 儋州市| 宁河县| 宁南县| 吴江市| 沐川县| 阿坝| 张家口市| 确山县| 汝州市| 大港区| 望江县| 息烽县| 紫阳县| 临武县| 荥经县| 天长市|