官术网_书友最值得收藏!

4.7 本章小結

本章著眼于正確處理缺失值的有用技術。在將數(shù)據(jù)輸入機器學習算法之前,必須確保對類別變量進行正確的編碼。本章還討論了如何將序數(shù)特征和標稱特征的值映射成整數(shù)。

此外,我們簡要討論了L1正則化,它可以通過降低模型的復雜性來避免過擬合。用序列特征選擇算法從數(shù)據(jù)集中選擇有意義的特征來去除不相關的特征。

在下一章中,我們將了解另外一種有用的降維方法:特征提取。它可以將特征壓縮到較低維的子空間,而不像特征選擇那樣需要完全去除特征。

主站蜘蛛池模板: 饶河县| 神池县| 佳木斯市| 思南县| 小金县| 遂平县| 尤溪县| 大厂| 修武县| 江孜县| 石阡县| 文昌市| 武陟县| 青州市| 刚察县| 舟山市| 浦县| 伊宁县| 宁晋县| 抚顺市| 德令哈市| 甘南县| 鹿邑县| 桃江县| 子长县| 通江县| 江北区| 广饶县| 乌拉特后旗| 汉寿县| 河北省| 张掖市| 济阳县| 兴和县| 皮山县| 海原县| 六盘水市| 江北区| 龙山县| 宁河县| 娄底市|