- Python機器學習(原書第3版)
- (美)塞巴斯蒂安·拉施卡 瓦希德·米爾賈利利
- 211字
- 2021-06-11 16:13:48
4.7 本章小結
本章著眼于正確處理缺失值的有用技術。在將數(shù)據(jù)輸入機器學習算法之前,必須確保對類別變量進行正確的編碼。本章還討論了如何將序數(shù)特征和標稱特征的值映射成整數(shù)。
此外,我們簡要討論了L1正則化,它可以通過降低模型的復雜性來避免過擬合。用序列特征選擇算法從數(shù)據(jù)集中選擇有意義的特征來去除不相關的特征。
在下一章中,我們將了解另外一種有用的降維方法:特征提取。它可以將特征壓縮到較低維的子空間,而不像特征選擇那樣需要完全去除特征。