官术网_书友最值得收藏!

第4章 構建良好的訓練數據集——數據預處理

數據的質量及其所包含的有價值信息是決定機器學習算法優劣的關鍵。因此,在將數據集提供給機器學習算法之前,確保對數據集的檢查和預處理非常關鍵。本章將討論必要的數據預處理技術,以幫助建立良好的機器學習模型。

本章將主要涵蓋下述幾個方面:

  • 去除和填補數據集的缺失值。
  • 將分類數據轉換為適合機器學習算法的格式。
  • 為構造模型選擇相關的特征。
主站蜘蛛池模板: 崇州市| 陈巴尔虎旗| 洞头县| 高平市| 万盛区| 邮箱| 潮州市| 沧源| 鄂托克旗| 新余市| 德保县| 哈密市| 寿阳县| 深州市| 辽阳县| 神池县| 留坝县| 合山市| 白城市| 嘉峪关市| 丰顺县| 淮安市| 延安市| 来凤县| 馆陶县| 邻水| 延寿县| 玉林市| 永济市| 扶沟县| 武定县| 额尔古纳市| 元阳县| 洛扎县| 余江县| 华坪县| 固安县| 吴江市| 柞水县| 涿鹿县| 保靖县|