官术网_书友最值得收藏!

3.1 選擇分類算法

每種算法都是基于某些假設的而且都有各自的特點,為特定問題選擇合適的分類算法需要實踐經驗。David·H. Wolpert提出的天下沒有免費午餐的定理,明確說明不存在適合所有可能場景的分類算法[1]。在實踐中,因為樣本特征的數量、數據中的噪聲以及是否線性可分等各種情況有所不同,所以我們建議至少要比較幾種不同學習算法的性能,以選擇適合特定問題的最佳模型。

分類器的計算性能以及預測能力,最終在很大程度上取決于可供學習的基礎數據。可以把監督機器學習算法訓練的五個主要步驟概括如下:

1)選擇特征并收集訓練樣本。

2)選擇度量性能的指標。

3)選擇分類器并優化算法。

4)評估模型的性能。

5)調整算法。

本書所采用的方法是逐步構建機器學習知識,本章將主要聚焦在不同算法的主要概念上面,并回顧諸如特征選擇、預處理、性能指標和超參數調優等主題,我們將在本書的后半部分對此進行更為詳細的討論。

主站蜘蛛池模板: 灵台县| 昭觉县| 盐城市| 嘉鱼县| 丰都县| 新干县| 瓦房店市| 安国市| 阆中市| 监利县| 长治县| 贵德县| 九台市| 罗源县| 定陶县| 恩施市| 永靖县| 邵东县| 吉木萨尔县| 宝应县| 贵南县| 方正县| 茌平县| 丰城市| 汨罗市| 桑植县| 罗定市| 嘉祥县| 泊头市| 平谷区| 仪征市| 如东县| 雷山县| 类乌齐县| 南城县| 夏津县| 诏安县| 桐乡市| 临澧县| 桦南县| 来安县|