电子游戏猛龙传奇

書名： Python機器學習（原書第3版）
作者名： (美)塞巴斯蒂安·拉施卡瓦希德·米爾賈利利
本章字數： 470字
更新時間： 2021-06-11 16:13:44

3.8　本章小結

本章學習了許多不同的用于解決線性和非線性問題的機器學習算法。如果關心可解釋性，決策樹就特別有吸引力。邏輯回歸不僅是一種有用的在線隨機梯度下降模型，而且還可以預測特定事件的概率。

雖然支持向量機是一種強大的線性模型，而且可以通過核技巧擴展到非線性問題，但必須調整許多參數才能做好預測。相比之下，像隨機森林這樣的集成方法不需要調整太多參數，而且不像決策樹那樣易過擬合，這使其成為許多實際問題領域具有吸引力的模型。KNN分類器通過惰性學習提供了另外一種分類方法，允許在沒有任何模型訓練的情況下進行預測，但預測所涉及的計算成本昂貴。

然而，比選擇適當的學習算法更為重要的是訓練數據集中的可用數據。如果沒有翔實、無歧義的特征，任何算法都不可能做出好的預測。

我們將在下一章討論數據預處理、特征選擇和降維幾個重要主題，這些是建立強大的機器學習模型所必需的。在第6章中，我們將會看到如何評價和比較模型的性能以及學習有用的技巧來微調不同的算法。

[1]The Lack of A Priori Distinctions Between Learning Algorithms, Wolpert, David H, Neural Computation 8.7（1996）: 1341-1390.

[2]An Algorithm for Finding Best Matches in Logarithmic Expected Time, J. H. Friedman, J. L. Bentley, and R. A. Finkel, ACM transactions on mathematical software（TOMS）, 3（3）: 209-226, 1977.

官术网_书友最值得收藏!

Python機器學習（原書第3版）

3.8 本章小結

3.8　本章小結