官术网_书友最值得收藏!

3.8 本章小結

本章學習了許多不同的用于解決線性和非線性問題的機器學習算法。如果關心可解釋性,決策樹就特別有吸引力。邏輯回歸不僅是一種有用的在線隨機梯度下降模型,而且還可以預測特定事件的概率。

雖然支持向量機是一種強大的線性模型,而且可以通過核技巧擴展到非線性問題,但必須調整許多參數才能做好預測。相比之下,像隨機森林這樣的集成方法不需要調整太多參數,而且不像決策樹那樣易過擬合,這使其成為許多實際問題領域具有吸引力的模型。KNN分類器通過惰性學習提供了另外一種分類方法,允許在沒有任何模型訓練的情況下進行預測,但預測所涉及的計算成本昂貴。

然而,比選擇適當的學習算法更為重要的是訓練數據集中的可用數據。如果沒有翔實、無歧義的特征,任何算法都不可能做出好的預測。

我們將在下一章討論數據預處理、特征選擇和降維幾個重要主題,這些是建立強大的機器學習模型所必需的。在第6章中,我們將會看到如何評價和比較模型的性能以及學習有用的技巧來微調不同的算法。


[1]The Lack of A Priori Distinctions Between Learning Algorithms, Wolpert, David H, Neural Computation 8.7(1996): 1341-1390.

[2]An Algorithm for Finding Best Matches in Logarithmic Expected Time, J. H. Friedman, J. L. Bentley, and R. A. Finkel, ACM transactions on mathematical software(TOMS), 3(3): 209-226, 1977.

主站蜘蛛池模板: 永川市| 嵩明县| 如皋市| 射洪县| 内黄县| 南康市| 定襄县| 平和县| 安乡县| 林西县| 隆德县| 永春县| 内乡县| 大连市| 文昌市| 盱眙县| 扬中市| 苗栗县| 普宁市| 吉木乃县| 库车县| 东乌珠穆沁旗| 伊金霍洛旗| 共和县| 福鼎市| 富宁县| 凤凰县| 安泽县| 鄂尔多斯市| 简阳市| 门源| 南通市| 常宁市| 会昌县| 怀安县| 广宗县| 峨眉山市| 巫山县| 建平县| 全椒县| 神池县|