- 現(xiàn)代決策樹模型及其編程實踐:從傳統(tǒng)決策樹到深度決策樹
- 黃智瀕編著
- 426字
- 2022-08-12 16:11:25
2.1 經(jīng)典決策樹應(yīng)用的一般流程
經(jīng)典決策樹算法誕生在20世紀90年代之前,那時網(wǎng)絡(luò)環(huán)境還不發(fā)達,所處理的樣本數(shù)據(jù)集主要是小規(guī)模數(shù)據(jù),特征數(shù)并不多,因此數(shù)據(jù)的特征工程并不必要。當時的主要任務(wù)是處理一些特征數(shù)據(jù)的缺失,針對分類數(shù)據(jù)和連續(xù)數(shù)據(jù)進行區(qū)別化處理以及相互轉(zhuǎn)換,包括連續(xù)數(shù)據(jù)的離散化等。
獲得規(guī)整的樣本數(shù)據(jù)集之后,就需要利用各類決策樹算法進行決策樹模型的構(gòu)建。決策樹算法的差異主要體現(xiàn)在選擇特征屬性的策略、選擇屬性分割點策略、不同類型特征屬性的處理方法、如何終止決策樹的構(gòu)建過程、如何優(yōu)化模型以避免過擬合、如何降低決策樹模型的復雜度等方面。本章介紹的三類決策樹算法在這些方面都存在差異。
獲得決策樹模型之后,接下來要利用這些模型對未知樣本數(shù)據(jù)進行推理和預測。在這個過程中,為降低模型復雜度或提高模型泛化能力,需要進行剪枝優(yōu)化等處理。
本節(jié)先介紹缺失值的處理和連續(xù)數(shù)值屬性的離散化處理方法,決策樹構(gòu)建通過三種經(jīng)典算法的具體介紹展開,之后再介紹幾種經(jīng)典的決策樹剪枝策略。
推薦閱讀
- 解構(gòu)ChatGPT
- 2019年華北五?。ㄊ?、自治區(qū))大學生機器人大賽:人工智能與機器人創(chuàng)意設(shè)計賽論文集
- 不會被機器替代的人:智能時代的生存策略
- 一本書讀懂ChatGPT、AIGC和元宇宙
- 機器學習實戰(zhàn):基于Scikit-Learn、Keras和TensorFlow(原書第3版)
- 模式識別與智能計算:Matlab技術(shù)實現(xiàn)(第2版)
- 深度學習
- 擁抱AIGC
- Unity虛擬現(xiàn)實開發(fā)實戰(zhàn)
- 通用人工智能:初心與未來
- AI客戶服務(wù)與管理(慕課版)
- 人工智能
- RPA智能機器人:實施方法和行業(yè)解決方案
- Linux人工智能開發(fā)實例
- 一本書讀懂智能家居核心技術(shù)