- 現(xiàn)代決策樹模型及其編程實(shí)踐:從傳統(tǒng)決策樹到深度決策樹
- 黃智瀕編著
- 974字
- 2022-08-12 16:11:20
1.3 決策樹的核心術(shù)語
在決策樹中有兩類節(jié)點(diǎn):決策節(jié)點(diǎn)和葉子節(jié)點(diǎn)。決策節(jié)點(diǎn)用于做出任何決策,并且有多個(gè)分支,而葉子節(jié)點(diǎn)是這些決策的輸出,不包含任何進(jìn)一步的分支。
之所以稱為決策樹(decision tree),是因?yàn)樗愃朴谝豢脴洌瑥母?jié)點(diǎn)開始,對(duì)進(jìn)一步的分支進(jìn)行擴(kuò)展,構(gòu)建了一個(gè)樹狀結(jié)構(gòu)。決策樹根據(jù)每一個(gè)決策節(jié)點(diǎn)的可能取值進(jìn)一步分割,如圖1.4所示,A為決策節(jié)點(diǎn),由根節(jié)點(diǎn)分裂而來,而對(duì)決策節(jié)點(diǎn)A進(jìn)行分割構(gòu)建了B和C,它們均為葉子節(jié)點(diǎn)。

圖1.4 決策樹中的決策節(jié)點(diǎn)和葉子節(jié)點(diǎn)
決策樹的核心術(shù)語包括:
●根節(jié)點(diǎn)(root node):根節(jié)點(diǎn)是決策樹的起點(diǎn)。它代表整個(gè)數(shù)據(jù)集,并進(jìn)一步被分為兩個(gè)或更多的同質(zhì)集。
●葉子節(jié)點(diǎn)/終端節(jié)點(diǎn)(leaf/terminal node):葉子節(jié)點(diǎn)是最終的輸出節(jié)點(diǎn)。得到葉子節(jié)點(diǎn)后,樹就不能再被繼續(xù)分割了。每個(gè)葉子節(jié)點(diǎn)都標(biāo)有一個(gè)類或類的概率分布。
●分割(splitting):分割是根據(jù)給定的條件將決策節(jié)點(diǎn)/根節(jié)點(diǎn)劃分為子節(jié)點(diǎn)的過程。
●分支樹/子樹(branch/sub tree):由決策節(jié)點(diǎn)/根節(jié)點(diǎn)分割形成的以其子節(jié)點(diǎn)為根節(jié)點(diǎn)的樹。
●剪枝(pruning):剪枝是指對(duì)樹進(jìn)行修剪的過程,即從樹上去除不需要的分支。
●父/子節(jié)點(diǎn)(parent/child node):父節(jié)點(diǎn)是直屬上級(jí)節(jié)點(diǎn),子節(jié)點(diǎn)是下級(jí)的節(jié)點(diǎn)。
決策樹是以樣例為基礎(chǔ)的。每個(gè)樣例均包含一組屬性,這些屬性可以是離散的分類值,也可以是連續(xù)值。需要從一組無次序、無規(guī)則的樣例集中推理出決策樹表示形式??刹捎米皂斚蛳碌倪f歸方式,從樣例屬性中選擇一個(gè)屬性,并進(jìn)行屬性值的比較,根據(jù)不同的屬性值向下分支,最終形成一棵樹。從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的一條路徑就對(duì)應(yīng)著一條合取規(guī)則(AND規(guī)則),也稱為決策規(guī)則。整個(gè)決策樹就對(duì)應(yīng)著一組析取表達(dá)式規(guī)則(OR規(guī)則)。決策樹遵循與或式(Sum of Product,SOP)表示法,也被稱為析取范式。對(duì)于一個(gè)類,從樹的根部到具有相同類的葉子節(jié)點(diǎn)的每一個(gè)分支都是值的合取(乘積),以該類為終點(diǎn)的不同分支形成一個(gè)析取(和)。
可將決策規(guī)則看作一個(gè)簡單的if-then語句,由一個(gè)條件和一個(gè)預(yù)測組成。例如,如果今天下雨并且是四月(條件),那么明天就會(huì)下雨(預(yù)測)??梢允褂脝蝹€(gè)決策規(guī)則或多個(gè)規(guī)則的組合進(jìn)行預(yù)測。決策規(guī)則遵循一個(gè)一般的結(jié)構(gòu):如果條件滿足,則進(jìn)行某種預(yù)測。
需要指出的是:
●屬性值如果是連續(xù)的,那么在建立模型之前需要對(duì)它們進(jìn)行離散化處理。
●將屬性作為樹的根節(jié)點(diǎn)或分支節(jié)點(diǎn)的選擇策略是通過使用一些統(tǒng)計(jì)方法來完成的。
這兩點(diǎn)是決策樹構(gòu)建和應(yīng)用中的核心要素。
- 情感分析進(jìn)階
- 機(jī)器人設(shè)計(jì)與制作
- 為機(jī)器立心(通用人工智能的中國藍(lán)圖系列)
- 物聯(lián)網(wǎng)+智能家居:移動(dòng)互聯(lián)技術(shù)應(yīng)用
- 深度思考:人工智能的終點(diǎn)與人類創(chuàng)造力的起點(diǎn)
- AI時(shí)代程序員開發(fā)之道:ChatGPT讓程序員插上翅膀
- DeepSeek:打開財(cái)富密碼
- 人工智能視域下機(jī)器學(xué)習(xí)在教育研究中的應(yīng)用
- 人工智能及其應(yīng)用
- ChatGPT時(shí)代:ChatGPT全能應(yīng)用一本通
- 碼農(nóng)的零門檻AI課:基于fastai與PyTorch的深度學(xué)習(xí)
- 機(jī)器人驅(qū)動(dòng)與控制及應(yīng)用實(shí)例
- 機(jī)器學(xué)習(xí)基礎(chǔ):從入門到求職
- 人工智能簡明知識(shí)讀本
- 高效用DeepSeek:職場逆襲的實(shí)戰(zhàn)指南