官术网_书友最值得收藏!

2.2.3 熵權(quán)法

專家調(diào)查權(quán)重法還是更多依賴于專家團(tuán)隊(duì)的主觀意見,這就可能造成給出的定性指標(biāo)有可能脫離于當(dāng)前業(yè)務(wù)的實(shí)際情況而存在的問題。為了杜絕這種經(jīng)驗(yàn)主義,更為量化的熵權(quán)法(Entropy Weight Method)被引入風(fēng)險(xiǎn)管理的場(chǎng)景中來。

在介紹熵權(quán)法之前,我們需要先了解下熵(Entropy)的概念。熵最早來自于熱力學(xué),是衡量一個(gè)體系中混亂程度的指標(biāo),熵越大則說明這個(gè)體系越混亂。信息熵(Information Entropy)則借鑒了這個(gè)概念,用來描述一個(gè)事件所包含信息量的期望。如果一個(gè)事件中的某種可能情況發(fā)生概率過大,則這個(gè)事件的整體離散程度較小,即平均信息量較小。信息熵的計(jì)算公式如下:

其中p(x)代表事件X中每個(gè)可能情況x發(fā)生的概率,并且規(guī)定0 ln(0)=0。

根據(jù)信息熵的定義,可以利用熵值來確定某個(gè)指標(biāo)的權(quán)重,熵值越小則說明這個(gè)指標(biāo)的信息量越大,對(duì)于綜合評(píng)價(jià)的影響也越大。如果某個(gè)指標(biāo)的所有值相同,則對(duì)于綜合評(píng)價(jià)沒有任何影響。熵權(quán)法的計(jì)算步驟如下所示。

(1)數(shù)據(jù)標(biāo)準(zhǔn)化

首先要對(duì)各個(gè)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,目的是去除不同指標(biāo)量綱對(duì)于權(quán)重計(jì)算的影響。數(shù)據(jù)標(biāo)準(zhǔn)化常見的方法有最大最小標(biāo)準(zhǔn)化和Zscore標(biāo)準(zhǔn)化。

假設(shè)第i個(gè)客戶的第j個(gè)指標(biāo)為xij,標(biāo)準(zhǔn)化后為x'ij,則最大最小標(biāo)準(zhǔn)化的計(jì)算公式如下:

Zscore標(biāo)準(zhǔn)化的計(jì)算公式如下:

其中代表所有客戶第j個(gè)指標(biāo)的平均值,σ(xj)代表所有客戶第j個(gè)指標(biāo)的標(biāo)準(zhǔn)差。

(2)計(jì)算各指標(biāo)信息熵

根據(jù)信息熵的公式,每個(gè)指標(biāo)的信息熵計(jì)算公式如下:

其中n為全體客戶數(shù),為p第j個(gè)指標(biāo)下第i個(gè)樣本所占比重。

(3)確定各指標(biāo)權(quán)重

基于信息熵,各指標(biāo)的權(quán)重計(jì)算公式如下:

其中m為指標(biāo)總個(gè)數(shù)。

我們以Kaggle社區(qū)上捷信(Home Credit)的貸款申請(qǐng)數(shù)據(jù)為例,幫助大家更好地理解熵權(quán)法。有10位客戶申請(qǐng)節(jié)點(diǎn)的10個(gè)指標(biāo),如表2-2所示。

表2-2 捷信客戶樣本申請(qǐng)節(jié)點(diǎn)指標(biāo)

利用公式(2-2)進(jìn)行標(biāo)準(zhǔn)化后,代入公式(2-4)計(jì)算出10個(gè)指標(biāo)的信息熵,如表2-3所示。

表2-3 捷信客戶樣本指標(biāo)信息熵

將信息熵代入公式(2-5)計(jì)算出10個(gè)指標(biāo)的權(quán)重,如表2-4所示。

表2-4 捷信客戶樣本指標(biāo)權(quán)重

主站蜘蛛池模板: 安阳市| 五大连池市| 乐昌市| 信阳市| 通许县| 保靖县| 南开区| 建瓯市| 四子王旗| 安陆市| 南康市| 肥东县| 安国市| 美姑县| 开江县| 蓬莱市| 永春县| 子长县| 榕江县| 上饶县| 静海县| 琼海市| 朝阳市| 个旧市| 卓尼县| 永平县| 桦南县| 汽车| 中方县| 宁波市| 凤庆县| 中阳县| 平乐县| 武强县| 垫江县| 连南| 佳木斯市| 樟树市| 凤山县| 高安市| 来凤县|