- 統(tǒng)計學(xué)關(guān)我什么事:生活中的極簡統(tǒng)計學(xué)
- (日)小島寬之
- 1244字
- 2019-01-04 22:38:43
2-6 貝葉斯推理過程的總結(jié)
本講中,求癌癥檢查的貝葉斯逆概率的方法,可用圖表2-7表示如下:
圖表2-7 罹患癌癥概率的貝葉斯推理過程

那么,在求罹患癌癥的后驗概率的過程中,我們能夠發(fā)現(xiàn)什么呢?這個問題,也是本講最重要的內(nèi)容所在。
首先,請注意本講開頭提出的問題——“如果在準確度為95%的癌癥檢查中,你的檢查結(jié)果呈陽性,那么,你患癌癥的概率是否為95%?”答案是否定的。別說95%了,實際上只有4.5%。不過在這個意義上講,倒不必過度悲觀。
至于為何概率會如此之低,原因在于,患癌癥的可能性本來就極其微小,健康人群中所占的比例遠高于患癌癥的人,健康人被誤診為陽性的可能性也很大,這一部分數(shù)值不能忽視。因此,即便檢查結(jié)果呈陽性,也有很極大的可能性是健康人被誤診。所以,千萬不要過度悲觀。
不過,即便如此,也不能完全放心。關(guān)于這一點,看一看表示先驗概率和后驗概率的圖表2-8就清楚了。
圖表2-8 關(guān)于癌癥檢查的貝葉斯更新

通過上圖我們可以看出,罹患該種癌癥的概率,在尚未進行觀察的情況下為0.001(先驗概率);而得知檢查結(jié)果呈陽性之后,數(shù)值便發(fā)生了更新,變?yōu)榧s0.045(后驗概率)。也就是說,概率從0.1%一下子上升到4.5%,增大了45倍。
在得知檢查結(jié)果之前,該種癌癥的自然發(fā)生率很低,1000人中只有1個人有可能患病;而得知檢查結(jié)果呈陽性之后,概率驟然提高,20個人中就有1個人有可能患病。這絕對是不容小覷的事情。
在類似以上的推算過程中,如果想要深刻理解后驗概率的話,需要每天進行練習(xí)。在閱讀本書的過程中,請讀者朋友們多加練習(xí)。
第2講·小結(jié)
1.(借助流行病學(xué)數(shù)據(jù))設(shè)定“癌癥”、“健康”的先驗概率。
2.設(shè)定癌癥檢查的敏感度。也就是設(shè)定癌癥患者檢查結(jié)果為陽性或陰性的條件概率,以及健康人檢查結(jié)果為陽性或陰性的條件概率(使用治療數(shù)據(jù))。
3.由于檢查結(jié)果呈“陽性”,因此暫不考慮“陰性”情況。
4.對“癌癥&陽性”的概率與“健康&陽性”的概率數(shù)值,恢復(fù)標準化條件(保持之前的比例關(guān)系,使相加結(jié)果為1)
5.標準化條件下的“癌癥&陽性”的數(shù)值,即為檢查結(jié)果為陽性的患者實際患癌的時候概率(貝葉斯逆概率)。
6.在觀察檢查結(jié)果后,先驗概率更新為后驗概率(貝葉斯更新)。
練習(xí)題
假設(shè)現(xiàn)在是流感流行期,由于高燒而前來醫(yī)院就診的患者中,有70%患的是流感,30%患的是普通感冒。通過流感檢測工具檢查出來的陽性-陰性概率總結(jié)于以下表格中。

此時,通過以下步驟來推測,在流感檢測工具上顯示陽性時患流感的概率,以及顯示陰性時未患流感的概率。

各個類別的先驗概率分別為,
(a)=( )、(b)=( )
添加信息后的條件概率分別為,
(c)=( )、(d)=( )
(e)=( )、(f)=( )
四種互不相同的情況的概率分別為,
(g)=( )×( )=( )
(h)=( )×( )=( )
(i)=( )×( )=( )
(j)=( )×( )=( )
將觀察結(jié)果為“陽性”的兩種可能性的概率進行標準化處理,則

觀察結(jié)果為“陽性”的情況下,患“流感”的后驗概率=( )
將觀察結(jié)果為“陰性”的兩種可能性的概率進行標準化處理,則

觀察結(jié)果為“陰性”的情況下,患“流感”的后驗概率=( )