- 統計學關我什么事:生活中的極簡統計學
- (日)小島寬之
- 158字
- 2019-01-04 22:38:42
2-3 以檢查準確率為線索,設定“條件概率”
下一步就是設置為不同類別帶來特定信息的條件概率。本例中的信息是指檢查結果所呈現出的陽性及陰性。正如第一講中所述,這一過程離不開客觀數據的支撐。在本例中,就使用了與簡易檢查相關的客觀數據。(圖表2-2)
圖表2-2 檢查準確率的條件概率

橫向閱讀這張圖表可知:上面一行是癌癥患者的情況,檢查結果呈陽性的概率為0.95。也就是說,查出患者得了癌癥的概率為95%。那么誤診的概率便是1-0.95=0.05了。這表明,每接受檢查100人中,其中5人,即使身患癌癥,診斷出來的結果也是陰性。
下面一行是健康者的情況,誤診為陽性的概率為2%。因此,準確診斷為陰性的概率就是1-0.02=0.98。
從上面的圖表,我們可以得知,簡易檢查并不是那么完善,它存在著誤診的風險。所謂的風險包含了:“身患癌癥,卻診斷為健康”和“很健康,卻誤診為癌癥”這兩種情況。
這種概率,就是先前講過的,在限定類別場合下的各個檢查結果的條件概率。把各個類別作為檢查結果的“原因”來看待的話,如果明確了原因(身患癌癥或是健康),就可以知道結果(陽性或陰性)的概率。
上一節中共分了兩個大類,根據具體信息,每個大類又被分成了兩小類,如圖表2-3所示。
圖表2-3 四種互不相同的可能性

如圖表2-3所示,你的身體內部存在四種可能性。患癌并呈現陽性(左上區域),患癌并呈現陰性(左下區域),健康狀態下的陽性(右上區域)和健康狀態下的陰性(右下區域)四種情況。
并且,根據各區域所表示的概率,用乘法計算,得到圖表2-4。
圖表2-4 四種互不相同的可能性各自的概率

2-4 檢查結果呈陽性,因而排除掉“不可能的情況”
此刻,你已經了解到自己的檢查結果呈陽性。而這件事又可以這么理解:你獲取一項關于自己身體內部狀況的信息,也就為“可能性世界”增添了新的信息。
在現實世界中,因為觀察到了“陽性”這一結果,“陰性”這一結果便可以排除了。用圖形表示,如圖表2-5所示。
圖表2-5 獲得信息之后,可能性受到限定

2-5 計算罹患癌癥的“貝葉斯逆概率”
在上一節中,因為觀察到“陽性”這一診斷結果,因此,可能世界被限定為2個。也就是說,你所處的世界或是“癌癥&陽性”的世界,或是“健康&陽性”的世界,只有這兩種可能性。
對檢查結果的觀察,使得可能性從4種減少到2種。這樣,概率相加之和(長方形的面積)無法為1。因此,為了恢復標準化條件,需要在保持比例關系的前提下,使“相加之和等于1”,具體如圖表2-6所示。
(左邊長方形的面積):(右邊長方形的面積)=0.095∶1.998
圖表2-6 根據標準化條件,計算后驗概率

0.095+1.998=2.093,用這個數值來分割比率的兩側的話,可以滿足標準化條件(相加之和等于1)。
如圖所示,將長方形的面積標準化處理,則為0.0454和0.9546(四舍五入,保留小數點后第四位)。請確認相加之和為1。
從這個結果可以得知,在得知“陽性”這一檢查結果的情況下,罹患這種癌癥的概率為4.5%左右,這便是后驗概率(貝葉斯后驗概率)。