- 臨床研究方法與實用技巧2
- 趙一鳴等編著
- 2071字
- 2020-05-19 11:56:50
19 關于ROC曲線不得不說的故事
王曉曉 唐 棟
受試者工作特征曲線(receiver operating characteristic curve,ROC曲線),是醫學科研工作者非常熟悉的一種曲線圖,常用來決定最佳診斷點。那么ROC曲線來自何方、有什么講究么?讓我們聊一聊ROC曲線的前世今生。
大家仔細看看ROC英文第一個單詞“receiver”,就會理解最初它的翻譯是“接收者操作特征曲線”,首先是由第二次世界大戰中的電子工程師和雷達工程師發明并最先使用的。那時雷達兵(信號接收者)的任務就是每天盯著雷達顯示器,觀察屏幕上是否出現代表敵方飛行物的光點。顯示屏上出現光點有兩種可能性,一種可能是雷達探測到了敵機的行蹤,另一種可能是有鳥類或其他非軍事飛行物從雷達探測區域經過。在第一種情況下,如果雷達兵及時發出警報,通知高炮部隊或空軍攔截,就是“擊中”;而如果這時雷達兵沒有把顯示屏上的光點判斷為信號,就是“漏報”。在第二種情況下如果雷達兵把光點當作敵機(信號)看待,就是“虛報”;如果這時雷達兵正確地把它判斷為其他飛行物(噪聲),那就是“正確排除”。
我們都能理解,人不犯錯誤幾乎是不可能的,更何況是通過簡單的亮點判斷敵機,為了評估雷達兵判斷的正確與否,我們可以列出下表。

針對此四格表,我們可以計算擊中率、虛報率、漏報率、正確排除率。如何找到一個最佳的臨界點使得“擊中率”和“正確排除率”同時達到最佳效果?我們都希望理論上達到100%的“擊中率”和“正確排除率”,那么誰最接近這個點(ROC曲線左上角頂點),誰的工作業績也就最好。
看到這里大家是不是覺得很眼熟,感覺與診斷試驗結果判定非常相似。沒錯,這就是ROC曲線的由來。后來醫學工作者把它引入到診斷研究中,并且改用了“受試者工作特征曲線”這個翻譯。
一般情況下,我們診斷某種疾病是由行業內公認的檢驗方法(金標準)來判斷的,但往往這些所謂的金標準存在有創性、操作復雜、價錢昂貴等缺點。為此,我們也在尋找替代的簡單易行的檢驗方法,但我們同時要求替代的檢驗方法具有一定的分辨能力。于是,我們尋找經過金標準確定的患病和無病,然后再用替代的檢驗方法進行再診斷,診斷結果和金標準相比無疑會出現四種情況。

這個四格表衍生的各種指標:真陽性率(敏感度)、假陽性率、假陰性率、真陰性率(特異度)等都是評估替代檢驗方法鑒別患病和無病的能力。通常情況下我們以敏感度為縱坐標,1-特異度為橫坐標繪制曲線,即ROC曲線。
19.1 ROC曲線的解讀
ROC曲線其實是n組二維坐標的點(敏感度,1-特異度)繪制的曲線,曲線上每一點均表示某種檢驗方法或者某種臨界值下的敏感度和1-特異度,我們一般認為左上角對應的檢驗方法或臨界值具有較高的診斷價值,因為其兼具較高的敏感度和特異度。在這里,認真的讀者也許會感慨左上角的說法有些含糊,所謂的“曲線左上角”至少可以找出3種判斷方式:①曲線與斜率為1的斜線的切點;②曲線與經過(0,1)和(1,0)兩點直線的交點;③曲線上與(0,1)點絕對距離最近的點。從數學上講,由于ROC曲線并非規則曲線,這3個點未必永遠合一。
在實際應用中,SPSS會給出不同界值下的敏感度和1-特異度,最重要的一點就是要結合臨床實際進行選擇。如果不是特殊情況,一般以約登指數(Youden index)即(靈敏度+特異度-1)最大時所對應的點為最佳診斷界值。
19.2 可以在一個坐標系下同時繪制多條ROC曲線嗎?
有時候我們需要比較多種檢驗方法的診斷價值,目前我們是將每一種檢驗方法分別與選定的金標準進行比較,這樣可以繪制多條ROC曲線,為方便比較,我們可以將多條ROC曲線繪制在同一坐標圖內。SPSS即可實現這一目的。
聰明的讀者會問,如果兩條差不多的曲線肉眼難以分辨診斷效能,又該如何呢?這時我們引入新的工具——ROC曲線下方的面積(ROC area under the curve,ROC AUC)。我們很容易就可以總結出ROC AUC的幾個特點:因為是在1×1的方格里求面積,AUC必在0~1之間;AUC值越大的曲線,診斷效能越高;當ROC AUC=0.5時,相當于拋硬幣猜正反面。所以我們常見的醫學論文里,ROC AUC一般介于0.5~1.0(50%~100%)之間。認真的讀者還會追問“難道不會出現<0.5的ROC AUC嗎?”會有的,這個時候你把診斷方法的結果反過來判斷就行了,ROC AUC依然>0.5。
對于ROC AUC的判斷,有些作者會認為某種檢測方法的ROC AUC在0.5~0.7時有較低準確性,ROC AUC在0.7~0.9時有一定準確性,ROC AUC>0.9時有較高準確性。
19.3 對角線必須畫出來嗎?
對角線表示所選的替代檢驗方法跟隨機猜測一樣(ROC AUC=0.5),毫無診斷價值。所以,一般我們以對角線作為參照線,對角線以上認為有診斷價值,對角線及對角線以下則無診斷價值。但對角線并非必須出現在ROC曲線,因為沒有對角線,也不影響我們對ROC曲線的解讀。
19.4 ROC曲線橫縱坐標必須一致嗎?
我們目之所及的ROC曲線好像都是繪制在正方形坐標圖內,必須是正方形嗎?長方形不可以嗎?是這樣的,ROC曲線的橫、縱坐標(1-特異度和敏感度)有著基本相同的內涵,均是四格表衍生而來的指標,倘若我們將ROC曲線繪制在長方形坐標圖內,我們的參照線便不是醒目的對角線,反而不利于我們解讀ROC曲線。另外,我們知道敏感度和特異度取值范圍均在0~1,是需要封口的,不同于以往的無限延長的坐標軸,再加上常說的曲線下面積也是限制在1×1的方格里,所以我們建議ROC曲線周邊4條線為實線。