- 免疫檢測原理與應用
- (美)大衛(wèi)·韋德主編
- 18644字
- 2022-04-21 15:36:38
第三節(jié) 免疫檢測法的性能指標
免疫檢測法是具有以下基本特征指標的分析方法:
● 靈敏度(sensitivity):定量測量微量濃度分析物的能力。
● 特異性(specificity):無須預先從復雜樣本(如血液)中純化分析物即可識別分子結構一致的分析物的能力。
● 準確度(accuracy):通過使用參考標準和校準曲線對測量結果進行有值的量化,可以使不同實驗室之間的檢測結果具有可比性,且可與先前建立的基于健康人群和臨床應用人群的參考值(本書中稱為參考區(qū)間)進行比較。
● 精密度(precision):測量值之間最小的差異,因此單個測試或重復測試的結果都是可信的,不同條件下獲得的檢測結果是一致的。
上述性能指標是相互關聯(lián)的。對于檢測血液樣本(特異性)中分析物的微量濃度(靈敏度)來說,精密度和靈敏度是必需的。靈敏度與精密度密切相關,這是因為靈敏度是指分析物濃度,當分析物濃度低于靈敏度時,檢測的不精確性將變得不可接受。因此,本節(jié)將精密度的相關內(nèi)容緊排在靈敏度內(nèi)容之后。盡管人們有時會理所當然地認為免疫檢測法應該具有這樣的性能,但在實踐中想要達到可接受的分析性能仍是一大挑戰(zhàn)。為了通過開發(fā)、優(yōu)化從而獲得滿足其預期用途的免疫檢測法,必須對這些基本性能指標進行測試。
一、檢測靈敏度
本書第二部分第一節(jié)中討論了靈敏度在實驗設計方面的決定因素[參見“競爭性和非競爭性免疫測定(包括ELISA)的原理”]。靈敏度的概念是一種可能性,即檢測方法能可靠地檢測到樣本中分析物濃度不是零時的最低濃度。經(jīng)典的統(tǒng)計學方法是重復檢測低濃度樣本和零濃度校準品,并假設樣本結果與零濃度無統(tǒng)計學差異,即零假設,并對此假設進行t檢驗。但是,在這種檢驗中,由于標準誤差與檢測次數(shù)的平方根成反比,因此“靈敏度”會隨著檢測的重復次數(shù)的增加而降低。顯然,這種檢驗對于評估固有的檢測靈敏度是沒有用的。
因此,實踐中最常見的方法是重復檢測零濃度校準品,并將高于平均值2倍或3倍標準差所對應的濃度定為靈敏度極限值。該極限值等于樣本的單次測值不會偏離空白值分布的概率,稱其為分析靈敏度(analytical sensitivity)。
該極限值不需要很可靠,畢竟,在此濃度下的精密度可能會比我們認為能接受的還要差很多。靈敏度的評估還存在一個更深層次但未被廣泛重視的問題。靈敏度總是低于第一個含有分析物的校準品的濃度,在某些情況下,可能會達到數(shù)量級上的差異。為了計算分析靈敏度,會使用該濃度校準品擬合一條校準曲線,并假設這條擬合的校準曲線近似反映該濃度校準品以下的真實劑量響應曲線,而真實情況可能并非如此。如圖1-3-1所示,在這種情況下,計算所得的靈敏度(S1)并不能反映真實的靈敏度(S2)。

圖1-3-1 檢測方法的靈敏度
注:擬合的校準曲線僅為真實曲線的近似反應,并不能反映真實的劑量-反應曲線,即計算所得的靈敏度(S1)并不等同于真實的靈敏度(S2)
正是由于這些原因,引入了功能靈敏度(functional sensitivity)的概念,這一概念具有更大的實用價值。功能靈敏度指檢測中變異系數(shù)小于一個特定的值,比如20%的最低分析物濃度(20%的數(shù)字是隨意的數(shù)字,可能不適用于某些應用場景)。因此,靈敏度的概念已經(jīng)從作為一種假設檢驗轉變?yōu)橐环N估計。功能靈敏度源于檢測范圍內(nèi)精密度變化的相關知識,即精確度圖(precision profile),其衍變的由來將會在以后章節(jié)介紹。功能靈敏度濃度通常會但并不一定總是高于分析靈敏度。
功能靈敏度的推導過程比分析靈敏度更為復雜。如果文獻或制造商的包裝說明書中沒有說明靈敏度的測定方法,則更可能引用的是分析靈敏度而不是功能靈敏度。
二、精密度和不精確性
精密度(precision)是描述一種分析技術的可重復性。不精確性(imprecision)則與精密度相反。它是對一種分析技術中誤差的估計值,用變異系數(shù)百分比(%CV)表示,或者有些時候用特定分析物水平的標準差(SD)表示。“高精密度”與“低不精確性”具有相似的含義。人們普遍推薦使用“不精確性”這一術語,而不是精密度,理由就是實際測量的是不精確性(用%CV或SD表示)。然而,對于(不)靈敏度的使用尚未提出類似的論點,“精密度”這一術語被廣泛接受。在本書中,為了使表述更接近于常規(guī)做法,更多地使用了“精密度”一詞;但當使用“不精確性”能使表達更加清晰的時候,也會選擇性地使用這一術語。
檢測的不精確性是由幾種來源的變異綜合作用所導致的,這些變異的來源主要是由抗體特性、分離方法、檢測方法和操作誤差決定。
(一)抗體對精密度的影響
如果在檢測結束時反應能夠達到真正的平衡條件,則精密度會大大提高。抗體親和力越高、反應速率越快,則在給定的時間和溫度的條件下越有可能達到反應平衡。
下列參數(shù)的變化將會導致不精確性,這是因為它們當中的每一個都可以影響抗體-抗原結合反應的速率。此外,對于檢測法來說,如果這些參數(shù)未得到正確的優(yōu)化,那么反應速率也會降低。這些參數(shù)是:
(1)抗體濃度。
(2)溫度及時間-溫度圖。
(3)最終反應混合物的pH。
(4)最終反應混合物的離子強度。
(5)固相上有效抗體包被密度的變化(如果使用固相吸附抗體)。
(二)孵育條件或儀器的變化
在孵育溫度控制得不夠或不均勻的地方,都會出現(xiàn)不精確性的問題。例如,在分析儀的孵育箱中,不同位置之間的溫度可能存在細微的差異,這將會導致檢測孵育結束時結合力的差異。使用自動分析儀進行檢測,檢測開始前樣本或試劑溫度的變化可以改變檢測的時間-溫度圖譜的形狀。所謂的“邊緣效應”(edge effects)也可能會給微孔板檢測法帶來問題,這是由于微孔板邊緣受熱不均導致的。為了避免邊緣效應,需要對孵育箱進行仔細地檢查,以確保熱量分布均勻。在固相微粒檢測法中,由于在使用前微粒沒有完全懸浮或在孵育期間固相沉降的差異,也可能會出現(xiàn)不精確性增加的問題。
(三)分離對精密度的影響
有效的分離應該是在錯誤分類誤差最小且不干擾特異性結合反應的條件下,將游離部分與結合部分完全地分離開。將未結合的物質(zhì)從微粒或反應孔中有效地分離出來需要包括清洗在內(nèi)的一系列步驟,其所涉及的過程(如磁分離、重懸浮、抽吸等)可能會受到機械、流體或壓力波動的影響。處理溶液與微粒的系統(tǒng)還可能會出現(xiàn)暫時的堵塞。
(四)檢測誤差對精密度的影響
使用放射性示蹤劑的計算誤差可能會很大,尤其是在低計數(shù)率的情況下。在放射性檢測中,標準差等同于累積計數(shù)的平方根。每個試管中累積10 000個計數(shù)可將計算誤差降低至1%。
氚和碳-14這類需要閃爍計數(shù)的標簽,計數(shù)效率是另一種產(chǎn)生不精確性的原因,盡管通過使用內(nèi)外部標準化可能部分地降低這種影響。在使用碘-125作為標簽的檢測中,使用的玻璃管的管壁厚度不均勻會進一步增加1%~2%的不精確性,應該避免使用此類玻璃管。
為了增加測試通量,放射性檢測法通常會使用多通道伽馬計數(shù)器來計數(shù),這就需要對每個計數(shù)通道進行準確地校準并定期檢查每個計數(shù)通道的污染情況,否則可能會導致額外的不精確性。類似的問題可能也會在微量滴定板讀取器中發(fā)生,該類讀取器通過多個光纖傳輸系統(tǒng)來測量所有的反應孔,因此需要定期檢查和維護,以確保其保持良好的工作狀態(tài)。
光學系統(tǒng)可能會受到與樣本相關的干擾,如樣本混濁或存在熒光團等。燈泡和讀數(shù)器也會在使用一段時間后出現(xiàn)質(zhì)量下降的情況。與信號生成有關的試劑也可能隨著時間的推移而失去活性,從而增加了信噪比。
(五)操作誤差對精密度的影響
移液不良會導致誤差,加樣時的誤差會引入不精確性。鹽分的結晶可以阻塞計量探針。免疫檢測分析儀最可能出現(xiàn)嚴重計量錯誤的時間就是在一段時間不工作之后。
(六)精密度的等級
目前有以下幾種指標用以評估精密度的等級。
1.批內(nèi)精密度
批內(nèi)精密度(within-run precision)是指在同一測試中多次檢測同一樣本獲得的精密度。樣本應進行20次的重復檢測,且這些重復的檢測在整個測試過程應為等距間隔而不是順序進行的。可能需要評價數(shù)據(jù)的離群值,最好使用正規(guī)的統(tǒng)計學方法(例如,Healy在1979年的文章中描述的方法)進行評價。(譯者注:批內(nèi)精密度又稱為重復性(repeatability),指在一組測量條件下的測量精密度,包括相同測量程序、相同操作者、相同測量系統(tǒng)、相同操作條件和相同地點,并且在短時間段內(nèi)對同一或相似被測對象的重復測量。相關評估指南詳見《CLSI EP05-A3定量測量程序精密度評估批準指南(第三版)》相關章節(jié)。)
2.測試間精密度
測試間精密度(between-run precision)是一個指標,用于描述檢測法在測試同一樣本時,每次測試和每天測試重現(xiàn)相同結果的能力。當以單次常規(guī)測定的方式對樣本進行測試時,測試間精密度是由測試內(nèi)和測試間的組合誤差造成的。但當對樣本進行重復測試時,通常會用結果的平均值來評估精密度。雖然用結果的平均值來評估精密度的方法很有意義,但重要的是要認識到平均結果本質(zhì)上是更精確的。這就可以解釋為什么測試間精密度CV可能會低于批內(nèi)精密度CV這一自相矛盾的情況。[譯者注:between-run precision我國一般稱為批間精密度(參考《體外診斷試劑分析性能評估指導原則(征求意見稿)》(2009)],指在同一實驗室,由同一(組)操作員在同一儀器上,使用同一方法和同種、同一批號試劑,在一段時間內(nèi)(一般為1個月或20個工作日)對同一測試樣品(常用質(zhì)控品)測量結果的精密度。
3.批間精密度
試劑批間精密度(between-lot precision)是使用不同批次試劑對測試結果可變性的評估(譯者注:between-lot precision強調(diào)試劑的批次間差異,前文between-run precision強調(diào)同一批次試劑測試過程中的組合誤差)。
4.方法內(nèi)精密度和組內(nèi)精密度及全實驗室精密度
方法內(nèi)精密度、組內(nèi)精密度及全實驗室精密度是指實驗室間質(zhì)量評價(能力驗證)計劃中,諸多實驗室測試控制樣本得到的精密度估計值;在評估單個檢測方法的精密度時,只有方法內(nèi)精密度與其具有特定的相關性。
(七)精密度的綜合評估
通過使用均方根(root mean square,RMS)CV可將多個來源的、不相關的檢測的精密度評估值結合起來:

式中CV是單個檢測1到n的變異系數(shù);N是每個檢測中1到n次測試中數(shù)據(jù)的數(shù)量。
(八)最小可區(qū)分濃度差
了解免疫檢測的精密度是非常重要的,因為它能夠對給定濃度與指定值之間存在差異的概率進行評估。它定義了最小可區(qū)分濃度差(minimal distinguishable difference in concentration,MDDC)。
例如,假設一個孕婦血清甲胎蛋白(AFP)的檢測結果為50IU/mL,該濃度的精密度CV為10%。那么多高濃度的AFP時,我們可以確信該值與50IU/mL不同呢?55IU/mL(比平均值高1個標準差)與50IU/mL存在差異的概率為84%。而60IU/mL(與平均值相差2個標準差)與50IU/mL存在差異的概率為97.7%。對于正態(tài)分布的數(shù)據(jù),可以使用Z-得分表(Z-得分是偏離給定值的標準差個數(shù))很容易地推導出其他概率。需要注意的是,單側統(tǒng)計檢驗適用于此種情況。95%的概率的Z-得分是1.645。上述案例中,95%置信水平下的MDDC為58.2IU/mL。Sadler等人(1992)描述了MDDC在評估對促甲狀腺激素(TSH)檢測法性能中的應用。
MDDC為檢測法的技術和臨床性能之間提供了直接的概念性聯(lián)系,是一種將分析目標與臨床需求聯(lián)系起來的有用方法。
在評估任何檢測方法時,最基本的觀念就是考察其是否給出了“正確”的結果。然而遺憾的是,目前沒有單一科學術語可以用來描述這種“正確性”。一個理想的、能夠給出完全“正確”結果的檢測法,應該是那種在下列條件下測試含有相同水平分析物的樣本都能得到相同結果的檢測法:
● 來自不同的患者;
● 在不同的測試批中;
● 在不同的實驗室;
● 在不同的條件下;
● 使用不同批次的試劑。
如果“準確度”這一術語是根據(jù)其在英語中常用用法來使用的,而不是專門用來描述偏差的話,可能會更好些。對于一種能夠始終給出正確結果的檢測法來說,它必須既精確又無偏差。一種檢測法可能是準確的但不精確,或是精確的但不準確,或者是既不準確也不精確。如圖1-3-2所示,A檢測是準確但不精確,B檢測是精確但不準確,C檢測是既不精確也不準確。矛盾的是,盡管按照正式定義來說,A檢測為更準確,但是B檢測中的個別結果可能比A檢測更有可能接近真實值。

圖1-3-2 精密度和偏倚
注:一種檢測方法可能準確但不精確,或精確但不準確,或既不準確也不精確。A檢測準確但不精確,B檢測精確但不準確,C檢測既不精確也不準確。然而,B檢測的結果更可能比A檢測更接近真實值,但事實上A檢測多被定義為更準確
(九)精確度圖
在評估一個分析技術的精密度時,需要使用特定的質(zhì)控品來測量不同濃度下的變異情況,這種方法存在一些問題。首先,精密度是在不同的分析物濃度水平下評估的,這些不同的濃度區(qū)間之間的精密度必須進行插值計算。其次,商品化的質(zhì)控品是使用處理過的血液制品(通常是去脂化和去纖維化的血漿,并添加防腐劑)制備的。因此,該商品化質(zhì)控的基質(zhì)是經(jīng)過標準化的,并可能顯示出不同于常規(guī)樣本的基質(zhì)效應。即使是用常規(guī)樣本自制的質(zhì)控血清也要面對這樣的事實,即樣本混合可使樣本之間的基質(zhì)差異最小化。
因此,理想的解決方案是使用常規(guī)樣本評估多種濃度下的精密度。通過這種方法,可以在很寬的濃度范圍內(nèi)檢測精密度,從而繪制出檢測法的精確度圖(precision profile)(Ekins,1983)。
精確度圖是通過計算重復測量值之間的差異而得來的,這些測量值按照濃度的相似性分成若干組。

式中d是第1到n個重復對之間的差異;N是數(shù)據(jù)對的數(shù)量。標準差除以一組值的平均值,再乘以100,得出%CV。由于精密度隨濃度的變化而變化,因此只應匯總相同濃度范圍內(nèi)的數(shù)據(jù)。
如表1-3-1所示。以檢測早期妊娠孕婦血清中游離雌三醇為例,使用電子表格來計算精確度圖是一種非常簡單的好方法。
A列和B列為重復測試的結果,C列為兩次重復測試結果的平均值。D列和E列為單次檢測結果占平均結果的百分比。將樣本的平均檢測結果按升序排列和分組,每組識別出大于20個樣本。D列和E列中每組40個重復測量值的標準差就是該平均濃度下的CV。然后計算各組樣本均值的平均結果并繪制精確度圖,可以通過主觀判斷或通過擬合合適的多項式回歸方程來繪制出這些點的最佳擬合線。許多免疫檢測的曲線擬合程序都包含了相應的子程序以測試數(shù)據(jù)計算精確度圖,有些子程序可以將這些數(shù)據(jù)與以前數(shù)據(jù)進行組合和比較。
表1-3-1 精確度圖的計算

精確度圖中包含了檢測方法適用范圍這一有用信息。可以在適當?shù)目山邮艿腃V處(如10%)畫一條線,該線與擬合的精確度圖的交點即為濃度限值,在此限值之間的檢測精密度判定為是可接受的。如果分析了足夠的低濃度樣本,則可以累積相關信息來估計功能靈敏度。
典型的精確度圖如圖1-3-3所示。

圖1-3-3 精確度圖
注:精確度圖中可包含檢測方法適用范圍的有用信息。在10% CV處繪制線條,該線條與擬合精確度圖的交點處可得出游離雌三醇濃度檢測區(qū)間,在該濃度區(qū)間之間進行游離雌三醇測定,其檢測精密度是被認可的
傳統(tǒng)的精確度圖計算方法存在的一個問題即在大量樣本的重復測試結果中,僅一個分散的離群樣本的存在,就會極大地增加該特定分組數(shù)據(jù)的表觀CV。Raggart在1989年寫了一篇關于這些嚴重誤差的影響及如何處理這些誤差的優(yōu)秀的綜述性文章。
上述技術的進一步變體可使用電子表格程序很容易地制成表格,即計算第一“組”(如20個樣本)的平均值和CV,然后將公式復制到整個數(shù)據(jù)集中,如表1-3-2所示。這樣可以給出濃度范圍內(nèi)的移動平均值。使用移動平均值方法的一個優(yōu)點是,當離群樣本進入入組范圍內(nèi)時,表觀精密度會突然升高;當離群樣本離開入組范圍時,表觀精密度會突然下降,從而可以很容易地識別出明顯的離群值。理想情況下,應對分組數(shù)據(jù)采用正式的離群值檢驗來檢查它們的存在。一種簡單的方法是使用Healy在1979年提出的Healy檢驗,它采用整個數(shù)據(jù)集來檢查平均結果的排名百分比差異,通常可以成功地檢測出明顯的離群值(圖1-3-4)。
需要強調(diào)的是,精密度評估本身會受到抽樣誤差的影響,并且只有在樣本數(shù)量足夠的情況下才能對精確度圖進行準確的評估。Sadler和Smith在1990年回顧了精確度圖的計算及解釋方法中存在的一些不足,并介紹了它們的推導方法以及相關的95%置信區(qū)間。
表1-3-2 移動平均值法計算精確度圖

續(xù)表


圖1-3-4 移動平均精確度圖
注:當離群值進入特定范圍內(nèi)時精密度會突然明顯增加,而當其脫離特定范圍時精密度會突然明顯下降,這時使用移動平均值方法可容易識別明顯的異常值,這是使用移動平均值方法的一個優(yōu)點
就臨床實用性而言,最好選用醫(yī)學決定水平處的精密度。最小可區(qū)分濃度差(MDDC)在這些值中最低,因此在臨床分類中的誤差也最小。
三、特異性和交叉反應
檢測特異性(assay specificity)用以描述抗體僅對目標分析物產(chǎn)生可檢測性反應的能力。交叉反應性(cross-reactivity)是對分析物以外物質(zhì)的抗體反應的測量(圖1-3-5)。由于抗體獨特的特異性使其在分析技術中發(fā)揮了重要的作用,因此對特異性和交叉反應性的分析應成為任何免疫分析技術評價的重要組成部分就不足為奇了。許多蛋白質(zhì)具有與高度保守的表位密切相關的結構,而類固醇激素也具有密切相關的結構,因此對抗體交叉反應性的評估必將成為檢測法設計的第一步。在區(qū)分藥物及其代謝物的過程中也會出現(xiàn)類似的問題。

圖1-3-5 交叉反應性
注:交叉反應性是抗體對分析物以外物質(zhì)進行的反應。交叉反應性通常定義在信號減少至沒有分析物信號的50%的點(B/B0為50%),以此作為能夠引起相同程度信號下降的分析物濃度百分比
交叉反應性可通過幾種途徑進行檢測和表述。在競爭性檢測法中,最常見的方法是將交叉反應性物質(zhì)的純品添加到無分析物的基質(zhì)中,以獲得合適濃度范圍的樣本。交叉反應性通常定義為信號減少至沒有分析物的情況下獲得的信號的50%的點(B/B0為50%)對應的交叉反應物濃度,以此作為能夠引起相同程度信號下降的分析物濃度的百分比。

然而,重要的是,我們要認識到交叉反應性百分比可能在整個檢測范圍內(nèi)有所不同,這在使用多克隆抗體時尤其如此。在這種情況下,得到的交叉反應性體現(xiàn)的是在該分析物濃度下對結合反應影響最大的特定抗體克隆的交叉反應性。在低分析物濃度下,交叉反應性主要取決于高親和力抗體;而在高分析物濃度下,親和力較弱的抗體克隆影響最大。在多克隆類固醇檢測法的研發(fā)中,一種有效的技術是故意添加少量交叉反應性類固醇,用來“淹沒”含量少但具有很強交叉反應的抗體克隆。
在競爭性檢測法的設計中,更為重要的是所測量的交叉反應性在劑量-反應曲線上的不同位置處會有所不同。Ekins早在1974年就證明了在競爭性檢測法中相對效能(relative potency,RP)可表示為:

式中B和F分別代表結合部分和游離部分;Keq和Kcr代表分析物和交叉反應物質(zhì)的平衡常數(shù)。如果分析物的平衡常數(shù)為1010L/mol,而交叉反應物的平衡常數(shù)為108L/mol,則在劑量-反應曲線上的50%結合點處,觀察到的效能為50.5;在10%結合點處,相對效能則降至90.0。
在免疫計量分析法的設計中,在內(nèi)源性分析物存在下的交叉反應性的評估是必不可少的。如果將交叉反應物質(zhì)添加到無分析物的基質(zhì)中,則僅在該物質(zhì)與兩種抗體均結合的情況下才能觀察到信號增加,沒有信號可能意味著該物質(zhì)不會發(fā)生交叉反應。如果在內(nèi)源性分析物存在的條件下檢測交叉反應,則可能出現(xiàn)完全不同的情況。交叉反應物質(zhì)可能與捕獲抗體、檢測抗體相結合,并導致所測量的交叉反應性有顯著差異(圖1-3-6)。

圖1-3-6 免疫計量分析法的交叉反應
(a)交叉反應物僅結合捕獲抗體;(b)交叉反應物僅結合檢測抗體;(c)交叉反應物與捕獲抗體和檢測抗體均結合
注:在計量分析法的設計中,存在內(nèi)源性分析物時評估交叉反應性是必要的。如果交叉反應物僅與捕獲抗體結合而不與檢測抗體結合,或僅與檢測抗體結合而不與捕獲抗體結合,則檢測濃度均會降低。只有當交叉反應物與兩種抗體均結合時,信號才會增加
如果交叉反應物與捕獲抗體結合而未與檢測抗體結合,則測量濃度會降低,導致負干擾(negative interference)。如果交叉反應物優(yōu)先與檢測抗體結合,在高交叉反應物濃度下也可能發(fā)生負干擾。只有當交叉反應物與兩種抗體均結合時,信號才會增加,從而導致正干擾(positive interference)。因此,在免疫計量分析法中,真正的交叉反應性只能通過將每種抗體分別設計成競爭性檢測法來進行評估,盡管這些單個抗體的測量本身除了作為檢測法設計的工具之外,幾乎沒有實際用途。
無論檢測法如何設計,檢測交叉反應性(和干擾)的最佳方法是將物質(zhì)添加到含有內(nèi)源性分析物的樣本中。相比經(jīng)化學或物理分離處理的無分析物基質(zhì),常規(guī)樣本提供了更為真實的基質(zhì),即當交叉反應物質(zhì)或分析物與蛋白質(zhì)結合時,在常規(guī)樣本和經(jīng)處理的基質(zhì)中的反應可能會有所不同。交叉反應性應該在交叉反應物的參考上限的若干倍(比如2倍)處進行計算,而不是在劑量-反應曲線上的某個任意點處來計算,并表示為內(nèi)源分析物濃度的表觀百分比變化。這種方法對于評估在日常檢測中可能遇到的干擾程度更具臨床實用性。
(一)干擾
免疫檢測中的干擾是由許多不同的原因導致的,我們將在第四部分第三節(jié)“免疫檢測中的干擾”中對這些原因進行詳述。
干擾(interference)比較實用的定義是:除了存在真正的交叉反應物質(zhì)以外的、能夠引起檢測結果偏差的任何因素。大多數(shù)干擾的表現(xiàn)形式被歸類為是由“基質(zhì)”效應導致,這個術語在免疫檢測領域中的作用與“特發(fā)性”在醫(yī)學領域中一樣,都是很有用的。但是,將任何異常結果都傾向于歸類為是由基質(zhì)效應導致的做法,往往對問題的進一步調(diào)查和找到可能的解決方案并沒有什么促進作用。目前存在以下幾種干擾機制。
1.有效分析物濃度的變化
(1)分析物被去除或者被阻斷。分析物的去除或者阻斷可能是特異性的,如性激素結合蛋白對類固醇的螯合作用。在競爭性檢測法中,被去除或阻斷的可能是標記的和未標記的激素,或是選擇性去除或阻斷未標記的激素。為了避免此種影響的發(fā)生,通常的做法是在檢測中加入非抗體反應性阻斷劑來屏蔽掉結合位點。此外,阻斷作用可能是非選擇性的,如疏水性藥物或脂血樣本中脂質(zhì)囊泡中的類固醇的隔離,此種情況通常可以通過在試劑中加入選擇性表面活性劑來糾正。對于皮質(zhì)醇來說,一種巧妙的方法是將檢測置于50℃和低pH的條件下進行孵育,在這種條件下,皮質(zhì)醇與皮質(zhì)醇結合球蛋白的結合最小,抗體結合相對來說不受影響。
(2)生理結合蛋白中的分析物被置換。在檢測小分子(如甲狀腺素T4或三碘甲腺原氨酸T3)的游離(非蛋白結合)部分時,結合蛋白的置換是一個主要問題。在這兩個案例中,絕大多數(shù)T3、T4都是結合形態(tài),只有很小的部分是游離形態(tài)。因此,如果某些物質(zhì)能夠將蛋白質(zhì)結合的激素從其結合位點置換出來,就會干擾游離激素的檢測,如非酯化脂肪酸在樣品儲存時,容易形成酯化脂肪酸,這類分析物就會使激素與蛋白結合點脫離,從而影響檢測。
(3)抗原構象的改變。一些藥物和其他半抗原在溶液中與二價陽離子形成復合物。許多蛋白質(zhì)也含有二價陽離子結合位點。因此,血清中或EDTA血漿中存在鎂或鈣離子,都可能導致抗原構象的改變。在體內(nèi),免疫原是復合態(tài)的,正是這種構象激發(fā)了免疫應答。由此產(chǎn)生的抗體對復合形式的親和力可能高于對游離形式的親和力。雖然罕見,但對于某些分析物來說,應該考慮到這種現(xiàn)象。
2.抗體結合的干擾
(1)抗體的物理掩蔽。抗體的物理掩蔽通常僅出現(xiàn)在固相抗體系統(tǒng)中,在此類系統(tǒng)中,抗體包被在疏水聚合物為主的表面上。某些采血裝置中所用的脂質(zhì)和硅油有時會由于與固相產(chǎn)生非特異性結合,從而導致在固相抗體系統(tǒng)中出現(xiàn)問題。一些非共價結合的固相抗體的丟失也可能是由置換效應所引起的。加入特定的表面活性劑和/或修飾固相表面來使其疏水性降低,可以減少或解決此種問題。然而,表面活性劑的濃度確實需要仔細優(yōu)化:高濃度可能會導致非共價結合的固相抗體的直接損失。血漿樣本中的纖維蛋白是另一種常見的干擾因素。高濃度蛋白質(zhì)的存在可能導致固相抗體的蛋白質(zhì)覆蓋,尤其是當這是添加到固相檢測中的第一個成分的時候,此時檢測處于未稀釋的蛋白濃度下。幾乎普遍用來防止非特異性吸附的做法是,用合適的惰性物質(zhì)預先阻斷固相上的活性位點。
(2)抗體結合位點構象的改變。抗體結合位點構象的改變可能是由于樣本引起的反應介質(zhì)中離子強度或pH的變化,或者是由于經(jīng)過預提取的樣本中殘留的有機溶劑。后者對于組織、食物、土壤或法醫(yī)樣本的檢測來說可能是一個特殊的問題,因為樣本的精確成分可能會有所不同。然而,大多數(shù)檢測法都具有足夠的緩沖能力和離子強度能力,可以盡量減小樣本pH和鹽濃度差異帶來的影響。
(3)低劑量鉤狀效應。低劑量鉤狀(low-dose hook)效應偶爾會在競爭性檢測法中遇到,特別是在那些放射性檢測法中,其抗原被標記到一個非常高的比活性。在低濃度的分析物時,抗原抗體的結合可以超過零濃度時的結合(圖1-3-7)。這種現(xiàn)象被歸因于抗體對抗原的正協(xié)同結合。

圖1-3-7 低劑量鉤狀效應
(4)高劑量鉤狀效應。高劑量鉤狀(high-dose hook)效應僅限于一步免疫計量分析法(夾心法),特點是在分析物濃度非常高時信號反而降低(圖1-3-8)。這是由于分析物濃度過高,使捕獲和檢測抗體同時飽和而造成的,阻止了可檢測的捕獲抗體/分析物/檢測抗體復合物的形成。高劑量鉤狀效應主要影響捕獲抗體濃度可能有限的固相檢測法和分析物的濃度范圍可能非常寬的檢測法,如腫瘤標志物的檢測。設計這些檢測法時必須仔細,以確保捕獲和檢測抗體的濃度足夠高,能夠滿足整個病理范圍內(nèi)的分析物水平的檢測需要。通常的做法是在這樣的檢測中,會將樣本進行不同比例的稀釋,重新檢測來檢查結果的有效性(圖1-3-9)。
(5)嗜異性抗體。嗜異性抗體(heterophilic antibodies)是免疫計量分析法中公認的干擾源。在這種情況下,人體樣本中的抗動物IgG抗體可能與試劑抗體發(fā)生交叉反應,特別是來自相同物種的試劑抗體,如小鼠單克隆抗體。嗜異性抗體與捕獲抗體和結合抗體的反應可形成一個穩(wěn)定的、可檢測的抗體復合物,與分析物正常反應形成的抗體復合物相類似。

圖1-3-8 高劑量鉤狀效應反應原理

圖1-3-9 高劑量鉤狀效應示意圖
這種嗜異性抗體的流行率可能比文獻報道所建議的還要高,因為這種“搗蛋”樣本只有在檢測結果與臨床情況嚴重不符時才會被識別出來。少量的內(nèi)源性抗體會導致分析物濃度在正常范圍內(nèi)變化,不太可能引起懷疑。對于這類抗體的來源有多種猜測。它們在經(jīng)常接觸動物的人身上更為常見,如動物飼養(yǎng)技術人員。這可能是由于初始抗體與最初負責產(chǎn)生內(nèi)源性抗體的抗原具有相似的抗原表位所導致。接受單克隆抗體治療或成像的患者在暴露于小鼠IgG 2~3次后,可對其產(chǎn)生抗體應答反應(圖1-3-10)。
IgG和IgM嗜異性抗體都有被發(fā)現(xiàn),后者特別容易發(fā)生反應,這是因為IgM是多價的,并且與固相結合時空間限制程度更低。Boscato和tuart(1986,1988)發(fā)現(xiàn)同時與捕獲和檢測抗體結合的免疫計量分析法最容易受到嗜異性抗體的干擾。在檢測中加入與抗體試劑來源于相同物種的血清或免疫球蛋白,通常能夠有效地防止此類干擾的發(fā)生。另一種方法是使用IgG的Fab片段而不是整個IgG分子,通常作為檢測抗體(Miller &Valdes,1991)。

圖1-3-10 捕獲抗體、嗜異性抗體、檢測抗體交聯(lián)示意圖
(6)自身抗體。內(nèi)源性循環(huán)自身抗體已在各種分析物中被發(fā)現(xiàn),特別是T3和T4(Bendtzen et al.,1990)。在競爭性檢測法中,這種潛在的干擾可導致測量濃度明顯升高或降低,這取決于自身抗體-分析物復合物是游離部分還是結合部分。在免疫計量設計的檢測法中,所產(chǎn)生的影響幾乎總是測量濃度的降低。
(7)補體和類風濕因子。補體(complement)與IgG的某些亞型的Fc片段結合,可通過阻斷抗體而引起干擾,導致濃度的有效降低。在多克隆和單克隆抗體的檢測中都發(fā)現(xiàn)了補體干擾(Masson 等人,1981;K?pyaho等,1989)。
類風濕因子(rheumatoid factor)也與抗原-抗體復合物的Fc片段發(fā)生反應。在使用包被了抗原的固相載體來檢測抗體的檢測中,類風濕因子會導致非反應性IgG的交聯(lián),因此當用標記的抗人IgG檢測到非反應性IgG的交聯(lián)物時,信號會增加。
3.捕獲抗體與固相結合的干擾
使用生物素化的第一抗體(簡稱“一抗”)和鏈霉抗生物素蛋白(又稱鏈霉親和素)包被的固相載體(或者生物素在固相上,鏈霉抗生物素蛋白作為連接劑)是目前比較流行的技術。使用這種技術的檢測法,檢測內(nèi)源性生物素循環(huán)水平高的個體的樣本時,可能會發(fā)生干擾。
4.分離階段的干擾
當溶液中的抗原-抗體復合物通過中間連接反應錨定到固相上時,如使用固相吸附的第二抗體(簡稱“二抗”)來錨定兔IgG的一抗時,在分離過程中可能會發(fā)生干擾。樣本中的任何內(nèi)源性嗜異性抗兔抗體都會與結合的第二抗體競爭。與免疫計量分析法中的干擾一樣,常用的改進方法是加入相同或相關物種的動物血清來抵消其影響,盡管這樣做的代價是降低了一抗的總體結合。
5.檢測系統(tǒng)干擾
(1)內(nèi)源性信號生成物質(zhì)。內(nèi)源信號生成物質(zhì)的存在(比如時間分辨熒光檢測中所用的銪)或是內(nèi)源性顆粒酶(比如基于辣根過氧化物酶的檢測中所用的膜結合過氧化物酶)可以在信號檢測階段產(chǎn)生干擾,盡管這些物質(zhì)可以通過添加合適的阻斷劑選擇性地抑制。在均相熒光檢測法中,熒光藥物或代謝產(chǎn)物的干擾可能是一個特殊的但相對不常見的問題。
(2)酶抑制劑。酶抑制劑可以是化學抑制劑,也可以是免疫抑制劑。目前已經(jīng)報道了能夠與辣根過氧化物酶及堿性磷酸酶發(fā)生交叉反應的抗體。在一些使用過氧化物酶作標記的檢測設計中,某些質(zhì)控血清中用作防腐劑的疊氮化物可能導致酶活性的抑制。
(3)酶催化劑或輔因子。酶催化劑或輔酶因子作為污染物存在時,可能會對酶免疫檢測產(chǎn)生影響,如在過氧化氫存在的情況下銅離子污染會促進魯米諾化學發(fā)光。
四、準確度和偏倚
當應用于測量領域時,準確度(accurcy)與正常的英語用法的含義不同,換言之就是誤差很小。在分析測量領域,準確度的定義是平均測量值與真實值的接近程度。偏倚(bias)是測量值與真實值之間的差距,簡言之就是不準確度。偏倚可能是均衡的(proportional),即檢測結果高于或低于真實值的百分比是恒定的,偏倚也可能是恒定的(constant),即檢測結果高于或低于真實值的濃度值是恒定的。這兩種類型的偏倚可以同時發(fā)生,因此總體偏倚可能在檢測范圍內(nèi)發(fā)生變化(圖1-3-11)。

(a)恒定偏倚

(b)均衡偏倚
圖1-3-11 兩種方法間恒定偏差和均衡偏差示意圖
雖然概念簡單,但準確度和偏倚解釋起來還是很困難的。對于許多分析物來說,沒有能夠測量其真實值的參考方法。在這種情形下,準確度和偏倚可能只是相對沒有意義的兩個概念,而偏倚通常在這種情況下是通過與其他檢測方法的一致結果進行比較來評估的,因此這是一個有明顯缺陷的概念。回收率是對分析準確度最直接的評估方法,其中分析物可以以均勻的純品形式獲得,但該技術可能與闡述的其他問題有關(參見回收率部分)。
(一)回收
最常用于證明檢測準確度的測試方法是評估回收。將精確量的分析物添加到樣本中,并確定實測濃度的增量,其中回收正確表示為:

有些檢驗人員將回收表示為測量濃度除以預期濃度,這是不正確的:在這種情況下,計算的回收是基礎樣本中測量濃度和添加量的函數(shù)。
回收評估的不僅僅是檢測是否得到正確校準。校準取決于無分析物基礎基質(zhì)的準備,已知濃度分析物添加到該基質(zhì)中。這個基礎基質(zhì)通常經(jīng)過化學或免疫處理,以除去內(nèi)源性分析物,這種處理可能導致該基質(zhì)與正常樣本完全不同,從而導致檢測產(chǎn)生基質(zhì)效應。因此,回收評估了檢測的校準以及樣本和校準品基質(zhì)間差異的影響。
回收通常使用3個或3個以上基礎樣本添加3種濃度分析物來進行評估。樣本和添加樣本濃度應該覆蓋檢測的臨床范圍。回收的計算受3個獨立測量誤差的影響:基礎基質(zhì)濃度誤差、添加濃度誤差以及回收添加物的制備及添加誤差。與基礎樣本濃度相比,回收添加物濃度越小,計算回收的潛在誤差就越大。因此,需要重復多次檢測,并計算各檢測的平均值,以盡量減少測量誤差。
使用重復多次檢測及不同水平的回收添加物評估回收需要用到相對大量的基礎樣本試樣,因此常見的做法是混合患者樣本來提供足夠數(shù)量的實驗材料。但這種方式并不理想,因為校準程序本身可能使用混合血清作為基質(zhì)。因此,如果樣本間存在基質(zhì)差異,使用相對均勻的混合樣本進行回收實驗,可能無法發(fā)現(xiàn)任何差異。
將回收作為評價準確度的客觀標準存在一些缺陷。首先,測量的計算過程容易產(chǎn)生較大誤差,如果沒有相應的95%置信區(qū)間,就不能客觀地評估回收的計算。其次,回收只檢測均衡偏差的存在,恒定偏差是被從基質(zhì)樣本和回收的測量值中等量扣除的。恒定偏差的評估可以使用由于生理或病理過程導致的分析物水平較低或缺乏的樣本(以TSH為例,可以使用T4抑制的志愿者樣本或原發(fā)性甲狀腺功能亢進患者樣本);或者是,如果有參考方法,可以通過與參考方法進行比較來評估恒定偏倚。
評價血清抗體檢測回收的意義還有待商榷,即使是在有國際標準物質(zhì)的情況下,所觀察到的濃度增加也是樣本中和回收添加物中已經(jīng)存在的抗體的濃度和親和力的函數(shù)。這種檢測的準確度是相對的而不是絕對的,最好根據(jù)臨床靈敏度和特異性的偏倚而非技術標準來確定準確度。
(二)稀釋
稀釋(dilution)是另一種檢查檢測準確度的有效方法,它提供的信息比回收更有實用價值。因為它回答了這樣一個問題:如果一個樣本被稀釋,當稀釋過程是正確的時候,會給出相同的結果嗎?如果不是,哪個結果最準確?稀釋實驗通常稱為平行性(parallelism)研究,因為實際上稀釋實驗是為了判斷樣本的稀釋曲線是否平行于校準曲線。平行性是通過檢測稀釋于適當?shù)臒o分析物基質(zhì)中的樣本來評估的。應該評估多個樣本,并選取濃度均勻分布于檢測工作范圍內(nèi)的初始樣本及稀釋樣本。稀釋通常是連續(xù)進行的,然而這不是最好的方法,因為每次稀釋所產(chǎn)生的誤差都會被累加到稀釋評估中。
稀釋的結果可以通過幾種方法來表示,其中最簡單的方法是通過乘以適當?shù)南♂屢蜃觼碛嬎阕罱K濃度,并將最終濃度與稀釋度做圖。形式統(tǒng)計檢驗方法可以用來檢驗測量值與稀釋度之間的最小二乘相關顯著性。然而,這種方法的一個陷阱是,如果稀釋因子是以定序型分布的,那么最低稀釋度將嚴重影響結果。例如,1/16稀釋的統(tǒng)計權重會比1/2稀釋大得多,但這可能是對校準曲線中該區(qū)域濃度的不夠精確的一種評估。
更好的評估稀釋的方法是,制備部分稀釋而不是倍比稀釋的樣本(例如,100、90、80、70、60、50、40、30、20、10μL,而不是100、50、25、12.5μL),將稀釋樣本的測值與檢測中初始血清的體積進行最小二乘法回歸,并檢驗直線斜率的95%置信區(qū)間。
稀釋實驗不僅受到測量誤差的影響,而且還受到加樣誤差的影響,后者可能導致稀釋過程中的系統(tǒng)誤差和累積誤差。測量分析過程中,獨立稀釋比連續(xù)稀釋更受歡迎。
抗體的檢測只有在樣本中抗體的親和力與檢測校準品中抗體的親和力完全一致才會顯示出平行性,這是因為此類檢測既反映抗體濃度又反映抗體親和力。但上述說法并不可行,含有高親和力抗體樣本的稀釋表現(xiàn)是過度回收,即測值明顯升高;含有低親和力抗體樣本的稀釋表現(xiàn)是不成比例的偏低。這種非線性會導致臨床解釋的困難,因為在臨床中需要對抗體滴度進行連續(xù)監(jiān)測,且在這種臨床場景下,不同監(jiān)測點的抗體活性需要進行不同程度的稀釋,從而保證稀釋后的結果在檢測的測量范圍之內(nèi)。
這類檢測的校準取決于是否有合適的標準參考物質(zhì)可用。最好是這種參考物質(zhì)所含的抗體具有代表性(平均)的親和力。這樣可以確保患者樣本從總體來看得到了正確稀釋,即大約一半樣本的稀釋表現(xiàn)是回收不足,一半樣本的稀釋表現(xiàn)過度回收。
(三)相關性和方法對比
已發(fā)表的關于新檢測方法的論文幾乎都無法擺脫這樣一個歷史悠久的傳統(tǒng),就是論文中需要包括與另一種方法的相關性研究,通常引用皮爾森相關系數(shù)r作為一致性程度的指標。嚴格地說,這個統(tǒng)計數(shù)據(jù)并不是特別有用。相關性檢查的是兩個參數(shù)是否存在相關性,只有確定了參數(shù)間是否有統(tǒng)計學相關性,相關系數(shù)才能夠評價它們之間相關性的強度。對于評估參數(shù)間的一致程度來說,這是一個很差的指標。如果r是顯著的,這也只是意味著存在一種可檢測的關系,其實最簡單的確定這一點的方法就是看試劑盒上的標簽,這是因為兩種檢測同一種物質(zhì)的方法,如果說它們之間沒有任何關系,也太不可思議了。
方法學比較研究通常將考慮的重點放在線性回歸得出的斜率和截距以及r與1.000的值的接近程度上。簡單的最小二乘回歸計算方法和相關分析具有很大的誤導性,原因有很多。
(1)最小二乘法假設這種關系是線性的——但實際上可能不是。
(2)最小二乘法假設x變量沒有誤差。但是當兩種免疫分析方法進行比較時,情況并非如此。相比較而言Deming在1943年提出的Deming回歸法更為合適,本節(jié)將對Deming回歸法進行詳細敘述。
(3)相關性分析假設兩組數(shù)據(jù)都是正態(tài)分布的。這種情況很少發(fā)生,因為大多數(shù)方法比較研究都包含不成比例的更多數(shù)量的高值和低值樣本,以便能夠在整個檢測范圍進行檢測。極值的存在會嚴重影響斜率、截距和回歸系數(shù)。寬泛的分析范圍的確會產(chǎn)生更好的相關性,但不一定會產(chǎn)生更好的一致性。即使所使用的樣本分布代表了正常人群,即使已知正常人群結果是呈對數(shù)正態(tài)分布的(就如同許多生物物質(zhì)一樣),樣本對實際值的回歸分析的影響幾乎是普遍存在的。
(4)高的r值可以保證方法間的一致性,然而實際上在一些臨床上重要的范圍內(nèi),新方法可能是臨床無效的,并且這種對方法學比較研究中相關性的誤用是特別令人擔憂的。
(5)可以用斜率和截距根據(jù)舊方法的結果預測新方法的結果。反之則不然:舊方法的結果可能無法從新方法的結果中預測出來。調(diào)轉數(shù)據(jù)并使用新方法作為x數(shù)據(jù)來重復最小二乘法相關,會得到不同的斜率和截距的估計值,雖然回歸系數(shù)保持不變。值得注意的是,不管選采用哪個檢測方法作為x數(shù)據(jù),Deming回歸方法給出的斜率和截距的值是相同的。
最不可能發(fā)生的情況是,兩種方法完全一致,所有測試的樣本結果完全相同。原因就跟使用同一方法檢測同一樣本兩次不會得到相同的結果一樣。因此,方法學比較研究的主要目的是判斷一種新方法所得到的結果與原方法有多大差異時才會導致對臨床問題的解釋存在差異的可能性。值得注意的是,這個問題不是一種假設檢驗,而是一種估計。
所需要的是對兩種方法的一致性成對進行評估:這是一個完全不同的問題,需要單獨的分析技術。首選的方法是Bland和Altman在1986年提出的方法,該方法的優(yōu)化點在于使用的是測量值之間的百分比而不是絕對差異,這是因為在大多數(shù)免疫檢測系統(tǒng)中,標準偏差是與濃度相關的。計算過程如下所述,可以簡單地使用電子表格(Excel)來進行,如表1-3-3所示,其中部分數(shù)據(jù)取自用兩種方法測定220名孕中期婦女血清甲胎蛋白(AFP)的比對結果。
● 應該使用多批次試劑和至少100例常規(guī)樣本來進行檢測。其中還應包括一些“存儲入庫”的樣本,用來評估診斷異常范圍內(nèi)的結果。樣本應至少重復兩次或更多(增加重復的次數(shù)就會提高平均值的精密度,從而能夠提升可信度,這種可信度體現(xiàn)在不同方法間的差異是真實存在的,而不僅僅是由一種或兩種方法不精確性所造成的)。
表1-3-3 兩種方法比較

● A列是參考(當前)方法A的數(shù)據(jù),B列是新方法B的數(shù)據(jù),C列是兩種結果的均值,D列是新方法與參考方法的差值。在E列中,用平均結果的百分比表示差異。使用這種方法,結果之間10%的差異就意味著其中一個結果大約是另一個結果的1.1倍。類似地,66%的差異意味著其中一個結果是另一個的2倍,而100%的差異則意味著其中一個結果是另一個的3倍。
● 根據(jù)實驗數(shù)據(jù)可以生成百分比差異與平均(mean)結果(E列與C列)的散點圖。根據(jù)其中任何一個單獨的結果繪制差異百分比圖是不正確的,因為差異來源于每個結果,這就是著名的統(tǒng)計偽影。
● 方法B與方法A的散點圖讓人們能夠對兩者的關系及離群值一目了然。
圖1-3-12顯示的是數(shù)據(jù)的散點圖。通過對數(shù)據(jù)進行最小二乘法回歸得出如下關系:
方法 B = 1.012×方法 A + 2.704(r = 0.978)
由圖1-3-12可知,兩種方法的一致性非常好,斜率接近一致,但實際上還會有一點正偏倚。由其他已發(fā)表的方法學比較研究中引用的相關系數(shù)來判斷,該相關系數(shù)將被認為是可以接受的。
然而,差值圖展示了在AFP低濃度水平下偏倚的真實程度(圖1-3-13)。這兩種方法都適用于神經(jīng)管缺陷的篩查,其中高值需要進一步調(diào)查研究。但對于唐氏綜合征的篩查,AFP低值更具有臨床意義,兩種檢測法將會出現(xiàn)明顯的臨床差異。Knight等人在1986年報道了當這樣一種檢測法用于唐氏綜合征篩查時,由低濃度偏倚導致的后果,在這種情況下,被認為患有唐氏綜合征風險增加的女性人數(shù)增加了3倍。該案例還強調(diào)了有必要根據(jù)不同診斷目的來檢查現(xiàn)有檢測方法的適用性。

圖1-3-12 方法A和方法B檢測結果的散點圖

圖1-3-13 方法A和方法B的差異
最小二乘回歸僅適用于模型Ⅰ回歸問題,即其中自變量x不存在測量誤差,因變量y受隨機誤差的影響。最小二乘回歸應只用于兩種特定情況下的方法比較研究。首先,x變量是個精確的參考方法或“金標準”,其結果可被認為是正確的;其次,在所謂的Berkson案例(Sokal 和Rohlf 1969年提出)中,x變量是目標值,如分析物已經(jīng)添加到校準基質(zhì)中,即使此類的添加可能也會產(chǎn)生誤差。
實際上,兩種方法都可能產(chǎn)生誤差,并且通常不能將其中一種方法作為參考方法。在這種模型Ⅱ的回歸問題中使用最小二乘法會導致對斜率的估計結果存在差異,這種差異取決于x或y變量是否是被當成獨立變量。而實際上,定義x和y之間真實關系的斜率介于兩者之間。
Deming回歸(有時稱為函數(shù)關系)與更常見的最小二乘法之間的差異在于:后者在假定x數(shù)據(jù)沒有誤差情況下,使y方向的方差最小,而Deming回歸會使y軸向和x軸向的平方和最小。計算公式如下所示。首先,為了判斷方法的相對不精確性,兩種分析都需要對標準差或CV的比值λ進行評估:

式中CVx和CVy分別是代表x和y兩種方法的變異系數(shù)。
U的定義如下:

式中xi和yi代表從1到N的單個結果;x和y分別是代表x和y數(shù)據(jù)的平均值。
回歸線的斜率為Deming byx 由下式給出:

由式(1-3-8)可以計算出來y軸向回歸殘差的標準差為syx,并可以用該式來估計回歸線附近點的離散程度:

截距為Deming ayx,常規(guī)的計算方法如下:

回歸系數(shù)r的計算方法及測值與最小二乘回歸法相同:

1993年Linnet發(fā)表了一篇優(yōu)秀的綜述,對方法比較研究中的各種回歸過程進行了回顧,并對數(shù)據(jù)點的權重進行了進一步的修正。
可惜的是,許多常見的統(tǒng)計程序并沒有將Deming回歸分析作為常規(guī)操作。但是,使用之前介紹的AFP方法比較數(shù)據(jù)相同的數(shù)據(jù),可以很容易地將回歸做成如表1-3-4的表格。為了簡單起見,我們假定兩種方法的方差是相當?shù)模瑢τ诖蠖鄶?shù)免疫分析方法來說,這種假設是合理的。
表1-3-4 Deming回歸

1.A列中展示的是方法x的結果。
2.B列中展示的是方法y的結果。
3.計算x的平均值(均值x)和y的平均值(均值y)。
4.在C列,計算x-均值x,D列中,計算y-均值y。
5.E列對應的是C列與D列值的乘積。
6.F列對應的是C列值的平方;G列對應的是D列值的平方。
7.分別計算E、F、G列的和以及A、B列的均值。
8.將這些值代入上述方程來計算U值,從而得出斜率和截距。
圖1-3-14展示了之前的數(shù)據(jù),并覆蓋了最小二乘法的斜率和Deming回歸的斜率,Deming回歸與最小二乘得出的斜率和截距略有不同:
方法B(y)=1.050×方法A(x)+1.087(r=0.978)
Passing和Bablock(1983,1984年)進一步介紹了一種以結構關系模型為基礎的穩(wěn)健程序,它無須對與樣本相關的期望值或誤差項的分布類型進行特別的假設。但計算過程是復雜的,依賴于對連接每個可能的數(shù)據(jù)對組合的回歸線的中位斜率的評價。
需要進一步考量的因素與檢測的相對準確性有關。如果參考方法極不精確,那么就不會有新方法會顯示出與之具有良好的一致性,由于此種限制,即使使用參考方法將同一個樣本檢測兩次,也不能與其自身結果有很好的一致性(偶爾開展這個實驗會很有用,結果是令人驚訝的)。如果不精確性水平很高,對于某些檢測來說這可能是一種固有的特性,且是不太可能得到改進的特性,那么我們有理由相信,重復檢測同一樣本,并使用平均結果,可以把不精確性的影響降到最低。

圖1-3-14 最小二乘法和Deming回歸分析
最后,即使方法間的一致性看起來很好,這本身也不能證明在不重新評估參考區(qū)間的情況下從一種檢測方法直接更換為另一種檢測方法是正確的。即便良好的實驗設計與合適的樣品入組可以使兩種方法能夠在相同的檢測中進行評估,但如上所述相關性或直接方法比較的做法并不能替代該分析過程。
(四)檢測漂移
檢測漂移是指被測分析物濃度的系統(tǒng)變化,而不是隨機變化,其大小取決于檢測中的測試順序。除非在整個檢測過程中定期測試質(zhì)控血清或混合的患者樣本,否則不太可能檢測到漂移。常見的評估不精確性水平的做法是連續(xù)重復測試,當存在漂移時,這種做法低估了不精確性(偏差)的真實水平。類似的爭議也發(fā)生在重復測試零濃度校準品來評估靈敏度的情況。漂移引起的一個重要的問題可能是在二次校準中,通常校準品或質(zhì)控血清都是在一系列的參考物質(zhì)之后被當成未知量來進行檢測,當按照常規(guī)方法測試校準品和質(zhì)控品的時候,它們在檢測中的位置發(fā)生變化,一旦校準成功,就會導致樣品結果出現(xiàn)系統(tǒng)偏倚,并且偏倚方向會與之前檢測偏倚相同,因此偏倚就會發(fā)生疊加。
檢測漂移有以下幾種可能的機制:
(1)檢測設計中固有的漂移。在許多檢測中,免疫反應還不能達到從始至終完全包容各種試劑添加量變化的程度。在某種程度上,這個問題可以通過適當推遲其他試劑的加入來得到緩解。然而,情況可能并非總是如此,尤其是對于那些分離是物理的,且需要同時對所有的樣本同時進行處理(如按批清洗、離心或傾析)的檢測。
(2)孵育溫度變化。大多數(shù)免疫檢測試劑是需要在2~8℃條件下保存,但很少有檢測是在這個溫度下開展的。如果直接用從冰箱中拿出來的試劑來進行檢測,那么當隨后檢測進行孵育的時候,那些首先加試劑的試管的溫度要高于最后進行檢測的試管。考慮到溫度每升高10℃,反應速率可能會翻倍,因此孵育溫度的變化會導致漂移也就不足為奇了。
(3)固相沉淀。很少有固相懸浮液能在靜止狀態(tài)下保持懸浮狀態(tài),添加試劑的所用時間越長,沉淀就會越多,從而導致固相試劑濃度的改變。建議在添加的過程中輕輕攪拌固相成分,不建議使用磁力攪拌器混合磁性顆粒,顯然有很多人曾不止一次的這樣做過。
(4)信號生成。許多檢測依賴最后一步添加的試劑來產(chǎn)生信號,雖然向100個孔中加試劑可能僅需要1min,但是許多讀數(shù)器測量所有反應孔的信號所用時間遠比這短得多。如果信號發(fā)展的時間是5min,那么相當于第一個孔的信號發(fā)展的周期比最后一個孔長20%。正因為這個原因,比色法檢測通常會使用終止劑,有些實驗室為節(jié)省開支會忽略掉這一步。
在整個檢測過程中,通常會選用固定濃度間隔的質(zhì)控血清來評估漂移。應該進行多次檢測,并對加樣位置和加樣時間的檢測數(shù)據(jù)進行線性回歸分析。因為漂移總是與濃度相關,因此應該檢測多個濃度水平的質(zhì)控。取多次檢測結果的平均值可以提升檢測結果的可信度,并保證任何可見差異都是由于漂移而不是由不精確性造成的。在極端條件下開展檢測會有所幫助,如低于或高于常規(guī)溫度、減慢試劑或樣本的加樣時間以及縮短孵育時間。如果漂移存在,這些極端條件通常會將其引誘出來,這不僅為實驗提供了陽性對照,還能夠為試劑添加和孵育時間、檢測規(guī)模、環(huán)境溫度等方面提供合理的邊界范圍,超出這些邊界范圍,檢測的表現(xiàn)便會不盡如人意。此外,正漂移和負漂移都有可能發(fā)生。
檢測的孵育時間有越來越短的趨勢,這種趨勢加劇了漂移的問題,這就需要檢測設計者有相當大的獨創(chuàng)性來盡量減少此問題。
因為全自動儀器對試劑的添加、孵育時間和溫度的控制程度更高,所以很少出現(xiàn)檢測漂移的問題。然而,在由手工檢測轉換到半自動化取樣設備的過程中所發(fā)現(xiàn)的問題并不少,在這種情況下應該自覺地重新評估漂移。試劑添加的用時幾乎肯定是不同的。例如,在一分鐘內(nèi)使用重復分配器向100個反應管手工添加100μl的抗體試劑是很簡單的事情,而一些自動化儀器完成相同的任務可能需要幾分鐘的時間。
五、參考文獻


(張義、劉興黨 譯,何建文 審)
- 生理學(第4版)(全國高等學歷繼續(xù)教育“十三五”(臨床專科)規(guī)劃教材)
- 呼吸系統(tǒng)疾病
- 實用遺傳代謝病學
- Ⅰ期臨床試驗設計與實施
- 中藥炮制學實驗指導(全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材配套用書)
- 健康評估(第3版)(全國高等學歷繼續(xù)教育“十三五”(護理專升本)規(guī)劃教材)
- 中藥注射劑安全應用案例分析
- 婦產(chǎn)科學(第2版)
- 社區(qū)臨床常見病證及處理:第2版(中醫(yī)類別全科醫(yī)師崗位培訓規(guī)劃教材)
- 心血管遺傳藥理學
- 疫苗的質(zhì)量控制與評價
- 口腔修復體制作·技能操作
- 中藥功效學
- 國際醫(yī)療體制改革比較研究
- 中國心律學2016