- 罪犯心理測驗理論與技術
- 施柳周
- 3559字
- 2019-11-22 16:53:27
第二節 效度
一、效度的定義
效度是指一個測驗或量表實際能測出其所要測的心理特質的程度。在測驗理論中,效度被定義為在一組測量中,與測量目標有關的真實方差(或稱有效方差)與總方差之比,即
公式2-12中,rxy代表測量的效度系數,S2v代表有效變異系數,S2x代表總的變異系數。
為了準確理解效度的概念,我們要注意:第一,效度是一個相對的概念。每個測量工具都有自己的目的,測驗都是為了特定的目的而設計的。當使用量表的功能與量表本身的目的一致時,才能保證量表的效度在相對較高的水平。內隱特質是通過外顯行為間接測得的,因此心理測量的效度只有程度上的差別,不可能百分之百準確,也不可能為零。第二,效度是測量的隨機誤差和系統誤差的綜合反映。只要出現了測量誤差,效度必受影響。第三,判斷一個測量是否有效要從多方面搜集證據。
二、效度的評估方法
測量效度指的是測量結果所達到測量目的的程度。就這方面而言,測量效度的估計在很大程度上取決于人們對測量目的的解釋。比較常見的解釋角度有三種:一是用測量內容來說明目的,為內容效度;二是用心理學上某種理論結構來說明目的,為結構效度;三是用工作實效來說明,為實證效度,也叫校標關聯效度。
(一)內容效度
內容效度指的是測驗題目對有關內容或行為取樣的適當程度,即一個測驗實際測到的內容與所要測量的內容之間的吻合程度。估計一個測驗的內容效度就是去確定該測驗在多大程度上代表了所要測量的行為。因此,要確定一個測驗的內容效度必須具備兩個條件:即要有定義完好的內容范圍;題目應是所界定的內容范圍的代表性取樣。
內容效度主要應用于成就測驗,也適用于某些用于選拔和分類的職業測驗,不適用于能力傾向測驗和人格測驗。但是內容效度缺乏理想的數量指標是它最突出的問題。另外,內容效度經常與表面效度混淆。表面效度是由外行對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看好像是測量所要測的東西;內容效度是由夠資格的判斷者(專家)詳盡地、系統地對測驗作評價而建立的。最高行為測驗注重表面效度,測典型行為時則應該把表面效度降低,盡量不讓被試知道測試的內容,這就是內容效度與表面效度的區別。
內容效度的評估有以下幾種方法:
1.邏輯分析法
也稱專家判斷法。就是請有關專家對測驗題目與原定內容的符合性做出判斷,看測驗的題目是否代表規定的內容。如果專家認為測驗題目恰當地代表了所測內容,則測驗具有內容效度。這種估計效度的方法,是一個邏輯分析的過程,所以內容效度又稱“邏輯效度”。
為了使內容效度內容確定過程更為客觀,彌補專家的不足,可采用如下幾個步驟:第一,確定測驗內容的總體范圍,描述有關的知識與技能及所用材料的來源;第二,編制雙向細目,確定每個題目所測的內容,逐題比較自己的分類與測驗編制者的分類,并作記錄;第三,制定評定量表,從測驗內容所測的技能、題目對所定義的范圍的覆蓋率、各種題目數量和分類的比例以及題目形式的適當性等方面,對測驗做出總的評價。
2.統計分析法
該方法包括:對評分者一致性的評定、兩個測驗復本的相關性和課程內容的學習等分析、再測法等。
3.經驗法
即通過實踐來檢驗效度。
(二)結構效度
結構效度是指一個測驗實際測到所要測量的理論結構或特質的程度,或者說測驗分數能夠說明心理學理論的某種結構或特質的程度。結構是指用來解釋人類行為的理論框架或心理特質,是心理學中抽象的假設性的概念、特性或變量。
結構效度具有以下幾個特點:第一,結構效度的大小取決于事先假設的心理特質理論。具有不同理論構思的測驗,其結構效度是無法進行比較的。第二,結構效度有時很難獲得。當實際測量的資料無法證實我們的理論假設時,并不一定就表明該測量的結構效度。第三,結構效度沒有單一的指標,是由各方面的證據累積起來進行評價的。
與內容效度不同,結構效度的確定首先需要對所研究的結構或特質進行界定,提出理論框架,并把這一理論假設分解成一些細小的綱目,再依據理論框架提出各種可能的有關假設,最后用邏輯或實證的方法驗證假設。
要確定結構效度可以有以下幾種方法:
1.測驗內方法
主要包括內容效度、被試解答測題時的反應過程和測驗的同質性。內容效度高,實質上,也說明結構效度高;若有證據顯示某一題目的作答除了反映所要測量的特質外,還反映著其他因素的影響,則說明該題沒有較好的體現理論構想,該題的存在會降低結構效度;若有證據表明該測驗不同質,則可斷定該測驗結構效度不高。
2.測驗間方法
主要包括相容效度法、區分效度、會聚效度及因素分析法。相容效度法主要計算新的測驗與測量同一特質的、已知效度較高的原有測驗的相關系數。如果兩個測驗的相關系數高,則新的測驗有較高的效度。區分效度的基本思想是如果兩個測驗是測量同一特質的,即使使用相同的方法進行測量,它們之間的相關也應該很低。會聚效度認為如果兩個測驗是測量同一特質的,即使使用不同的測驗方法,它們之間的相關也應該是高的。因素分析法是通過因素分析找出影響測驗的共同效度,測驗分數總變異來自有關因素的比例,即是該測驗結構效度的指標。
3.考察測驗的校標關聯效度
從校標的性質與種類來推論測量的結構效度。有兩種做法:其一是依據效度把人分為兩類,考察其得分差異;其二是依據測驗得分把人分成高分組和低分組,考察這兩組在所測特質方面是否有差異。
4.多種特質-多種方法矩陣法
其原理是若用多種極不相同的方法測量同一種特質相關很高。若有多種特質都接受了多種方法的測查,就可以分別計算出任意兩種方法測量同一特質的相關和測量不同特質的相關,以及任意兩種特質接受同一方法和不同方法的相關,并以這些相關系數為元素構成一個矩陣。
(三)校標關聯效度
效標效度又稱實證效度,反映的是測驗預測個體在某種情境下行為表現的有效性程度。其中,被估計的行為是檢驗效度的外在標準,簡稱校標,也就是獨立于測驗并可以從實踐中直接獲得的我們所感興趣的行為。根據效標效度資料收集的時間差異,可以分為同時效度和預測效度。對于同時效度,測驗分數與校標資料是同時收集的,而預測效度中,先獲得測驗分數,隔一段時間后,再收集校標資料。心理學中常用的校標資料有:學業成就、臨床診斷、實際工作表現、特殊訓練成績、不同團體的總體表現、先前有效的測驗、等級評定等。
一個好的效標必須具備以下條件:第一,有效性。校標必須能最有效地反映測驗的目標,即效標測量本身必須有效。第二,可靠性。效標必須具有較高的信度,穩定可靠,不隨時間等因素而變化。第三,客觀性。效標可以客觀地加以測量,可用數據或等級來表示。第四,實用性。效標測量的方法簡單,省時省力,經濟實用。
效標效度的評估方法有很多種,通常使用相關法、區分法、命中率和功利率等方法。
1.相關法
相關法是評估效標效度最常用的方法,它是求測驗分數與效標資料間的相關。
2.區分法
其基本思路是根據校標測驗的成績把被試分為兩組,然后分析這兩組被試原來接受測驗的分數差異,若這兩組人的測驗分數差異顯著,則說明該測驗有較高的效度。
3.命中率法
命中率法是當測驗用來做取舍的依據時,用其正確決定的比例作為效度指標的一種方法。四種情況:預測成功而且實際也成功;預測成功但實際上失敗;預測失敗而事實成功;預測失敗且實際上也失敗。稱正確的預測為命中,不正確的預測為失誤。命中率高低常隨劃分測驗分數成功與失敗的臨界分數的高低而變化。臨界分數越高,正命中率也越高;反之,臨界分數越低,則正命中率也越低。
4.功利率
即對使用測驗所需的費用和所得到的收益進行比較,看是否利大于弊。
三、影響效度的因素
凡是與測量目的無關的穩定和不穩定的變異都會影響測量的效度。主要有:
(一)測驗的構成
測驗中所用詞匯和句型不能過于困難;題目的表達要清楚明了;所編制的測題要適合所要測量的學習結果;測驗中不能提供額外線索;測題的編制要合理;選擇題的正確答案不能有明顯的組型;測題的難度要適當;測題數目適當。
(二)測驗的實施過程
測驗在實施過程中,如不遵從指導語的要求,出現意外干擾、評分記分差錯等,都會降低測驗效度。
(三)接受測驗的被試
對單個被試而言,被試的應試動機、情緒、態度、身體狀態等都會影響測量信度,造成較大的隨機誤差,進而影響測量的效度。對于被試團體而言,樣本代表性好,同質性好,有利于提高測驗效度。
(四)所選校標的性質
測量行為與所選校標的相似性越高,效度越高。校標本身的測量越可靠,效度就可能越高。此時有一個因素需要注意,測驗分數與校標行為之間是否是線性關系,如果不是,求皮爾遜積差相關就會得出錯誤的效度結論。
(五)測量的信度
任何誤差的增加都會降低測量的效度,所以在考慮測量效度時,要注意測驗的信度,信度不高的測驗不可能具有很高的效度。信度高是效度高的必要而非充分條件,一個測驗效度高,其信度必然也高;但一個測驗信度高,效度不一定高,測驗的效度受其信度的制約。