緒論

1．積極心理測評工具的特征、選擇與評價

一、積極心理測評工具的特征

量表的標準化是量表編制中必需且重要的一環。也就是說，量表編制成稿之后經過標準化才算正式完成。編制后的量表能否投入使用，主要取決于其標準化特征和程度。

1．取樣（sampling）

按傳統的測驗學理論，對測驗或評定的解釋是，以被測或被評者的所屬群體為標準，在編制測驗或量表無法測量這個群體中所有成員時，便只能取樣，即以樣本代表全體（汪向東，王希林，馬弘，1999）。樣本具有代表性才能保障測評工具具有較好的信度和效度。否則可能導致測評工具的信度和效度不高，導致結果解釋存在偏差。提高樣本的代表性，除了要求樣本的數量達到要求之外，還應該注意所測評內容（如積極心理測評中的生活滿意度、生命意義感、情緒智力等）的所有有關影響因素（如年齡、性別、文化程度、民族、生活地區等）。

心理測評常用的取樣方法分簡單隨機抽樣、整群抽樣、分層比例抽樣和機械抽樣等。

（1）簡單隨機抽樣：包括直接抽選法、抽簽法、隨機數字表法。

（2）整群抽樣：先將總體分為多個群，然后隨機抽取其中若干個群，對這些群內所有個體或單元均進行調查。

（3）分層比例抽樣：先將總體中所有的單位按照某個標志分成若干類（組），然后在各個類中分別隨機抽取樣本。

（4）機械抽樣：先將抽樣總體單位按照一定順序排隊，根據總體單位數和樣本單位數計算出抽選間隔（抽選距離），然后按照一定的間隔抽選樣本單位。由于抽選間隔相等，所以也叫等距抽樣。

不管用何方式，都要使樣本有足夠代表性。因此，在選擇測量工具時必須注意編制此工具的樣本代表性和所要評估的對象情況是否在樣本內。只有受測者的情況在這些方面與標準樣本相符，所測結果與標準樣本才有可比性。

2．常模（norm）

常模是一種供比較用的標準量數，由標準化樣本測試結果計算而來，其形式大致有如下幾種。

（1）均數。某一受評者所得分數與標準化樣本的平均數相比較時，便能確定其水平的高低。

（2）標準分。用標準分作常模，可提供更多的信息。標準分能說明受測者的評定成績在標準化樣本的成績分布圖上所在位置。許多評定量表采用這種常模可衍化出其他形式，如T分。

（3）百分位。將得分低的排列在下，得分高的在上，計算出樣本分數的各百分位范圍。如P25，說明樣本中25%的得分在該受評者的得分之下（或至多和他的得分一樣），另有75%人數的得分比他要好。以此類推。

（4）劃界分。在積極心理測評工具中，特別是某些用于特殊人群的測評工具，由于其樣本常常不是正態分布，不具備制定標準分常模的條件，而多采用劃界分常模。劃界分是指用一具體量數，對評定結果進行劃界。

除上述常模形式外，還有其他性質的常模，例如年齡常模（按年齡分組建立、在兒童和老年人量表中常用），區域常模和各種疾病診斷常模，等等。從可比性來看，常模越特異越有效；從適應性來講，則通用常模使用更方便。

3．信度（reliability）

信度是指測驗或量表的一致性、穩定性及可靠性，一般多以內部一致性來加以表示該測驗信度的高低。信度分析的常用具體方法有重測信度、復本信度、分半信度、信度系數法四種（后兩種可歸為內部一致性信度）。

（1）重測信度（test-retest reliabilty）：同一組受測者在兩次不同時間作同一套量表評定，對兩次結果作相關性檢驗，以評估量表結果的穩定性。重測信度所考查的誤差來源是時間的變化所帶來的隨機影響。在評估重測信度時，必須注意重測間隔的時間。重測信度的時間間隔的選擇存在兩難問題：縮短兩次測試的時間間隔，受測者較容易回憶出測試的題目；而延長兩次測試的時間間隔，則受測者較容易受外部影響而變化（風笑天，2006）。一般情況而言，重測間隔在兩周到6個月之間比較合適。

（2）分半信度（split-half reliability）：將一套量表的各項目按奇、偶數號分成兩半，對其評定結果進行相關性檢驗。

（3）同質性信度（inter-item consistency）：所謂同質性信度是指評定量表內部所有項目間的一致性，這里講的是分數的一致，而不是項目內容或形式的一致。量表內各項目分數相關越高，則量表項目就越同質。另外，分半相關法也是估計同質性信度的一種方法。

（4）評定者信度（inter-rater reliability）：數名不同評定者采用同一套量表對相同受評者進行評定，對所得結果進行一致性檢驗，以評估評定量表評分的客觀性。對心理測驗而言，一般都采用客觀性項目，且有一套相當標準化的評分程序，因此由評分引起的誤差變異是可以忽略的。而評定量表相當多的是主觀項目，且評定者在評分時或多或少摻雜主觀判斷成分，故評定者之間的評分誤差變異難以避免。一般要求在成對的受過訓練的評定者之間平均相關系數達到0.9以上，才認為評分是客觀的。

除以上指標外，還有正復本相關、因素信度、測量標準誤等信度檢驗方法。

4．效度（validity）

效度即有效性，指一個測量工具能夠準確測查出所要測量的變量的程度。積極心理測評工具的效度檢驗方法與心理測驗一樣，分為三類，即內容效度（content-related validation）、效標效度（criterion-related validation）和結構效度（construct-related validation）。

（1）內容效度，又稱表面效度，指量表項目反映所測量內容的程度。內容效度評估方法有專家判斷法、統計分析法（評分者信度、復本信度、折半信度、再測法）和經驗推測法（實驗檢驗）。

（2）效標效度，是指一個量表對處于特定情境中的個體的行為進行預測的有效性，也就是對于我們所感興趣的行為能夠預測的程度。檢驗實證效度一般是將量表評定結果與某一標準行為（即效標）進行相關檢查。如將個體的抑郁量表與抑郁癥病人的臨床典型癥狀、診斷性量表與臨床診斷進行相關分析。如果二者相關程度（或一致性程度）高，則說明效標效度理想；反之認為效標效度不理想。

（3）結構效度，又稱構想效度，反映編制的量表所依據理論的程度。如編制一個心理彈性量表，必定依據有關的心理彈性理論。同時，所編制的量表是否符合原來預計的理論框架，也可用結構效度來檢驗。

量表的效度研究，不管是在量表編制過程中，還是編制之后都要持續地進行，并且是一項長期的、永無止境的工作。量表的效度材料越豐富，對量表的功能認識就越全面。

5．方法的標準化

積極心理測評工具必須按一定的規則實施，其記分方法和方式、分級的標準、結果的換算也要按一定的規則進行，只有這樣，評定結果才具有較高的真實性。

積極心理測評工具的標準化特征，并不是每個測評工具都要像標準化測驗那樣應全部具備，有的量表可能多一些，標準化程度要高一些；有的可能少些，標準化程度就不那么好。至于每個具體量表做了哪些標準化工作，如常模樣本、施測方法、信度和效度資料，都應盡可能詳細地在使用手冊上說明。

二、積極心理測評工具的選擇與評價標準

借鑒Riezen和Segal（1988）提出的一整套評價量表的原則，我們認為積極心理測評工具的選擇與評價標準主要包括以下幾個方面。

1．量表的功效

量表的功效是指所使用的量表能夠全面、清晰地反映所要評定的內容特征和真實性的程度。有的量表可評定多個方面的特質，而另一些量表則只限于評定1~2種特質。有的量表適用于所有年齡和各種類型的人群，而另一些量表可能只限于某一年齡階段或某一特殊人群。質量好的量表應該對項目描述具體、清晰，等級劃分合理，定義明確，以反映出心理行為的細微變化。出現的頻度或嚴重程度分極最好采用3~7級劃分。量表應盡可能簡短，又不損失必要的細節。

2．敏感性

敏感性是指選擇的量表應該對所評定的內容敏感，即能測出受評者某種特質、行為或程度上的有意義的變化。量表的敏感性既與量表的項目數量和結果表達形式（如因子分）有關，又受量表的標準化程度和信度高低影響。此外，評定者的經驗和使用量表的動機也影響量表的敏感性。

3．簡便性

簡便性是指所選擇的量表應盡量簡明、省時和方便實施。然而實際上，量表簡短、省時就難以做到全面。使用者不加訓練和采用非標準化方法就會降低量表的信度，影響結果的可靠性。幾個量表同時配合使用，能彌補單一量表這方面的缺陷。

4．可分析性

使用量表的目的就是要對測評對象的特質、行為或現象作質與量的評價。一般而言，量表應具有其比較標準，或者是常模，或者是描述性標準。量表中單項分、因子分及總分都是常用分析指標，總分常反映受評者總的情況和變化；而單項分、因子分則是分析這些方面變化的主要指標。把單項分或因子分畫成曲線或構成廓圖，受評者的某方面心理特質、行為特征或社會背景情況等特點會更直觀、清晰。

參考文獻

1．汪向東，王希林，馬弘，1999．心理衛生評定量表手冊（增訂版）[J]．中國心理衛生雜志社．

2．風笑天，2006．社會研究方法（第一版）．北京：高等教育出版社．

3. Riezen H. V. & Segal M, 1988. Comparative Evaluation of Rating Scales for Clinical Psychopharmacology[M]. Elsevier.

官术网_书友最值得收藏!

中國積極心理測評手冊

緒論