龙虾捕鱼游戏

書名：應用心理碩士（MAP）考試專用教材
作者名：圣才電子書
本章字數(shù)： 29350字
更新時間： 2020-10-27 14:39:01

第2章　心理學的研究方法

一、實驗法

（一）定義

實驗法是指通過人為地、系統(tǒng)地操縱環(huán)境，導致某些行為發(fā)生變化，并對之進行觀察、記錄和解釋的科學方法。

（二）特點

1．帶著特定的實驗目的；

2．實驗者設置的實驗條件為他的觀察創(chuàng)造了最好的條件；

3．實驗者設定了明確的實驗條件，其他研究者可以重復實驗，對他的結果做獨立的檢驗；

4．實驗者可以合理控制實驗條件，判斷實驗結果是否由此條件引起。

（三）變量與控制

1．變量與控制

變量是指在實驗中呈現(xiàn)給被試的數(shù)量上或質量上可變的刺激信息。實驗中的變量可以分為自變量、因變量和額外變量。操縱或控制變量，人為地創(chuàng)設一定的情境，這是實驗法的顯著特征。

（1）自變量的種類與控制

自變量即刺激變量，是由主試選擇、控制的變量決定著行為或心理的變化。

①自變量的種類

a．刺激特點自變量；

b．環(huán)境特點自變量；

c．被試特點自變量；

d．暫時造成的被試差別。

②對自變量的操作

主要分為以下幾個步驟：

a．對自變量下操作定義

第一是抽象定義，指對研究變量或指標本質的概括，以揭示其內涵，并將其與其他變量或指標區(qū)別開來；

第二是操作性定義，指用可感知、度量的事物、事件、現(xiàn)象和方法對變量或指標做出具體的界定、說明。

b．規(guī)定操作性定義的好處

第一，使研究者的思路具體而清晰；

第二，增進科學研究者之間溝通的正確性；

第三，可減少一門學科所用概念或變量的數(shù)目。

c．設計操作定義常見的方法

第一，方法與程序描述法，即通過特定的方法或操作程序給變量或指標下定義的一種方法；

第二，靜態(tài)特征描述法，即通過描述客體或事物所具有的靜態(tài)特征給變量下定義的一種方法；

第三，動態(tài)特征描述法，即通過描述客體或事物所具有的動態(tài)特征給變量下定義的一種方法。

d．確定自變量的各個水平

第一，因素型實驗的自變量一般不超過4個水平，并應盡量使自變量變化范圍（全距）較大，各個水平在全距上分布平均；

第二，函數(shù)型實驗的自變量水平需要更多，如果預期實驗考察的是線性函數(shù)關系，可以取3～5個水平，各水平平均分布即可；如果是關于更復雜函數(shù)關系的，則至少需要5個水平，如符合對數(shù)函數(shù)關系，則各水平間的間距應按對數(shù)單位變化。

（2）因變量的種類與控制

因變量即被試的反應變量，它是自變量造成的結果，是主試觀察或測量的行為變量。

①因變量的種類

對于實驗研究來講，因變量的種類是很多的，也是很復雜的。一般而言，對于因變量的測量有客觀指標也有主觀指標。

因變量的客觀指標主要有以下幾種：

a．反應速度；

b．反應速度的差異；

c．反應的正確性；

d．反應標準；

e．反應的難度。

因變量的主觀指標主要是指被試的口語記錄。

②因變量的控制

因變量的控制主要著眼于如何精確客觀地記錄下它的變化。一般而言，有幾種主要方法可以用于因變量的控制。

a．反應控制

b．選擇恰當?shù)囊蜃兞恐笜?/p>

恰當?shù)囊蜃兞恐笜吮仨殱M足以下標準：

第一，有效性；

第二，客觀性；

第三，數(shù)量化。

c．避免量程限制

（3）額外變量及其控制

額外變量就是指與實驗目的無關，但又對被試的反應有一定影響的變量，在實驗中應該進行控制。

①額外變量的種類

a．系統(tǒng)的額外變量；

b．隨機的額外變量。

心理學實驗中最典型的額外變量：

a．實驗者效應

主試在實驗中可能以某種方式（如表情、手勢、語氣等）有意無意地影響被試，使他們的反應附和主試的期望，這種現(xiàn)象稱為實驗者效應。

b．要求特征

在心理學實驗中，被試總是以某種動機、態(tài)度來對待實驗，因而實驗結果在很大程度上也依賴于被試對實驗的態(tài)度。因此被試會很有可能自發(fā)地對主試的實驗目的產生一個假設或猜想，然后再以一種自以為能滿足這一假想的實驗目的的方式進行反應，這種現(xiàn)象稱為要求特征。

②額外變量的控制

對部分被試變量及暫時被試變量的控制方法，可從指導語、主試對被試的態(tài)度等方面來考慮。對環(huán)境變量及部分被試變量的控制方法主要有以下幾種：

a．排除法；

b．恒定法；

c．匹配法；

d．隨機化法和抵消平衡法；

e．統(tǒng)計控制法；

f．無關變量的納入。

2．實驗的信度和效度

（1）實驗研究的信度

實驗信度是指實驗結論的可靠性和前后一致性程度。

①影響實驗信度的因素

a．觀察量：觀察量越大，人們就越有理由相信樣本統(tǒng)計值接近總體參數(shù)值，也就是樣本更能夠代表其所在的總體。

b．對結果的統(tǒng)計檢驗：若不同實驗條件下所得出的結果之間差異很大，且這種差異由偶然因素造成的概率低于0.05，則可以排除偶然因素造成實驗結果的可能性，認為該結果是由自變量造成的。

②實驗信度的驗證

為保證實驗信度，應鼓勵研究者進行驗證性實驗，這樣即使推斷統(tǒng)計顯示仍存在犯錯誤的可能，實驗結果也是可信的。實驗信度的驗證有以下三種方法：

a．直接驗證，指在盡可能保持原實驗方法的情況下在實際中重復實驗。

b．系統(tǒng)驗證，指實驗者試圖變化那種先前被認為與實驗結果不相關的因素，即在實驗中引入原來未加控制的變量進行驗證。若原始實驗中發(fā)現(xiàn)的某種現(xiàn)象是真的，那么盡管重做時其中一些因素發(fā)生了變化，原來的實驗結果應該仍然會出現(xiàn)。若重做時原始實驗的結果不再產生，那么研究者就在他的實驗中發(fā)現(xiàn)了重要的邊界條件。

c．概念驗證，指研究者試圖驗證一個現(xiàn)象，但在某種程度上又與原先的實驗有很大的不同，其目的也在于描述某一心理現(xiàn)象的邊界條件。

直接驗證的目的是能否在第二次得到相同的結果，而系統(tǒng)驗證和概念驗證的目的是描述某一心理現(xiàn)象的邊界條件。邊界條件是指保證某一實驗結果出現(xiàn)的條件，超過這一條件，則該實驗結果不會出現(xiàn)。

2．實驗研究的效度

（1）實驗效度的定義

實驗效度是指實驗方法能達到實驗目的的程度，也就是實驗結果的準確性和有效性程度。實驗效度主要包括內部效度和外部效度。這兩者的前提是實驗具有良好的構思效度，即研究題目的來源具有一定的重要性和獨特性，對實驗研究中的自變量和因變量給出嚴格的操作定義，并對自變量的操作水平和因變量的測量指標做出明確的界定。

（2）內部效度

①內部效度的定義

實驗的內部效度是指實驗中的自變量與因變量之間因果關系的明確程度。如果在實驗中，當自變量發(fā)生變化時因變量隨之發(fā)生改變，而自變量恒定時因變量則不發(fā)生變化，也就是說確實是自變量而不是其他因素引起了因變量的變化，那么這個實驗就具有較高的內部效度。由此可知，內部效度與無關變量的控制有關。當實驗中未得到控制的無關變量越多時，因變量的變化不是由自變量引起的可能性就越大，實驗的內部效度就越低。當實驗結果未受到任何其他變量的干擾，自變量與因變量的因果關系明確時，實驗的內部效度就是高的。

②內部效度的影響因素

a．主試－被試間的相互作用：主要指要求特征和實驗者效應。心理學實驗中，有效消除主試—被試間不恰當?shù)南嗷プ饔玫耐ㄓ檬侄问请p盲實驗法。即主試和被試都不清楚實驗的具體目的，因而可最大程度地避免主試的暗示和被試的順從。

b．統(tǒng)計回歸：即測量分數(shù)向常態(tài)分布的平均數(shù)回歸。為避免統(tǒng)計回歸對實驗效度的影響，通常建議實驗者在匹配被試時必須考慮兩組被試本身是否同質。如果不同質，就必須以幾組被試各自的相對水平進行匹配。此外，利用統(tǒng)計控制進行協(xié)方差分析，在某種程度上也能降低統(tǒng)計回歸對實驗效度的影響。

c．其他影響內部效度的因素：包括被試某些固有和習得的差異，如性別、年齡等；被試選擇的偏差；在一些長期實驗中被試的流失，個體本身的生長和成熟因素。

為避免這些因素對內部效度的影響，在對被試進行分組時，應隨機選取和隨機分配被試；另外，還可以增設控制組，解決由于實驗程序本身、控制方式的不一致以及測量程度的變化對實驗內部效度的影響。

③零結果對內部效度問題的提示

a．零結果是指在一項實驗研究中，由于上述種種原因造成了嚴重的混淆，導致自變量的操縱和變化沒有引起因變量相應的變化的現(xiàn)象。若零結果不是真正意義上說明自變量和因變量毫無關系，那么就必然提示了實驗的內部效度存在大問題。

b．一般來講，要在以下幾方面尋找原因以改進實驗的內部效度。一是自變量的操縱是否有效；二是因變量的測量是否充分；三是額外變量是否得到有效控制。

④內部效度的特例——統(tǒng)計結論效度

a．實驗研究的統(tǒng)計結論效度是指有關決定實驗處理效應的數(shù)據(jù)分析程序的有效性和準確性，涉及到研究誤差的變異來源和如何恰當運用統(tǒng)計顯著性檢驗的問題。

b．它取決于兩方面條件：

一是數(shù)據(jù)的質量，二是統(tǒng)計檢驗的假設。

（3）外部效度

實驗的外部效度是指實驗結果能夠普遍推論到樣本的總體和其他同類現(xiàn)象中去的程度，即實驗結果的普遍代表性和適用性，研究者也將之稱為生態(tài)效度。實驗外部效度的影響因素主要有以下幾個方面：

①實驗環(huán)境的人為性；

②被試樣本缺乏代表性；

③測量工具的局限性。

（4）內部效度與外部效度的關系

實驗的內部效度和外部效度是相互聯(lián)系、相互影響的。實驗的內部效度越高，其結果就越能確認是由實驗處理所造成的；而實驗的外部效度越高，其結果的可推論范圍就越大。在一項實驗中，研究者通常會在保證內部效度的前提下，采取適當措施以提高外部效度。

3．信度和效度的關系

信度是效度的必要非充分條件。即信度低，效度不可能高；信度高，效度未必高；效度低，信度可能高；效度高，信度必然高。

實驗研究的效度和信度是相互聯(lián)系、相互影響的，良好的效度和信度是評價實驗設計成功與否的關鍵，而雄厚的理論基礎、周密的思考和設計、謹慎科學的態(tài)度則是達到實驗效度和信度的必備素質。

（三）反應時法

1．反應時的含義

（1）反應時是心理學研究中最重要的反應變量和指標之一，是指刺激作用于有機體后到明顯反應開始時所需要的時間，即刺激與反應之間的時間間隔。它包含以下幾個時段：

①第一時段，刺激使感受器產生了興奮，其沖動傳遞到感覺神經元的時間；

②第二時段，神經沖動經感覺神經傳至大腦皮質的感覺中樞和運動中樞，從那里經運動神經到效應器官的時間；

③第三時段，效應器官接受沖動后開始效應活動的時間。

以上三個時段的總和即是反應時間。反應時為心理學家觀察心理操作打開了一個窗口。

（2）反應時的研究意義

反應時是心理學研究中最重要的反應變量和指標之一，使用反應時作為指標的實驗研究，曾對解決心理學理論問題和生活實際問題起到相當大的作用。反應時研究，幾乎奠定了當代認知心理學的方法論基礎。它對認知心理學和實驗心理學的貢獻都是巨大的。

①反應時間是一種反應變量，它可以作為成就的指標及內部過程復雜程度的指標。對一件工作越熟悉，反應時間就越快；內部過程越復雜，反應時間就越長。反應時間隨多種原因而變化，因此它可以作為一個很方便的反應變量來運用。由于這些原因，反應時的研究就在實驗心理學的研究中占有很重要的地位。

②心理實驗中常用速度作為反應變量，這個速度稱作反應的時間，而反應時只是它的基本成分和最簡單的例子。

速度包括兩方面的內容：做一定的工作所需要的時間；在一定的時間之內所完成的工作。這兩種情況都是測量工作速度。速度之所以能夠成為一個有用的量數(shù)，是因為每個動作都需要時間，而時間是可以測量的。速度可以作為成就的指標，對一件工作完全精通，就會做得很快。速度也可以作為內部過程復雜程度的指標，內部過程越復雜，所需要的時間就越多。因而測量反應的時間，即執(zhí)行反應的時間就成了很重要的工作，而反應時，就是測量反應的時間中最簡單的例子。

（3）反應時研究的歷史發(fā)展

反應時的實驗已有100多年的歷史，反應時在心理學中的研究歷史分為以下兩個階段：

①唐德斯反應時ABC時期

a．1850年，赫爾姆霍茨等關于青蛙運動神經傳導速度的測定標志著反應時研究的開始。他發(fā)現(xiàn)刺激離大腦近的皮膚，反應時要短，刺激身體的各個部位反應時變動很大。

b．天文學研究提出了著名的人差方程，它反映了兩個觀察者之間的個體差異。這一發(fā)現(xiàn)引起了天文學家經久不衰的興趣。此后，他們確定了不同觀測者的人差方程式及其校正方法。

c．荷蘭生理學家唐德斯將反應時正式引入心理學領域，赫爾姆霍茨測定神經傳導速度的研究使他意識到可以利用反應時來測量各種心理活動所需的時間，并發(fā)展了三種反應時任務，后人將它們稱為唐德斯反應時ABC（Donders ABC of reaction time）。

d．1873年，厄克斯奈指出準備定勢在反應時測量中的作用并首先提出“反應時間”這個名詞。

現(xiàn)代心理學家把自1850年赫爾姆霍茨的研究至1969年長達一百多年的時間稱之為唐德斯反應時ABC時期。這是反應時研究的第一階段，這一階段方法學的核心是減數(shù)法。

②1969年心理學家斯騰伯格提出加因素法之后，反應時研究進入第二階段，開始了反應時研究的新時期。

這種方法假定，完成一個作業(yè)所需的時間是一系列信息加工階段分別所需時間的總和，如果兩個因素的效應是相互制約的，即一個因素的效應可影響另一因素的效應，那么這兩個因素只作用于同一個信息加工階段；如果兩個因素的效應是分別獨立的即可相加，那么這兩個因素各自作用于某一特定的加工階段。

2．反應時的種類

（1）簡單反應時

①簡單反應時是指給被試以單一的刺激，只要求作單一的反應，這時刺激顯現(xiàn)與被試做出反應之間的時距就稱為簡單反應時。

②簡單反應時實驗中被試的工作很簡單。他預先知道刺激是什么以及他要做的反應是什么。

（2）復雜反應時

復雜反應時包括選擇反應時與辨別反應時，選擇反應時又稱B反應時，辨別反應時又稱C反應時。

①選擇反應時實驗中，給被試呈現(xiàn)幾種不同的刺激，要求被試做出幾種相應的反應。

②辨別反應時是指被試對所呈現(xiàn)的多個刺激當中的某一個刺激（由主試確定）進行反應，而對其余的刺激不進行反應。

三種反應時的時間長短不一，簡單反應時最短，辨別反應時稍長些，選擇反應時最長。

（3）上述三種反應時的分類模式是反應時早期研究的基本模式，有不少學者不同意這種分類方式，認為A、B、C三種反應時不能簡單相加，即C反應時不是在A反應時上簡單相加分辨時間，B反應時也不是在C反應時上簡單加上選擇時間，三者之間不存在簡單相加關系。但自19世紀60年代至20世紀60年代這一百多年的時間里，在應用反應時作指標的研究中一直遵照這種反應模式。

3．反應時的影響因素

反應時受到刺激變量和機體變量的影響。

（1）外部因素

①反應時與刺激強度有關。這里所指的刺激強度除了刺激的物理強度外，還包括與物理刺激有關的心理強度。受刺激強度影響一般的情況是，當刺激強度很弱時，反應時就會延長；而當刺激增至中等或較高強度時，反應時就縮短了。但是反應時的縮短會受到有機體結構的限制，無法突破某一極限。

②反應時間與刺激的時間特性以及空間特性有關。當物理刺激的強度本身保持不變，而增加作用于感官的時間，即造成時間的累積作用，這樣便會增加刺激的心理強度。

如果物理刺激強度保持不變，刺激的時間也保持不變，僅增加刺激的面積時，由于感受器神經興奮的空間累積的作用，也會增加刺激的心理強度。

③反應時間與所刺激的感覺器官有關。不僅不同的感覺器官的反應時不相同，而且同一感覺器官受到不同刺激物刺激，其反應時間也不同，甚至同一刺激作用于同一感覺器官的不同部位，其反應時間也不同。

（2）機體因素

簡單—復雜反應時任務的區(qū)別以及速度—準確性權衡，是影響反應時的兩個最基本因素。除此之外，影響反應時的機體變量還有適應水平、被試的準備狀態(tài)、動機、年齡、練習和個體差異等。

4．反應時技術

反應時技術是用反應時分析信息加工過程的技術方法，反應時技術在認知心理學的研究中具有十分重要的地位，是現(xiàn)代認知心理學實驗室研究中最廣泛使用的手段之一。

（1）減法反應時技術

減法反應時技術即減法法，又稱減數(shù)法、唐德斯反應時ABC或唐德斯三成分說，是一種用減法方法將反應時分解成各個成分，然后來分析信息加工過程的方法。

①減法法的基本邏輯思想

在安排兩種或兩種以上的反應時作業(yè)中，其中一個作業(yè)包含有另一個作業(yè)所沒有的加工階段，而其他方面則相同，從這兩種作業(yè)的反應時差異即可判斷那個特有的加工階段所需要的時間。簡單反應時、辨別反應時和選擇反應時的差異可歸結為辨別過程、選擇過程所需要的時間和基本的時間——即簡單反應時間三者都相同。該方法可從測得的總反應時間中，分析出研究者感興趣的過程，這一過程可通過設計不同的任務，插入或刪去一個加工階段、不改變其他加工階段來實現(xiàn)，原則上連續(xù)相減可獲得每個加工階段的持續(xù)時間。

該方法要求實驗者對實驗任務引起的刺激與反應之間的一系列心理過程有精確的認識，并要求在相減的兩種反應時作業(yè)中有嚴格的相同或匹配的部分。

只有滿足上述兩點，才能應用減法法對信息加工過程進行分析。

②對減法法的評價

減法法的兩個要求有時不能得到滿足，復雜的信息加工過程難以區(qū)分出不同的加工階段，有時不同作業(yè)的匹配也難以做到，這使其在心理學研究中的應用受到一定的限制。盡管如此，在認知心理學中，分析信息加工過程還是經常應用減法法來提出很多信息加工過程的分析和一些新的理論構思。

（2）加法反應時技術

加法反應時技術即加法法，是加因素法的簡稱，由斯騰伯格提出，該方法是減法法的發(fā)展和延伸，與減法法是同一個問題的兩個不同側面。

①該方法的邏輯

如果兩個因素的效應相互制約，即一個因素的效應可以改變另一個因素的效應，那么這兩個因素只作用于同一個信息加工階段；如果兩個因素的效應分別獨立，那么這兩個因素各自作用于不同的信息加工階段。如果事先可以發(fā)現(xiàn)或觀察到完成作業(yè)所需時間的一些因素，通過單獨地或成對地應用這些因素進行實驗，就可以將各因素所需時間相加，從完成各階段的時間變化來確定這一信息加工過程的各個階段以及所需要的時間總和。

②加法反應時應用的前提

加法法是以信息的加工方式是系列加工而不是平行加工為前提的，如果這一前提不能得到滿足，就不能應用加法法。

③對加法法的評價

兩個因素可能以相加的方式對同一個加工階段起作用，也可能對不同的加工階段起作用，并且相互發(fā)生影響，這兩種情況目前尚不能排除，這也使加法法的應用受到限制。

（3）開窗技術

①含義

Hockey等發(fā)展了一種新的反應時實驗技術即“開窗”實驗。開窗實驗能夠比較直接地測量每個加工階段的時間，并且能比較明顯地看出這些加工階段，這是反應時實驗的一種新形式，他們以一種字母轉換實驗來說明這種新實驗技術，其優(yōu)點是能夠比較直接地測量每個加工階段的時間以及這些加工階段是什么。

②研究舉例

實驗過程：給被試呈現(xiàn)1～4個字母并在后面標上一個數(shù)字，例如“F+3”、“KENC+4”等，四個字母一個個相繼呈現(xiàn)，由被試自行按鍵控制，當呈現(xiàn)“F+3”時要求被試念出字母表上F后面第三個字母（應為I）。同理“KENC+4”呈現(xiàn)后被試的反應應為“OIRG”，因為K后第四個字母為O，E后第四個字母為I，N后第四個字母為R，C后第四個字母為G，其他類同。通過分析反應時數(shù)據(jù)，明顯可看出字母轉換作業(yè)的三個加工階段。

在四個刺激字母實驗里，可以獲得12個數(shù)據(jù)，從中可以看到完成字母轉換的整個過程和所有加工階段。通過對數(shù)據(jù)歸類處理后可得到總的結果。

根據(jù)該實驗的反應時數(shù)據(jù)，可以清楚地看出，完成字母轉換作業(yè)的3個加工階段分別為：

a．編碼階段，即從被試按鍵看到一個字母到開始出聲轉換所用的時間。在這一階段中，被試對所看到的字母進行編碼并在記憶中找到該字母在字母表中的位置；

b．轉換階段，即轉換所用的時間；

c．貯存階段，即從前一個字母轉換結束到按鍵看下一個字母的時間，在此階段中，被試將轉換結果貯存于記憶中，而且從第二個字母開始，還需將前面的轉換結果加以歸并和復述。

“開窗”實驗通過對字母轉換作業(yè)的分析，可把每一種認知加工成分所經歷的時間都比較直接地估計出來。

（4）內隱聯(lián)想測驗

①含義

內隱聯(lián)想測驗由格林沃爾德在1998年提出。它是以反應時為指標，通過一種計算機化的分類任務來測量兩類詞（概念詞與屬性詞）之間的自動化聯(lián)系的緊密程度，繼而對個體的內隱態(tài)度等內隱社會認知進行測量的。

②基本邏輯

a．依據(jù)唐德斯減數(shù)法的原理，反應時的不同階段對應著不同的加工過程，反應時越長,心理加工過程越復雜。

b．在社會認知研究中，由于所呈現(xiàn)的刺激多具有復雜的社會意義，刺激所暗含的社會意義不同，被試的加工過程的復雜程度就會不同，從而反應時的長短也會不同。相容任務中，概念詞和屬性詞的關系與被試的內隱態(tài)度一致或二者聯(lián)系較緊密，此時辨別任務更多依賴自動化加工，因而反應時短；不相容任務中，概念詞和屬性詞的關系與被試的內隱態(tài)度不一致，這往往會導致被試的認知沖突，此時辨別任務更多依賴復雜的意識加工，因而反應時長。所以，兩種聯(lián)合任務的反應時之差可以作為概念詞和屬性詞的關系與被試的內隱態(tài)度相對一致性的指標。

c．內隱和外顯測試間的高相關表示內隱聯(lián)想測驗結構效度高。內隱聯(lián)想測驗效應與簡單反應時的相關應盡可能低。

③內隱聯(lián)想測驗的各種變式

a．Go/NO Go聯(lián)想測驗

在內隱聯(lián)想測驗中如果只使用反應時作為考察指標，可能忽略錯誤率所包含的信息；其次，只能考察被試對兩個對象的相對態(tài)度，而不能測量被試對某一對象的態(tài)度。Go/NO Go聯(lián)想測驗要求被試對一些刺激做出反應而忽視另外的刺激。對數(shù)據(jù)分析采用信號檢測論的方法，以辨別力指數(shù)d′為指標。

b．外在情感性西蒙任務

霍福爾設計了外在情感性西蒙任務（簡稱EAST）。

外在情感性西蒙任務與內隱聯(lián)想測驗最大的不同是：內隱聯(lián)想測驗效應的計算依賴于兩個聯(lián)合任務反應時均數(shù)之差，而外在情感性西蒙任務則是要比較被試在同一任務的不同實驗條件下的行為差異。

對于外在情感性西蒙任務而言，被試很難將任務的要求進行簡化或重新編碼；外在情感性西蒙任務的實驗設計能有效控制被試有意識重新編碼對內隱聯(lián)想測驗效應的影響；由于外在情感性西蒙任務只要求個體完成一個任務，從而有效避免了內隱聯(lián)想測驗中任務順序對內隱聯(lián)想測驗效果的影響。它可應用于對多個態(tài)度對象的評價。

（四）心理物理學方法

心理物理學方法主要用來揭示心理量與物理量之間的關系。心理物理學方法的先驅是費希納，傳統(tǒng)的心理物理法在心理學中得到了廣泛的應用，對實驗心理學的發(fā)展也產生了深遠的影響，后來的研究者在費希納提出的三種心理物理法的基礎上發(fā)展了很多心理物理法的范式。

1．傳統(tǒng)心理物理學

在《心理物理學綱要》一書中，費希納把心理物理學定義為一門精密的關于身體和心理之間函數(shù)依附關系的理論，其目標就是最終用精確的數(shù)學函數(shù)的形式來描述外部的物理刺激與由此而發(fā)生的感覺和知覺之間的定量關系。

感覺閾限，又稱閾限，是傳統(tǒng)心理物理學的核心概念。

（1）閾限的分類：

①絕對閾限，指剛好能夠引起心理感受的刺激大小；

②差別閾限，指剛好能引起差異感受的刺激變化量。

根據(jù)統(tǒng)計學原理，可以把閾限的操作定義設定為：有50％的實驗次數(shù)能引起反應的刺激值；同理，把差別閾限定義為有50％的實驗次數(shù)能引起差別感覺的兩個刺激強度之差。

（2）測量感覺閾限的方法：

①最小變化法

最小變化法又稱極限法、系列探索法或最小可覺差法。

其基本特點是刺激按強度的遞增序列和遞減序列交替的方法呈現(xiàn)，各序列的刺激由小到大或由大到小以小步階梯變化，探索從一類反應到另一類反應的轉折點或閾限值。在測定絕對感覺閾限時，首先須確定刺激的范圍，安排遞增或遞減的實驗程序，其結果是遞增系列的絕對閾限值和遞減系列的絕對閾限值的算術平均數(shù)：

最小變化法測定差別感覺閾限時，給被試呈現(xiàn)一個標準刺激（St），然后呈現(xiàn)比較刺激（Sv），按遞增及遞減系列呈現(xiàn)，讓被試判斷比較刺激比標準刺激“大些”、“小些”還是“相等”，最后得出被試的差別感覺閾限。采用最小變化法時，會產生由習慣和期望所引起的誤差，也會產生由練習及疲勞引起的誤差，通過改善實驗程序可以減少誤差，但不會完全消除。

②平均差誤法

平均差誤法（或均誤法）又稱調整法、再造法、均等法，是最古老且基本的心理物理學方法之一。雖然它最適用于測量絕對閾限和等值，但也可用以測量差別閾限。

平均差誤法的特點是呈現(xiàn)一個標準刺激，令被試再造、復制或調節(jié)一個比較刺激，使它與標準刺激相等。該方法是要求被試判斷什么時候比較刺激和標準刺激相等。被試判斷為與標準刺激相等的比較刺激，并不總是一個固定的數(shù)值，而是圍繞著一個平均數(shù)變化的一個數(shù)。這個變化的范圍就是不肯定間距。不肯定間距的中點就是主觀相等點。通過對主觀相等點和不肯定間距的測量，就可以估計差別閾限。

③恒定刺激法

恒定刺激法又稱次數(shù)法或正誤法。

其特點是在整個實驗中始終應用若干恒定的刺激量，并以隨機順序反復呈現(xiàn)這些刺激來測定絕對感覺閾限和差別感覺閾限。一般選用5-7個恒定的、從被試感覺不到至感覺到的等距刺激。每種強度的刺激隨機呈現(xiàn)，被試報告感覺到與否，然后根據(jù)各個刺激所引起的正、負反應的次數(shù)，運用一定的統(tǒng)計方法求出有50%次被感覺到的刺激值作為絕對感覺閾限值。在測定差別感覺閾限時，首先確定一個標準刺激和5-7個比較刺激，要求被試報告比較刺激比標準刺激“大”、“小”或“相等”，然后根據(jù)被試所做的各種反應次數(shù)，運用一定的統(tǒng)計方法求得差別感覺閾限。

此法雖然要求較大量的實驗次數(shù)，但每次實驗只用很短的時間，因此也比最小變化法節(jié)省時間，并且測得的閾限也更準確。

2．信號檢測論

信號檢測論又稱為信號偵察論、信號覺察論，是一種測量感受性的理論，它以感覺閾限作為測量感受性指標時，除感受性外，被試的主觀判定標準對感覺閾限是有影響作用的。信號檢測論則是要將兩者加以區(qū)分，用一條“接受者的操作特點曲線”代替閾限來測量感受性。

（1）信號檢測論的基本思想

信號檢測論認為，在感覺刺激時存在著兩個過程，一個是感覺過程，其反映了刺激的強度；另一個是隨之而來的獨立的判斷過程，其反映了被試的反應偏差。信號檢測論的測量，是將所要覺察的刺激或刺激的差別視為信號，將可能與信號相混淆的刺激視為噪音，將信號出現(xiàn)時報告說有信號時稱為擊中，將信號出現(xiàn)而報告無信號時稱為漏報，將信號未出現(xiàn)而報告無信號時稱為正確否定，將信號未出現(xiàn)而將噪音報告有信號稱為虛報，錯報比正確否定愈少，表明判斷標準愈高。在同等判斷標準下，虛報比擊中愈少，表明判斷力愈高。信號檢測論就是通過將被試者的辨別力，即感覺分辨力（d＇）和被試的反應偏差（β）的測定，把被試者的主觀態(tài)度、動機因素等產生的干擾作用從感受性中排除，從而得到比較準確的結果。

（2）接受者操作特性曲線

接受者操作特性曲線又稱為感受性曲線。得此名的原因在于曲線上各點反映著相同的感受性，它們都是對同一信號刺激的反應，只不過是在幾種不同的判定標準下所得的結果而已。接受者操作特性曲線就是以虛驚概率為橫軸、擊中概率為縱軸所組成的坐標圖，根據(jù)被試在特定刺激條件下由于采用不同的判斷標準得出的不同結果畫出的曲線。

二、觀察法

（一）觀察法的概念

觀察法是心理學研究中最基本、最普遍、歷史最悠久的方法之一。觀察是日常生活和科學研究中不可缺少的活動和手段。觀察法是研究者通過感官或借助于一定的科學儀器，在一定時間內有目的、有計劃地考察和描述人的各種心理活動和行為表現(xiàn)并收集研究資料的一種方法。

（二）觀察法的優(yōu)缺點

1．觀察法的優(yōu)點

（1）能動性

科學的觀察是具有能動性的感性認識活動，它與一般所說的觀察不同，不是簡單反射式的感覺，而是有目的、有意識的觀察與研究。這樣的觀察是自覺的，不是盲目的，是能動的，不是被動的。它要求觀察者充分發(fā)揮觀察中的主觀能動作用。

（2）選擇性

科學的觀察并不是一般地認識現(xiàn)象和事實，而是從大量客觀事實中，選擇觀察的典型對象，選擇典型條件、時間、地點，獲得典型事物的現(xiàn)象和過程。只有把注意力有意地集中和保持在經過選擇的觀察對象上，把觀察始終和有意注意結合在一起，不為無關現(xiàn)象所分散，盡量排除外界無關刺激的干擾，這樣的觀察才能獲得預期的成效。

（3）客觀性

觀察所獲得的事實材料是認識事物的依據(jù)，是科學研究的基礎。但是，這里有一個前提，即獲得事實材料的觀察是否具有客觀性的品質。觀察中獲得的結果，實際上是觀察者通過觀察手段對觀察對象的現(xiàn)象或過程的一種反映和描述。

2．觀察法的局限性

（1）人的生理局限

主要表現(xiàn)為：人的感官使觀察范圍受到局限。感官是有一定閾值的，超過一定的限度，就聽不到、看不到、感覺不到。人的感官也使觀察的精確度受到局限。這樣觀察常常就只局限于了解表面的現(xiàn)象，不能直接深入到事物的本質，難以分辨是偶然的事實還是有規(guī)律性的事實，這是觀察法最主要的局限。

（2）觀察儀器的局限

觀察儀器的認識功能也有其局限性，主要表現(xiàn)為：缺乏直觀性，間接觀察還不能完全取代直接觀察，儀器設計的錯誤或不精確，制作和操作儀器的誤差，都會導致觀察結果的錯誤，觀察儀器容易產生對觀察對象的干擾等等。

此外，觀察者對所獲材料的解釋，也往往容易受觀察水平的局限而帶上主觀色彩。

（三）觀察法的分類

1．自然觀察與實驗觀察

（1）自然觀察主張在自然發(fā)生的條件下，即在對觀察對象不加干預和控制的狀態(tài)下進行觀察，自然觀察能搜集到研究對象在日常生活中的真實、典型的行為表現(xiàn)，但研究者處于被動，難以揭示那些較少在自然狀態(tài)下表現(xiàn)出來的心理特點；

（2）實驗觀察則通過人為地改變和控制一定的條件，有目的地引起被研究對象的某些心理行為反應，進而在最有利的條件下進行觀察。實驗觀察能使研究者獲得更全面、更精確、更深入的事實和資料，但要求較高，難度較大。

2．直接觀察與間接觀察

直接觀察和間接觀察的區(qū)別在于前者通過人的感官進行直接觀察，后者則借助于各種儀器或裝置（如錄音機、錄像機、攝像儀、照相設備等）進行觀察和記錄。由于人類感官的局限和科學技術的進步，從憑借感官進行直接觀察到通過儀器作為中介來進行觀察，是觀察法發(fā)展的必然趨勢。

3．參與觀察與非參與觀察

（1）參與觀察即局內觀察，指觀察者參與到被觀察者的實際環(huán)境之中，并通過與被觀察者的共同活動從內部進行觀察。根據(jù)參與程度的不同，參與觀察可分為完全參與觀察和不完全參與觀察。

（2）非參與觀察即局外觀察，指觀察者完全以局外人或旁觀者的身份進行觀察。顯然，參與觀察能搜集到較為完整且具有深度的資料，但易帶主觀情感成分，而且比較費時、難度較大。

4．有結構觀察與無結構觀察

根據(jù)觀察內容是否有統(tǒng)一設計的、有一定結構的觀察項目和要求，觀察法可劃分為有結構觀察和無結構觀察。較之無結構觀察，有結構觀察能獲得大量確定、詳實的資料，并可進行定量和對比分析，但缺乏彈性，比較費時。

5．敘述觀察、取樣觀察與評價觀察

敘述觀察、取樣觀察與評價觀察是根據(jù)觀察內容是否連續(xù)完整以及觀察記錄方式的不同來劃分的。

（1）敘述觀察指詳細觀察和記錄被觀察對象連續(xù)、完整的心理活動和行為，日記描述法、軼事記錄法等屬于這種方法；

（2）取樣觀察指依據(jù)一定的標準選取被觀察對象的某些心理活動和行為表現(xiàn)來進行觀察，或選擇在特定的時間內進行觀察；

（3）評價觀察指按照事先制定好的評價量表進行觀察并作出評價。

四、觀察法的基本步驟

1．觀察準備，明確觀察目的、觀察重點和范圍、觀察的注意事項等。

2．進行實際觀察，如參觀、聽課、個別談話等。

3．進行觀察時必須注意的事項，如選擇最佳觀察位置、善于辨別重要的和無關的因素等。

4．觀察材料的記錄和整理。

三、個案法

個案法就是對某一個體或群體組織在較長時間內（幾個月、幾年乃至更長時間）連續(xù)進行調查、了解，收集全面的資料，從而研究其心理發(fā)展變化的全過程的方法。個案法有時會和其他方法（如觀察法、傳記法、測驗法等）配合使用，這樣可以收集更豐富的個人資料。用個案法研究兒童的心理發(fā)展，在現(xiàn)代心理學中曾起了重要的作用。

由于個案法限于使用少數(shù)案例，研究的結果可能只適合于個別情況，因此，在推廣運用這些結果或作出更概括的結論時，必須持謹慎的態(tài)度。一般地說，個案法常用于提出理論或假設，要進一步檢驗理論或假設，則有賴于其他方法的幫助。

四、心理測量

心理測量是心理學的重要研究方法。通過心理測量把心理特性量化，在社會生活、教育工作和理論研究中發(fā)揮著重要的功能。

（一）心理測量的基本概念

1．測量的含義

測量就是根據(jù)一定的法則用數(shù)字對事物加以確定。測量包含兩個要素，即參照點和單位。

（1）參照點是計算事物的量的起點。參照點有兩種：

①一種是絕對零點，如測量輕重、長短時使用的零點都是絕對零點，這個零點的意義為“無”，表示什么都測不到；

②另一種是人為確定的參照點，即相對零點，例如海拔高度，就是以海平面作為測量陸地高度的起點。理想的參照點是絕對零點，但心理測量中很難找到絕對零點，多采用人為標定的相對零點。

（2）單位是測量的基本要求，沒有單位無法進行測量。理想的單位需要具備兩個條件：有確定的意義和有相等的價值。一般來說，心理測量的單位不夠完善，既無統(tǒng)一的單位，也不符合等距的要求，還需要心理測量學家的進一步努力。

2．測量中量表的使用

由于制定量表的單位和參照點不同，量表的種類也不同。不同量表的精確度不一樣，如將測量水平從低級到高級排列，可分為4種測量水平，即命名量表水平、順序量表水平、等距量表水平和比例量表水平。

（1）命名量表是水平最低的一種測量量表，它只是用數(shù)字來代表事物或把事物歸類，沒有任何數(shù)量的意義。

（2）順序量表比命名量表精確，它不僅指明類別，還能指明不同類別的大小等級，或具有某種屬性的程度。在順序量表中，既無相等單位，又無絕對零點，數(shù)字僅表示等級。

（3）等距量表不僅有大小關系，而且有相等的單位。其數(shù)值可以相互做加、減運算，但沒有絕對的零點，因此不能做乘、除運算。

（4）比例量表是最高水平的量表，既有相等單位又有絕對零點。但在心理測量中，由于難以找到有意義的零點，因此大多數(shù)采用等距量表。

3．心理測量的含義

（1）心理測量，就是根據(jù)一定的法則用數(shù)字對人的行為加以確定，即根據(jù)一定的心理學理論，使用一定的操作程序，給人的行為確定出一種數(shù)量化的價值。

（2）心理測量與測驗的關系體現(xiàn)在：

（1）測驗是心理測量的一種工具和手段，是根據(jù)一定法則對人的行為用數(shù)字加以確定的方法。

（2）心理測量則是把測驗做為工具來運用，以達到了解人類心理的實踐活動。心理測量測的是人的行為，嚴格地說，是一個人對測量題目所進行的反應。一個測量不可能包含所要測量的行為領域的所有可能的題目，它所包含的只是全部可能題目的一個樣本。另外，在編制、施測、評分和解釋方面要依據(jù)一套系統(tǒng)的程序。這種按照嚴格的科學程序編制和使用的測驗稱為標準化測驗。標準化有3點好處：

①可以減少無關因素對測驗目的的影響，使測量準確、客觀；

②有統(tǒng)一標準，便于對不同人的測驗成績進行比較和交流；

③同一份測驗可用于許多人并可反復使用，較為經濟。

一般來說，心理測量是在順序量表上進行的。但通過統(tǒng)計方法，可以把測量數(shù)據(jù)轉換為等距數(shù)據(jù)。

4．心理測量的特性

（1）心理測量的間接性

研究者無法直接測量人的心理，只能測量人的外顯行為，也就是說，只能通過一個人對測量題目的反應來推論他的心理特質。

（2）心理測量的相對性

在對人的行為做比較時，沒有絕對的標準，也就是沒有絕對的零點，有的只是一個連續(xù)的行為序列。所謂測量就是看每個人處在這個序列的什么位置上。

（3）心理測量的客觀性

測量的客觀性實際就是測量的標準化問題。經過長期努力，測量的標準化有了很大改進。首先，測量用的題目或作業(yè)、施測說明、施測者的言語態(tài)度及施測時的物理環(huán)境等均經過了標準化。其次，評分記分的原則和手續(xù)經過了標準化。最后，分數(shù)的轉換和解釋都經過了標準化。

（二）心理測驗的信效度

1．信度

心理測驗的信度是指測驗結果的可靠性或一致性，亦即多次測驗分數(shù)的穩(wěn)定、一致程度。它既包括時間上的一致性，也包括內容和不同評分者之間的一致性。常用的估計信度的方法有重測信度、復本信度、分半信度和評分者信度。

2．效度

心理測驗的效度是指測驗的有效性或準確性，亦即測驗能夠測量出其所欲測量的心理特性的程度。效度越高則表示該測驗結果所能代表要測量行為的真實度越高，能夠達到所要測量的目的。對于一個標準測驗來說，效度比信度更為重要。一般將效度分為內容效度、構想效度和實證效度。

（三）心理測驗的標準化

1．測驗標準化的含義

測驗標準化是指測驗的編制、實施、記分以及測驗分數(shù)解釋程序的一致性。如果把心理測量定義為應用法則給與人有關的心理結構指派相應的數(shù)字，那么標準化就是這些法則的決定因素并使其明確化。沒有標準化，測量僅是一種非正式的過程，它隨施測者的不同而變化。

2．測驗標準化的內容

（1）內容標準化

給所有被試實施相同的一組測題，即給所有被試實施相同內容的刺激（處理），這樣對被試的行為或反應才能進行比較。另外要使測量的物理特性保持一致，這就要求在編制測驗時，測題的印刷和成批生產的器具能保證物理特性上的一致，而使測驗條件保持一致，使測驗結果更可靠。

（2）實施標準化

只有對所有的被試都使用相同的測題，并且是在相同的條件下進行測驗，他們的分數(shù)才能進行比較。標準實施主要包括：

①統(tǒng)一的指導語，指導語有兩個方面，一種是對被試的，另一種是對主試的。對被試的指導語應盡量做到清晰，應簡單扼要地向被試解釋應如何對測題作出反應，如果測題的格式對于被試是生疏的，應舉出一個例題。對主試的指導語包含對測驗細節(jié)的進一步解釋，也包含著其他有關事情的交代。如熟悉測驗、測驗的場所安排、測驗材料的分配、計時和記分，還包含假如在測驗進行中途出現(xiàn)問題或其他意外事件時應該如何處理的指示。

②統(tǒng)一的施測時間。測驗的時限是測驗程序中的一個重要方面，一般每一測驗都要求被試在一定的時間內完成。大多數(shù)人格測驗在實施時不受時間限制，但速度測驗的目的是測量作業(yè)的快慢，所以測驗的時間要求相當嚴格，一般在測驗時限內，作業(yè)最快的被試也不能把測驗全部做完。施測時要注意按指導語要求準確計時。難度測驗在理論上不應有時間的限制，但在實際使用時為避免個別被試過分拖延測驗時間，仍有一定的時間限制，但一般足以使90%以上的被試能在規(guī)定時間內做完全部測驗。

（3）客觀記分。它意指在兩個或兩個以上有能力的記分者之間有一致性。不同記分者之間取得完全的一致似乎是最理想的。但實際上對主觀題即論文式的測題進行評分時，很難完全一致。一般認為在成對的受過訓練的記分者之間平均一致性達到90%以上，就認為記分是客觀的。只有保證記分是客觀的，才能夠把分數(shù)的差異歸于被試的差異。客觀記分可歸納為三個要點：對反應要及時和清楚地記錄；應用標準反應表即記分鍵作為對照加以評分；將被試的反應與標準反應表進行比較。

（4）分數(shù)解釋標準化

從某個測驗中得出的單個分數(shù)往往并不能說明什么問題，只有把這個分數(shù)與常模進行比較，才能對測驗分數(shù)進行很好的解釋。建立常模以對測驗分數(shù)進行客觀、公正的解釋是標準化的又一個重要步驟。常模是指某一標準化樣組在某一測驗上的平均分數(shù)。它的功用在于給測驗分數(shù)提供比較的標準，從而對測驗分數(shù)加以解釋。為了建立測驗的常模，測驗編制者應在標準化的條件下，對一具有代表性的大規(guī)模樣組施行測驗。樣組的代表性可以通過隨機抽樣或隨機分層抽樣和采用大規(guī)模樣組來達到。這樣得到的測驗組的平均成績可作為常模，給分數(shù)解釋提供參考。根據(jù)常模，并結合該測驗信度、效度的資料，就能對測驗所得的分數(shù)作一較合理妥貼的解釋，也使測驗整個過程更具客觀性。

3．標準化測驗的優(yōu)點

與一般測驗相比，標準化測驗有以下幾個優(yōu)點：

（1）標準化測驗具有較高的質量。它的效度、信度都較高，增加了測驗的客觀性，所得的結果較為真實。

（2）測驗經過標準化后，能得到廣泛的運用。可使心理學家和其他專業(yè)工作者不必把大量的時間花在測驗的編制、實施和評價上，而是致力于其他更重要的活動如治療、指導及對分數(shù)進行解釋。

（3）使用標準化測驗促進了心理學家之間的交流。測驗分數(shù)體現(xiàn)了有關個體或團體的一些有用信息甚至是科學發(fā)現(xiàn)，對其他心理學家或專業(yè)工作者來說可能具有參考和研究的價值。

4．提高測驗標準化程度的方法

（1）測驗編制過程要標準化。在確定測驗維度、題目編制、題目分析、測驗信度和效度分析等方面嚴格按規(guī)定程序進行。

（2）測驗實施過程要標準化。要統(tǒng)一指導語、統(tǒng)一步驟、統(tǒng)一時限，防止噪音和無關人員干擾等。

（3）測驗評分和解釋要標準化。評分和解釋要制定詳細、統(tǒng)一的標準，并據(jù)此進行嚴格的評分和解釋。

（四）人格測驗

1．人格測驗的定義

人格測驗是以人格為測量對象的測驗。它測量的是個性中除能力以外的部分，亦可看作是非能力測驗。主要測量性格、情緒、需要、動機、興趣、態(tài)度、焦慮、氣質及自我概念等方面的個性心理特征及其相關行為。

由于依據(jù)的人格理論不同，所采用的方法也不同，主要有自陳法、投射法、評定法、情境法等。

2．自陳測驗

（1）定義

自陳測驗又稱自陳問卷，是測量人格最常用的方法和形式。自陳量表是依據(jù)所測量的人格特征編制客觀問題，要求被試根據(jù)自己的實際情況或感受去逐一回答，以此衡量個人的性格特征。自陳測驗是采用客觀測驗的形式，使用自陳量表來測量人格。

編制自陳量表的基本假設是只有受測者最了解自己的人格特征。因為個人隨時隨地都在觀察自己的行為，而他人不可能了解自己行為的所有方面。

（2）自陳量表的編制

自陳法多采用客觀測驗的形式，即測驗的編制者預先擬定一系列陳述句或問題，每個陳述句或問題描述一種行為特征。若干個描述行為特征的陳述句或問題共同組成測量一種人格特質的量表。同時，在每一個陳述句或問題之下提供兩個或兩個以上的選項，供受測者根據(jù)自己的實際情況選擇。

編制自陳人格量表的第一項任務是確定所要測量的人格特質，并明確給出該特質的操作性定義，然后圍繞著該特質選擇能夠表現(xiàn)該特質的行為情境和反應。

編制自陳量表的具體方法主要有三種：

①合理建構法（邏輯法）、

②因素分析法

③實踐標準法（經驗法）。

相應地，可分成三種自陳量表：

①內容效度人格問卷

②因素分析人格問卷

③經驗效標人格問卷。

（3）自陳量表的特點

①測量工具一般為調查表。

②題目數(shù)量多。

③在同一個測驗中往往包含幾個量表，可同時測量幾個特質。

④測驗通常采用紙筆形式，因而可以團體施測。

⑤自陳量表的計分規(guī)則簡單而客觀，施測手續(xù)比較簡便，測量分數(shù)容易獲得解釋。因此一般對測驗情境和施測者的要求不像智力測驗那樣嚴格。

（4）常用自陳量表

①明尼蘇達多相人格測驗（MMPI）

a．MMPI是美國明尼蘇達大學教授郝茲威與莫金利于20世紀40年代初采用經驗法編制的，它共有566個自我報告形式的題目。題目的內容范圍很廣，包括生理狀況、精神狀態(tài)以及對家庭、婚姻、宗教、政治、法律、社會等問題的態(tài)度。MMPI的臨床量表有10個，均以所采用的效標組命名，即：疑病、抑郁、癔病、精神病態(tài)、男性化—女性化、妄想狂、精神衰弱、精神分裂、輕躁狂和社會內向。其中男性化—女性化和社會內向只能說明人格的趨勢，與疾病無關。從這10個量表可得到10個分數(shù)，即代表10種人格特質。

b．MMPI設置了四個量表去識別被試是否作假，即：說謊分數(shù)、詐病分數(shù)、校正分數(shù)和疑問分數(shù)。

c．MMPI的記分是將原始分數(shù)轉換為T分數(shù)后進行解釋的。

d．MMPI是目前應用最廣的人格測驗，它的各個量表都是根據(jù)經驗法編制的，較為客觀。另外，MMPI在編制時采用正常與異常兩組人為樣本，因此也可用于正常人的個性評定。MMPI還提供了一個豐富的題目集，可用于編制新量表和各種類型的研究工作。

e．MMPI的缺點和局限在于信度較低，常模不充分，施測時間較長，測驗結果不易解釋。

②16種人格因素測驗（16PF）

a．16種人格因素測驗是美國心理學家卡特爾教授編制的。這16種因素是：樂群性、聰慧性、穩(wěn)定性、恃強性、興奮性、有恒性、敢為性、敏感性、懷疑性、幻想性、世故性、憂慮性、實驗性、獨立性、自主性、緊張性。

b．這些人格因素是各自獨立的，每一種因素與其他因素的相關度極小。經研究這些因素普遍地存在于年齡及文化背景不同的人群之中，由于這些因素的不同組合，就構成了一個人不同于其他人的獨特個性。

c．16PF能根據(jù)測驗結果推算出許多種可以形容人格類型的次元因素，如：適應與焦慮性、內向與外向性、感情用事與安詳機警性、怯懦與果斷性。

d．16PF適用于16歲以上的青年和成人，現(xiàn)有5種版本，A、B本為全版本，每本各有187題；C、D本為縮減本，各有106個項目；E本適用于文化水平較低的被試。每一種人格因素由10～13個測題組成的量表來測量。16種因素的測題按序輪流排列，以便于計分，并保持受測者作答時的興趣。為防止被試勉強作答或不合作，每一測題都備有三個可能的答案，使受測者有折中的選擇。為了克服動機效應，盡量采用“中性”的測題，避免含有一般社會所公認的“對”或“錯”的題目，而且，被選用的問題中有許多表面上似乎與某人格因素有關，但實際上卻與另外一人格因素相關，因此，受測者不易猜測每一測題的用意，從而據(jù)實作答。

③愛德華個性偏好量表（EPPS）

a．美國心理學家愛德華于1953年編制的“愛德華個性偏好量表”，是以美國心理學家默里1938年提出的人類15種需要為理論基礎編制的。全量表包括225個題目（其中15個重復題目，用以檢查反應的一致性），每題包括兩個第一人稱的陳述句，要求受測者按自己的個性偏好從二者中圈選其一。這15種需求是：成就、秩序、表現(xiàn)、自主、親和、省察、求助、支配、謙遜、慈善、變異、堅毅、性愛、攻擊。

b．全量表的題目平均分配測量這15種需求，成為15個分量表，另有一個穩(wěn)定性量表施測后每人得到15個分數(shù)。根據(jù)個人所得的15個分數(shù)繪制的剖析圖，即可對個人的心理傾向有個概括的了解。EPPS的主要特點是采用強迫選擇法來控制社會稱許性。所謂社會稱許性指的是題目內容受社會輿論贊許和反對的程度。強迫選擇法，就是要求受測者在兩個或多個具有相同的社會稱許性而又測不同特質的題目中做一個選擇。

④艾森克人格問卷（EPQ）

a．艾森克人格問卷是英國心理學家艾森克教授編制的，他收集了大量有關人格方面的特征，并通過因素分析歸納出三個維度，從而提出決定人格的三個基本因素：內外傾性、情緒性和心理變態(tài)傾向。人們在這三方面的不同傾向和不同表現(xiàn)程度，便構成了不同的人格特征。

b．EPQ目前有成人問卷和青少年問卷兩種，適用于16歲以上的受測者。成人問卷包括90個條目，讓被試根據(jù)自己的情況回答“是”或“否”。然后按E、N、P、L四個量表記分。E、N、P分別代表艾森克人格結構的三個維度，L是后來加進去的一個效度量表。

E：內外傾性。分數(shù)高表示人格外向，分數(shù)低表示人格內向。

N：情緒性。其兩極是情緒穩(wěn)定和神經過敏。

P：心理變態(tài)傾向，又稱精神質。并非指精神病，它在所有人身上都存在，只是程度不同，但如果某人在此維度上的分數(shù)明顯較高，則易發(fā)展成行為異常。

L：測量被試的掩飾、假托或自身隱蔽的程度。L與其他量表的功能有聯(lián)系，但它本身也代表一種穩(wěn)定的人格功能。

c．艾森克將外傾性和神經質兩個維度作了垂直交叉分析，得到4種典型的人格類型：

外向穩(wěn)定型：善領導，無憂慮，活潑，悠閑，易共鳴，健談，開朗，善交際；

外向易變型：主動，樂觀，沖動，易變，易激動，好斗，不安定，易怒；

內向易變型：文靜，不善交際，緘默，悲觀，嚴肅，刻板，焦慮，憂郁；

內向穩(wěn)定型：鎮(zhèn)靜，性情平和，可信賴，有節(jié)制，平靜，深思，謹慎，被動。

3．投射測驗

（1）投射測驗的簡介

①定義：投射測驗指測驗中所用的刺激多為意義不明確的各種圖形、墨跡或數(shù)字，讓受測者在不受限制的情境下，自由地做出反應，由對反應結果的分析來推斷其人格。

投射的意義是指一個人把自己的思想、態(tài)度、愿望、情緒等個人特征無意識的投射到外界事物上，通過對外界事物的反應，表達出自己內心的感受。這種方法的機理是精神分析心理學理論中的投射機制。這類測驗主要以羅夏墨跡測驗、主題統(tǒng)覺測驗（簡稱TAT）、文字聯(lián)想測驗、畫人或畫樹測驗為代表。

②投射測驗的理論假定

a．人們對外部事物的解釋性反應都是有其心理原因的，同時也是可以給予說明和預測的；

b．人們對外部刺激的反應雖然決定于所呈現(xiàn)的刺激的特征，但反應者過去形成的人格特征、他當時的心理狀態(tài)以及他對未來的期望等心理因素也會滲透在他對刺激的反應過程及其結果之中；

c．因為個人的人格會無意識地滲透在他對刺激情境的解釋性反應之中，所以，通過向受測者提供一些意義模糊的刺激情境，讓受測者對這種情境做出自己的解釋，然后通過分析他解釋的內容，就有可能獲得對受測者自身的人格特征的認識。

③投射測驗的特點

a．測驗材料沒有明確的結構和確切的意義，這就為受測者提供了針對測驗材料進行廣闊自由聯(lián)想的機會和空間；

b．受測者對測驗材料的反應不受限制，可以根據(jù)自己對測驗材料的理解作任何想像式解釋，因此受測者對測驗材料的解釋在很大程度上不是決定于測驗材料的性質，而是決定于受測者的人格特征和當時的心理狀態(tài)；

c．測驗的目的具有明顯的隱蔽性，受測者事先并不知道施測者對他的反應作何心理學的解釋，這就在很大程度上避免了受測者的偽裝和防衛(wèi)，使測驗的結果更能反映受測者真實的人格特征；

d．測驗結果的解釋重在對受測者的人格特征獲得整體性的了解，而不是對某個或某些人格特質的關注；

e．測驗的內容多為無明確意義的圖片，在測驗時不受語言文字的限制，所以，被廣泛地應用于人格的跨文化研究；

f．相對于自陳量表，投射測驗的最大局限是計分上的困難，這使得研究者對測驗結果難以進行確定的定量分析。

（2）羅夏克墨跡測驗

①基本程序

a．自由聯(lián)想階段。羅夏克測驗有10張墨跡圖，施測時每次出示一張，同時問受測者：“你看這像什么？”或“這使你想到了什么？”并允許受測者轉動圖片從不同角度去看，然后讓受測者按照自己所想像的內容作自由描述，以此為自由聯(lián)想階段，沒有時間限制。主試者要逐字逐句詳細地記下受測者的話，并記下每張圖片從出現(xiàn)到第一次反應所需的時間，各反應之間較長停留的時間、每張圖片反應所需的總時間、受測者的情緒表現(xiàn)、附帶的動作及其他重要行為等。

b．詢問階段，主試再將各圖片逐一交于受測者，并詢問受測者是根據(jù)墨跡的哪一部分做出反應的，以及引起反應的因素是什么，對其回答也要做詳細記錄。受測者在此期間可能進一步對其先前的反應加以補充或澄清。

c．類比階段。當利用經過提問獲得的資料仍不能搞清記號化的問題時，可在類比階段作進一步的商討。

d．極限階段。在這一階段，主試對受測者的反應產生疑問時，進行進一步確認。

②對墨跡測驗的評價

墨跡測驗的主要應用是在精神醫(yī)學的臨床診斷方面，由于該測驗不受語言文字的限制，可以廣泛用于人格發(fā)展和跨文化研究。對該測驗的主要批評是記分困難，未受過專門訓練的人不易掌握，而且對結果的解釋帶有主觀性，測驗本身的效度與測驗者解釋分數(shù)的效度難以分清。

（3）主題統(tǒng)覺測驗（TAT）

a．主題統(tǒng)覺測驗是由默瑞與莫根于1938年在美國哈佛大學創(chuàng)制的，其理論基礎是默里的“需要—壓力”理論。全套測驗包括30張內容模糊的黑白圖片，另加一張空白卡片，圖片內容多為人物，兼有部分景物。就刺激情景而言，TAT較墨跡測驗有組織有意義。但是TAT對受測者的反應不加限制，任其自由憑想像去編造故事，因此其結果也屬投射性質。

b．主題統(tǒng)覺測驗的基本假設：

個人面對圖畫情景所編造的故事與其生活經驗有密切的關系，受測者在編造故事時，常是不自覺地把隱藏在內心的沖突和欲望等穿插在故事的情節(jié)中，借故事中人物的行為宣泄出來，亦即把個人的心理歷程投射在故事中。主試者如能對受測者編的故事善加分析，便可了解個人心理的需求。

c．TAT的評分分兩部分：一是在每一種需要變量和情緒變量上的分數(shù)，評分規(guī)則是根據(jù)每一種需要或情緒的強度在1～5之間記分；二是在每一種壓力變量上的分數(shù)，評分規(guī)則是根據(jù)每一種壓力的強度在1～5之間記分。最后在每一變量上都得到兩個分數(shù)，一是總體平均分（AV），二是分數(shù)的分布（R）。

d．被評定的主要的需要變量、情緒變量有：恭順、成就、攻擊、自責、關懷、順從、性、受保護、進取、歸屬、自主、矛盾、情緒變化、沮喪、焦慮、懷疑等；被評定的主要的壓力變量有：歸屬、攻擊、支配、關懷、拒絕、身體危險等。而評定這些變量的分數(shù)的依據(jù)是受測者在所編的故事中對主人公的行為、需要、動機、情感和主人公所處的環(huán)境的描述，以及整個故事所反映出的主題的性質。

e．解釋TAT分數(shù)有兩個基本假設：

第一個假設是主人公的歸因（需要、情緒狀態(tài)和情感）代表著受測者人格的傾向性。這種傾向性是受測者的過去和他所預期的將來，即：

他已做過的事；

他想去做的事；

他未意識到的一些基本的人格力量；

他當時所體驗的情緒和情感；

他對將來行為的預測。

第二個假設是受測者所統(tǒng)覺的環(huán)境壓力也代表著過去、現(xiàn)在和將來，即：

他真正遇到過的情境；

他出于愿望或恐懼而想像到的情境；

他正在統(tǒng)覺的情境；

他期望遇到的或害怕遇到的情境。

主試應當根據(jù)上述兩個基本假設，參照手冊中對各種需要、情緒及壓力變量的基本描述去解釋受測者投射在所編的故事中的人格狀態(tài)和特征。同時要特別在需要、情緒的力量和壓力的力量之間進行強度上的比較，并分析它們之間的相互作用所導致的結果。

（4）對投射測驗的評價

投射測驗的優(yōu)點：可以對人格作綜合的、完整的探討，對受測者的內心生活作深層的探索，并做出動態(tài)解釋；測驗本身不顯示任何目的，受測者不至于有意防范而作虛假的反應。

投射測驗的缺點：評分缺乏客觀標準，難以量化；缺少充分的常模資料，測驗結果不易解釋；信度和效度不易建立；原理復雜深奧，非經專門訓練者不宜使用；與其他測驗相比，被試的反應更易受實施情景的影響。

4．情景測驗

情景測驗法屬于行為觀察法的一種，是將被試置于特定情境下，由主試觀察被試行為反應，從而判定人格的方法。該方法常用于教育及軍事等領域或特殊人才的選拔中。

（1）品格教育測驗（簡稱CEI）采用的情境是學齡兒童生活或學習中所熟悉的實際生活情境，用來測量諸如誠實、自我控制及利他主義等品格或行為的特點。

（2）情景壓力測驗主要應用于軍事或領導人才的選拔上。通常采用設計好的情境，使被試產生情緒上的壓力，然后觀察被試如何應付情境，從而了解其人格特征。

（3）情景測驗的評價

①情景測驗的優(yōu)點：情景測驗比自陳法和投射法更自然、更接近真實生活。而且，多數(shù)情況下，受測者不知道測量的真實目的，因而在實際反應中不大可能作假。

②情景法的弱點是：施測困難，費時費錢，一次只能測一人或少量被試；需要受過訓練的主試來觀察和評定行為，并要綜合地處理測驗中所得的各種資料，因而易受各種誤差影響，不夠可靠和有效；受試者的行為，常因所在情境的不同而反應互異。

（五）智力測驗

1．智力測驗的定義及目的

（1）智力測驗是一種測量的工具，它要讓被試表現(xiàn)（顯示）智力水平的行為（樣組），然后對表現(xiàn)出的這些行為做出數(shù)量化的描述，以此最后決定被試的智力水平。

（2）智力測驗的目的是在一定的條件下，使用特定的標準化的測驗量表對被試施加刺激,從被試的一定反應中測量其智力的高低。智力測驗能很好地預測學術成就，也能預測職業(yè)上的成功。分為：個體智力測驗，如比奈—西蒙智力量表、斯坦福—比奈智力量表、韋克斯勒智力量表等；團體智力測驗，例如，陸軍測驗、瑞文推理測驗、認知能力測驗等。

2．個體智力測驗

個體智力測驗是多采用開放式問題，對個體進行施測，并由施測者評分以測量個體智力水平的測驗。個體智力測驗多用于診斷及彌補工作。個體測驗標準化樣本一般只用幾千名精心挑選的被試。

（1）比奈量表

①比奈—西蒙量表

1905年量表，這是比奈和西蒙出于診斷異常兒童智力的需要，于1905年編制而成的世界上第一個智力量表。它包括30道測驗項目，種類繁多，可以測量智力的多方面表現(xiàn)，以通過多少項目作為區(qū)分智力的標準，并且顯現(xiàn)出年齡量表的雛形，比奈和西蒙在此已指明不同年齡的兒童所能通過的項目。

1908年量表，這是第一個年齡量表，比奈和西蒙在此對1905年量表作了如下修訂：測驗項目增至59個；測驗項目以年齡分組（3～13歲，每歲一組）；以智力年齡來評估個體智力，即兒童最后通過哪個年齡組的項目，說明他具有這一年齡的智力水平，而不論他的實際年齡是多少。

1911年量表，比奈在1908年量表的基礎之上對其做最后一次修訂，除了改變一些項目內容及其順序之外，還將其適用范圍擴大，增設了一個成人題目組。

②斯坦福—比奈量表的發(fā)展

1916年量表，推孟在1916年的斯坦福—比奈量表中，對于比—西量表中的項目或者保留，或者修改，或者刪除，并在此基礎上又增設了39個新項目。該量表首次引入比率智商的概念，開始以IQ作為個體智力水平的指標。并且量表對每個項目施測規(guī)定了詳細的指導語和記分標準。

1937年量表，1937年推孟對斯坦福—比奈量表作了第一次修訂，修訂后的斯坦福—比奈量表由L型和M型兩個等值量表構成，該量表適用年齡由1916年的3～13歲擴展到1．5～18歲，并在修訂時選取了更大的代表性樣本以獲得信度、效度資料，不過其樣本仍局限于白人，且偏重于社會經濟地位較高家庭的兒童，因而仍未能全面反映美國當時人口的狀況。

1960年量表，該量表匯集了1937年量表的L型和M型中最佳項目而成LM型單一量表，適用于2歲到成人。該量表的重大改變在于舍棄了比率智商，引入了離差智商概念，以平均數(shù)為100，標準差為16的離差智商作為智力評估指標。

1972年量表，此量表保持1960年量表的測驗內容不變，重新修訂常模，所選常模團體包括了美國各地區(qū)、各社會階層、各種經濟狀況、各民族的2100名兒童，取樣代表性有了很大提高。

③斯坦福—比奈量表的信度與效度

斯坦福—比奈量表對年齡大的被試比年齡小的被試信度高，對于智商低的被試比智商高的被試信度高，計算L型和M型量表的復本信度，在2.5～5.5歲為0.83～0.91，在6～13歲為0.91～0.97在14～18歲為0.95～0.98。再測信度與復本信度的研究結果大體一致，總體來講，斯坦福—比奈量表是一個信度高的測驗。

斯坦福—比奈量表的特點：

從內容效度上看，斯坦福—比奈量表中所包含的項目涉及多方面的內容，這些內容又被公認為在智力范疇之內。從效標關聯(lián)效度上看，由斯坦福—比奈量表而得的智商分數(shù)與學業(yè)成績、教師評定、受教育年限等外在效標分數(shù)間存在普遍正相關，效標關聯(lián)效度系數(shù)大多介于0.4～0.75之間。從結構效度上講，斯坦福—比奈量表的理論構想主要基于以下兩方面：智力隨年齡而發(fā)展，其成長曲線特征為先快后慢，智力結構中存在一般因素G，它滲透于每一智力行為之中，是智力的核心，斯坦福—比奈量表對于其理論構想的測量有效性已得到了一定程度的證明。

④中國比奈測驗

19世紀20年代，我國心理學家陸志偉和吳天敏已開展了斯坦福—比奈量表的中國版修訂工作。1982年完成《中國比奈測驗》。該測驗共有51道題，從易到難排列，每題代表4個月的心理年齡，這樣從2～18歲，每個年齡段有3道題，智力評定指標采用離差智商。中國比奈測驗必須個別施測，并且要求主試必須受過專門訓練，對量表相當熟悉且有一定經驗，能夠嚴格按照測驗手冊中的指導語進行施測。

（2）韋克斯勒量表

①韋氏成人智力量表的產生與發(fā)展

韋克斯勒—貝爾韋智力量表Ⅰ型是美國心理學家韋克斯勒通過臨床經驗，認為斯坦福—比奈量表的內容和題目是針對兒童設置的。過分強調速度而又缺乏難度，對成人而言，表面效度很低，無法引起成人的興趣，而且斯坦福—比奈量表的常模資料來自兒童，智齡的概念也不適用于成人。因此在1939年發(fā)表了W-BⅠ。

W-BⅠ是第一個成人智力量表，它的內容是以特別適合成年人使用的眼光來選擇的，并用一系列不同的子測驗的形式來編制整個測驗，每個子測驗內的題目皆由易到難順序排列。之后又于1949年增加了Ⅱ型（W-BⅡ）。

②韋氏成人智力量表修訂版

1955年韋克斯勒對W-B進行了修訂和重新標準化，編制了韋氏成人智力量表（WAIS），1981年又出版了再次標準化后的WAIS，即為韋氏成人智力量表修訂版（WAIS-R）。其每個分測驗獨立記分，再轉化為平均數(shù)為10，標準差為3的標準分數(shù)。六個言語分測驗的標準分數(shù)相加可得言語量表分，五個操作分測驗的標準分數(shù)相加可得操作量表分，所有分測驗的標準分數(shù)相加可得全量表總分。最后，將這些量表分數(shù)轉換成平均數(shù)為100，標準差為15的離差智商分數(shù)，便可得到言語智商、操作智商和總智商。WAIS-R的常模團體由1880人組成，男女各半，分配在16～17，18～19，20～24，25～34，35～44，45～54，55～64，65～69，70～74歲9個年齡組。

③韋氏成人智力量表的信度和效度

全量表的信度在各年齡組上的分布為0.96～0.98，言語量表的信度分布為0.95～0.97，操作量表的信度分布為0.88～0.94，分測驗的信度相對低一些，但11個分測驗在各年齡組上的89個信度系數(shù)中也只有5個低于0.70，最高達到0.96。

從結構效度上講，韋氏量表的11個分測驗是從各個方面來測量智力，對其因素分析結果表明：在測驗分數(shù)的總變異中，有50%的變異來自智力一般因素，在WAIS-R中，各分測驗之間和分量表之間存在著普遍的、顯著的正相關，也表明智力G因素滲透于智力行為的各個方面。從內容效度上講，韋氏量表設計的11個分測驗，均取自于前人，它們在早期智力量表中皆被成功地使用過，并在臨床實踐中顯示了它們的價值，被公認為智力行為的主要范疇。從效標關聯(lián)效度上講，在異質性較高的團體中，韋氏量表與斯坦福—比奈量表的相關在0．80左右，與各種教育與職業(yè)效標間也有相關。

④韋氏成人智力量表中國修訂版（WAIS-RC）

WAIS-RC的主要內容有：言語量表，包括常識測驗，理解測驗，算術測驗，背數(shù)測驗，詞匯測驗；操作量表，包括數(shù)字符號測驗，填圖測驗，積木圖案測驗，圖片排列測驗，拼圖測驗。

WAIS-RC的信度與效度：WAIS-RC各分測驗的分半信度在不同年齡組的分布為0．30～0．85之間，各分量表和全量表的再測信度在0．82～0．89之間。在高考成績上差異顯著的被試，在WAIS-RC測得的智商上同樣表現(xiàn)出顯著差異，說明WAIS-RC具有一定的效度。

⑤韋氏兒童智力量表

產生與發(fā)展：韋氏兒童智力量表（WISC）是韋氏成人智力量表向較低年齡水平的擴展，是1949年由韋克斯勒在W-BⅠ的基礎上修訂而成的，并于1974年修訂和重新標準化后完成了韋氏兒童智力量表修訂版（WISC-R）。WISC-R共包括12個分測驗，分別構成言語量表和操作量表，其中背數(shù)和迷津兩個分測驗是備用測驗，可作為某一同類測驗的替換或補充測驗。WISC-R適用于6～16歲的兒童，每四個月為一個年齡組，分別建立了常模表，可直接由原始分查得言語智商、操作智商和總智商。

信度和效度：WISC-R中各分測驗的分半信度分布在0.70～0.86之間，再測信度在0.65～0.88之間；各分量表和全量表的分半信度在0.90～0.96之間，再測信度在0.90～0.95之間。WISC-R還獲得了來自效標關聯(lián)效度和結構效度的效度證據(jù)。

適用范圍：韋氏兒童智力量表中國修訂本只適用于中等以上城市的兒童。

⑥韋氏幼兒智力量表

韋氏幼兒智力量表（WPPSI）于1967年出版，適用于4～6歲半的兒童。包括11個分測驗，其中3個分測驗（句子復述、動物房、幾何圖案）是為了適應幼兒特點而新編的，另外8個（常識、理解、詞匯、算術、類同、填圖、迷津、積木圖案）則與WISC相同。WPPSI亦給出言語智商、操作智商和總智商，它們的分半信度在0.84～0.94之間，再測信度在0.86～0.92之間，同時有證據(jù)表明WPPSI的各分量表及全量表的智商與斯坦福—比奈量表的智商的相關系數(shù)在0.56～0.76之間。

⑦對韋氏智力量表的評價

韋氏從實踐出發(fā)所編制的WSS系列，不僅受到臨床心理學家和教育家的關注，也廣泛應用于其他專業(yè)，成為當今最通用的個體智力測驗。它與SB（西蒙—比奈的簡稱）量表相比，具有以下一些優(yōu)點；

a．韋氏智力量表具有復雜的結構，不但有言語分測驗，還有操作分測驗，可同時提供三個智商分數(shù)和多個分測驗分數(shù)，能較好地反映一個人智力的全貌和測量各種智力因素。整個韋氏智力量表的三套量表互相銜接，適用的范圍可從幼兒直至成年，是一套比較完整的智力量表。

b．韋氏智力量表用離差智商代替比率智商，既克服了計算成人智商的困難，又解決了在智商變異上長期困擾人們的問題。當然，離差智商的概念并不是韋克斯勒發(fā)明的，如奧蒂斯測驗、賓特納一般能力測驗中也曾用過離差智商，但自韋克斯勒之后，離差智商這一概念才在智力測驗中廣為應用。

c．韋氏智力量表臨床應用多，積累了大量的資料，已成為臨床測驗中的重要工具。除可測量智力外，還可研究人格，而且可以作為神經心理學的主要測量量表。韋克斯勒提出，如數(shù)字廣度、數(shù)字符號、木塊圖案等分測驗的成績隨年齡增高而降低，這些測驗與另一類不受年齡影響的分測驗（詞匯、知識和圖片排列等）成績的比值，即“退化指數(shù)”，可作為腦功能退化的商數(shù)。

韋氏智力量表的主要缺點是：

a．韋氏智力量表的三個獨立量表的銜接欠佳，表現(xiàn)在同一被試者用兩個相鄰量表如WAIS和WISC測驗時，其智商水平在WAIS的系統(tǒng)性高于WISC。

b．測驗的起點偏難，有的分測驗（如相似性測驗）方法對低智力者難以說明，故不便測量低智力者。

c．有的分測驗項目過多（如詞匯測驗），增加測驗時間；有的相反，項目過少（如物體拼湊測驗），難以調整項目難度，且不便作分半相關信度檢驗。

為了克服測驗程序復雜費時這一缺點，韋氏三個智力量表均有簡式版本，如二合一、三合一至五合一（或六合一）簡式。Sattle（1982）認為使用詞匯和木塊圖案來估計智商為最理想的二合一簡式組合，而四合一的簡式組合通常選用詞匯、算術、圖片排列和木塊圖案四個分測驗。龔耀先（1983）計算了WAIS-RC各分測驗與言語量表、操作量表和全量表得分的相關，結果言語部分以知識、相似性和詞匯分測驗為代表測驗，操作部分以圖畫填充、木塊圖案和圖片排列三個分測驗為代表測驗，這六個分測驗可組合成各種形式的二合一至六合一簡式。但使用簡式量表要慎重，因其效度和信度比全量表低。

盡管韋氏智力量表有某些不足，到目前為止還是被廣泛用作智力診斷的工具。至1981年，有關韋氏智力量表的資料已在各種出版物上刊登了三千多次，足見其影響之大。

3．團體智力測驗

團體測驗是采用多項選擇，客觀的計算機評分，對團體施測以測量智力水平的測驗。團體測驗標準化樣本極大。

（1）陸軍測驗

第一次世界大戰(zhàn)期間，美國心理學會主席耶克斯和桑代克、推孟等許多著名心理學家提出用測驗招募和選拔士兵。但面對短時間內動員數(shù)百萬兵員的任務，采用個別施測的智力測驗顯然無法完成任務。于是，在推孟的學生奧蒂斯編制的團體智力測驗的基礎之上產生了陸軍甲種測驗，后來又針對不識英文或有閱讀障礙的人編制出陸軍乙種測驗。

①陸軍甲種測驗由8個分測驗組成，包括指使測驗（照令行事測驗）、算術測驗、常識測驗、異同測驗、字句重組測驗、填數(shù)測驗、類比推理測驗和理解測驗。陸軍乙種測驗屬于非文字測驗，由7個分測驗組成，包括迷津、立方體分析、補足數(shù)列、譯碼、數(shù)字校對、圖畫補缺和幾何圖形分析。

②陸軍甲種測驗的效度資料來自它與軍官評定的相關（0．50～0．70），與斯坦福—比奈量表的相關（0．80～0．90），與教師評定的相關（0．67～0．82），以及與學業(yè)成績的相關（0．50～0．60）。陸軍乙種測驗與甲種測驗的相關達到0．80。

（2）瑞文推理測驗

①瑞文推理測驗的產生與發(fā)展

瑞文標準推理測驗，由瑞文于1938年編制出版，適用于5.5歲以上智力發(fā)展正常的人，屬于中等水平的瑞文推理測驗；瑞文彩圖推理測驗，是瑞文于1947年編制，適用于幼兒和智力低于平均水平的人，屬于瑞文推理測驗的3個水平中最低水平的測驗；瑞文高級推理測驗，初編于1941年，經1947年、1962年兩次修訂成為現(xiàn)在的形式，適用于智力高于平均水平的人，是最高水平的瑞文推理測驗。

以上3種水平的瑞文推理測驗均由兩種題目形式組成，一種是從一個完整圖形中挖掉一塊，另一種是在一個圖形矩陣中缺少一個圖形，要求被試從提供的幾個備選答案中，選擇出一個能夠完成圖形或符合一定結構排列規(guī)律的圖案。

②瑞文推理測驗的假設

源于斯皮爾曼的智力一般因素理論，瑞文將智力G因素劃分為兩種相互獨立的能力，一種稱再生性能力，表明個體經過教育之后達到的水平；一種稱推斷性能力，表明個體不受教育影響的理性判斷能力。瑞文認為，詞匯測驗是對再生性能力的最有效測量，而非言語的圖形推理測驗則是對推斷性能力的最佳測量，這就是瑞文推理測驗的來源。

③瑞文測驗的優(yōu)點

測驗對象不受文化、種族與語言等條件的限制，適用的年齡范圍也很寬，從5歲半直到老年，而且不排除一些生理缺陷者。測驗可個別進行，也可團體進行，使用方便，省時省力，結果以百分等級常模解釋，直觀易懂。

④瑞文標準推理測驗中國修訂本

1985年，我國張厚粲教授開始主持瑞文標準推理測驗中國城市版的修訂工作。修訂過程中基本保留了原測驗的項目形式及指導語，測驗共由60道題目組成，分為A、B、C、D、E共5個系列，每一系列包含12個題目。項目系列由易至難排列，每一系列內容的項目亦由易至難排列。每一項目均為“1”、“0”計分，最后根據(jù)總分查得常模表中相應年齡組的百分等級。

測驗常模團體根據(jù)人口普查資料取自全國大、中、小城市，取樣時注意到性別、文化、職業(yè)等人口比例分配，從5歲半到16歲半每半歲為一年齡組，20歲以上每10歲為一年齡組，17歲至19歲為一年齡組，70歲以上為一年齡組。分半信度為0.95，再測信度為0.79～0.82之間。它與WISC-R的中國修訂本的各分量表及全量表的相關系數(shù)在0.54～0.71之間，與高考總分的相關系數(shù)為0.45，這些為其效度提供了支持。

（3）認知能力測驗

認知能力測驗由桑代克等美國心理學家于1968～1972年間編制成功，共有四個部分：

①初級型：適用于小學低年級兒童，使用圖片資料和口頭指導語，包括口頭、詞匯、關系概念、多重智力和數(shù)量概念。

②文字測驗：適用于小學四年級以上，由詞匯、句子填充、詞匯分類、詞語類推測驗組成。

③數(shù)量測驗：適用于小學四年級以上，由數(shù)的大小比較，數(shù)列補充和建立關系等式測驗組成。

④非文字測驗：適用于小學四年級以上，由圖形分類、圖形推理和圖形綜合測驗組成。

所有測驗的題目由易至難排列，每個測驗均有幾套不同水平的題目，以便對智力成熟水平不同的人提供適當難度的測驗，結果以離差智商、百分等級、標準九分數(shù)等解釋。認知能力測驗具有相當詳細的信度和效度資料，表明其各部分測驗的再測信度系數(shù)在0．72～0．95之間；同時它對學業(yè)成就、工作成就、職業(yè)類型等有相當?shù)念A測能力。

4．智力測驗的評價

（1）優(yōu)點

智力測驗通過編制十分嚴格的標準化量表所給出的一群測題（刺激）引起人們認知方面行為的反應，從而使得人們能根據(jù)反應的程度來估計其智力水平，是評價一個人的智力水平的有效方法。與學業(yè)考試相比較，與教師的經驗性評定相比較，智力測驗在評價學生智力水平上有其獨特的長處。

①就評價內容來講，智力測驗中嚴格選定的測題比較有利于考察被試的各種能力，而不像學業(yè)考試側重于了解某一階段性知識的掌握程度——雖然一個人的智力和知識之間并無截然分別的界線。

②就被評價者的范圍來講，學業(yè)考試往往局限于一個班級或年級作比較，而智力測驗則把一個人的分數(shù)與一個更廣大的地區(qū)（例如上海市區(qū)）內的同齡人進行比較。

③對智力快速而有效的評定。一個好的智力測驗量表是評定學生智力發(fā)展水平的快速和有效的工具，花費一兩個小時所做出的評定往往與教師經過一兩年甚至更長時間觀察所作的評定有較高的相關。

（2）缺點

①智力測驗主要進行了量的分析，它的結果一般是用智商報告的，一般智商分數(shù)只提供了量的數(shù)據(jù)，只有數(shù)量說明，沒有質的分析。

②智力測驗只測了當時的智力，沒有考慮發(fā)展的速度和趨勢。

③智力測驗只是部分地反映了一個人的智力水平。

④智力測驗還有其他一些不足之處，如智力測驗的正確答案一般是事先確定的，因而它只考慮到收斂性的抽象概括、推理思維能力，而對于創(chuàng)造性思維，尤其是發(fā)散性思維方面考慮不夠。另外它的測題不可避免受到文化知識的影響等等。

（3）斯騰伯格對傳統(tǒng)智商測驗的批評

①測驗的實際情景性問題。他認為傳統(tǒng)智商測驗在內容上是不全面的，它未能把構成智力本質的一個重要方面，即社會智力涵蓋在內。

②對于先前學習知識的要求。斯騰伯格認為傳統(tǒng)智商測驗一般未能很好地控制知識和經驗因素的作用，因而其學業(yè)成就色彩過重。

③速度問題。斯騰伯格對滲透于當今社會的“快即聰明”的說法提出異議。傳統(tǒng)智商測驗一般都是限時測驗，他認為這實際上是受世俗偏見之累。

④測驗的焦慮。在測驗過程中無法排除不同被試的焦慮影響的差異。

⑤關于測驗依據(jù)的智力理論。智力測驗應該依據(jù)一種在實際中被證明有效的關于智力本質的理論，然而至今為止，對于智力的本質仍沒有一致的看法。

（六）常用臨床心理測驗

臨床上常用的心理測驗包括：

1．韋克斯勒智力量表

2．明尼蘇達多項人格調查表

3．艾森克人格問卷

4．癥狀自評量表

5．抑郁自評量表

6．焦慮自評量表。

（七）心理測驗的合理使用策略

心理測驗是從事心理學與教育學研究的一種重要方法，也是解決實際應用問題的一種重要的輔助工具，但是，目前的心理與教育測驗的科學性還不夠高，有待于在使用中進一步改進和完善。

五、心理統(tǒng)計

心理統(tǒng)計是專門研究如何運用統(tǒng)計學原理和方法，搜集、整理、分析心理與教育科學研究中獲得的隨機性數(shù)據(jù)資料，并根據(jù)這些數(shù)據(jù)資料傳遞的信息進行科學推論，找出心理與教育活動規(guī)律的一門學科。

（一）描述統(tǒng)計

描述統(tǒng)計主要研究如何整理心理與教育科學實驗或調查得來的大量數(shù)據(jù)，描述一組數(shù)據(jù)的全貌，表達一件事物的性質。

具體內容包括：

1．數(shù)據(jù)如何分組，如何使用各種統(tǒng)計圖表描述一組數(shù)據(jù)的分布情況。

2．怎樣計算一組數(shù)據(jù)的特征值，簡縮數(shù)據(jù)，進一步描述一組數(shù)據(jù)的全貌。

3．表示一事物兩種或兩種以上屬性間相互關系的描述及各種相關系數(shù)的計算及應用條件，描述數(shù)據(jù)分布特征的峰度及偏度系數(shù)的計算方法等等。

（二）推論統(tǒng)計

推論統(tǒng)計主要研究如何通過局部數(shù)據(jù)所提供的信息，推論總體的情形。具體內容大致包括以下幾個方面：

1．如何對假設進行檢驗，即各種各樣的假設檢驗，包括大樣本檢驗方法（Z檢驗），小樣本檢驗方法（t檢驗），各種計數(shù)資料的檢驗方法（百分數(shù)檢驗,X2檢驗等），變異數(shù)分析的方法（F檢驗），回歸分析方法等等。

2．總體參數(shù)特征值的估計方法，總體參數(shù)的估計方法。

3．各種非參數(shù)的統(tǒng)計方法等等。

六、研究中的道德和倫理問題

處于道德和倫理的考慮，心理學研究需要遵循以下一些原則：

1．知情同意

2．隨時都可自由退出實驗

3．詢問執(zhí)行任務的情況

4．保護被試不受到傷害、保密。

官术网_书友最值得收藏!

應用心理碩士（MAP）考試專用教材

第2章 心理學的研究方法

第2章　心理學的研究方法