官术网_书友最值得收藏!

第2章 心理測量和測驗的一般介紹

2.1 復習筆記

一、測量的基本問題

(一)測量的定義

測量是按照一定的法則,用數字方法對事物的屬性進行描寫的過程。測量包括三個要素:測量的對象——事物的屬性和特征;測量的規則或法則——給事物的屬性分派數字的依據;測量的結果——描寫事物屬性的數字或符號。

1.測量的對象

測量的對象是事物的某種屬性,而事物的屬性大致可分為以下幾類:

(1)具體型:其存在形式比較具體,大多可以被人的感覺器官所直接感覺到。如物體的長度、重量等。

(2)確定型:在一定的條件下,這些屬性或特征是保持恒定不變的。例如,物體的長度和重量,只要物體的溫度不變,受力狀況不變,其長度也就相對不變。

(3)抽象型:它與具體型相對,其存在形式比較抽象,大多不能被人的感官直接感覺到。人的心理屬性就大多屬于抽象型,如學生的智力、個性等。

(4)隨機型:即事物的屬性是隨機變化的。如人的記憶廣度,盡管各種條件都保持恒定,但每次測量的結果還是會有所差異。

(5)模糊型:即事物的屬性本身是模糊不清的。如某人熱情奔放。

2.測量法則

法則是在測量時給事物屬性分派數字的依據。任何測量程序僅是建立一個有序配對的集合,可用公式表示:f={(X,Y);X=任何事物,Y=一個數字}。當測量的其他條件相同時,使用不同的法則會產生不同的測量效果。法則的好壞,一方面取決于制定規則的程序;另一方面取決于所欲測量的事物屬性本身是否易于建立規則及規則是否便于操作。

3.測量的結果

測量的結果指的是描述事物屬性的數字或符號。它們在未被用來描述事物的屬性之前,僅僅是一個符號,它們本身并沒有量的意義。當數字被合理地用來描述事物的屬性時,才賦予它以量的意義,即從數字變成了數。數對于測量的重要性是由數的功能決定的。數的系統有如下特征:同一性和區分性;等級性或位次性;等距性;可加性。

(二)測量的要素

任何測量都應該具備兩個要素:參照點和單位。

1.參照點

(1)含義

要確定事物的量,必須有一個計算的起點,這個起點就稱為參照點。參照點不統一,量數所代表的意義就不同,測量結果就無法進行比較。

(2)類型

絕對零點:如測量輕重、長短等都以零點為參照點,這個零點的意義為“無”,表示什么都測不到。

相對零點:是人定的參照點。如海拔高度,就是以海平面作為測量陸地高度的起點。不以絕對零點為參照點的計量只能進行加減運算,不能進行乘除運算。理想的參照點是絕對零點,但心理測量中很難找到絕對零點,多采用人為指定的相對零點。

2.單位

(1)含義

單位是測量的基本要求,沒有單位就無法進行測量。沒有單位,數量的多少、大小就無法表示。單位的種類、名稱繁多,即使是測量同一事物,也可以用多種不同單位。

(2)理想的單位必須符合兩個條件

有確定的意義,即所有人對同一單位的理解意義要相同。

有相等的價值,即相鄰兩個單位之間的差別總是相等的。

(三)四種測量水平和測量量表

量表是指把事物的屬性表現在一個定有參照點和單位的連續體。史蒂文斯根據對測量結果數量化描述的不同水平,將測量分成四種不同水平:類別測量、等級測量、等距測量、比率測量。這四種不同水平的測量產生了相應的四種類型的量表,即類別量表、等級量表、等距量表和比率量表。

1.類別量表

類別量表又稱名稱量表。它根據事物的某一特點,對事物屬性進行分類,并用數字或符號表示。它僅能區別不同類,如性別、年級等。在統計上,類別量表只能計算每個類別的次數(頻數)。適用的統計方法屬于次數統計,如計算百分比或列聯相關,進行(卡方)檢驗等。

2.等級量表

等級量表又稱順序量表。它根據事物某一特點,將事物屬性分成等級,用數字表示。這種測量水平,不僅能區分不同類別,而且能排出等級或順序。等級量表反映事物的類別的差不必相同,不具有等距性。所適用的統計方法,除次數統計外,僅限于中位數、百分位數、等級相關系數、肯德爾和諧系數以及秩次變差分析等。

3.等距量表

它對事物屬性的劃分是等距的,單位是等值的,但沒有絕對零點。它的參照點是人為指定的,只具有相對性質。因此,此類測量所得的數據可進行加減運算,但不能進行乘除運算,等距量表能更廣泛地應用多種統計方法,如均數、變差、積距相關系數、T檢驗和F檢驗等。

4.等比量表

等比量表又稱比率量表。它是一種理想的量表,也是最高水平的測量。它除具有等距量表的一切特性外,還具有絕對零點。對此種測量結果可以作加減乘除運算,除適合上述一切統計方法外,還可以使用幾何平均數和相對差異量。

(四)直接測量和間接測量

根據測量時能否直接測到所欲測量的事物屬性,可分為直接測量和間接測量兩類。

1.直接測量

直接測量是一種能直接測得事物屬性的測量,如測量事物的長度。

2.間接測量

間接測量是一種不能測得事物屬性,只能根據測量結果去推測事物屬性的測量。心理測量一般屬于間接的測量。

(五)測量的方法

測量的方法有多種,如實驗法、觀察法、測驗法。在心理測量中較多使用的是測驗法。可以將包括實驗、觀察等方法在內的心理測量稱之為廣義的測量。而將應用測驗法進行的心理測量稱之為狹義的測量。

(六)測量的誤差和精確程度

1.測量的誤差和精確程度之間的關系

測量總是會有誤差存在,測量的精確程度與誤差大小有很大關系。誤差越大,精確程度越低;誤差越小,精確程度越高。

2.測量的精確程度的影響因素:測量對象本身的屬性;測量所用的工具;測量的目的。

二、心理測量的基本概念

(一)心理測量的定義

心理測量是指根據一定的法則,用數字對人的行為加以確定。即依據一定的心理學理論,使用一定的操作程序,給人的行為和心理屬性確定出一種數量化的價值。

(二)心理測量的可能性

1.任何現象,只要客觀存在,就總有數量性質。這個原則是美國心理學家桑代克在1918年提出的。

2.凡有數量的現象,都可以測量。這個原則是美國測驗學者麥柯爾于1923年提出的。

(三)心理測量的特點

1.心理測量的間接性

心理測量是一種間接的測量。根據心理學特質理論,人們對測量結果進行推論,從而間接了解人的心理屬性。

2.心理測量的相對性

對人的行為進行比較,沒有絕對的標準,亦即沒有絕對零點,它只是一個連續的行為序列。所有的心理測量都是看每個人處在這個序列的什么位置上,因此,位置具有相對性。

(四)心理測量的水平

心理測量只具有等級量表的特征。但由于多數心理特征具有常態分布的特征,且沒有絕對零點,所以可以把測量后直接得到的原始分數轉化為常態分布下的標準分數,把這些量表當作等距量表來處理。

三、心理測驗的基本概念

(一)心理測驗和心理測量的聯系和區別

心理測驗是了解人心理的工具,主要在“名詞”意義上使用。而心理測量則是以測驗為工具,達到了解人類心理的實踐活動,它主要在“動詞”意義上使用。因此,心理測量的意義范圍更廣一些,能被應用于實際心理測量的心理測驗才是真正有效的測驗工具。

(二)心理測驗的定義

心理測驗實質上是對行為樣組的客觀和標準化的測量。心理測驗具有三個要素:行為樣組、標準化和客觀性。

(三)心理測驗三要素

1.行為樣組

行為樣組是指心理測驗中選擇一部分測量人心理特性的有代表性的行為。因為心理測驗測量的對象是人的心理特性,而測量心理特性又是憑借對其密切相關的行為間接測量的,在一個心理測驗中,不可能把所有與該心理特性相關的行為全部測量到,而只能選擇其中一部分行為進行測量。在編制測驗時,必須慎重地選擇有代表性的行為樣組。

2.標準化

(1)含義

標準化是指測驗的一致性,包括測驗的編制、實施、記分以及測驗分數解釋的程序的一致性。這樣才能保證在相同的條件下進行比較,比較的結果才有意義。標準化的范圍包括:測驗用品的一致性,測驗指導語的同一性,測驗中主試與被試關系的穩定性,測驗評價的一致性等。所有能保證測驗條件一致性的都是標準化應考慮的內容。標準化的另一重要步驟是建立常模。

3.客觀性

(1)客觀性是衡量科學性的一個根本標志。心理測驗的客觀性,是指測驗不受主觀支配,其測量方法是可以重復的,測驗的實施、記分和解釋都是客觀的。行為樣組的代表性和測驗程序的標準化都是為了保證這種客觀性。

(四)心理測驗客觀性指標

衡量心理測驗客觀性的指標包括以下幾個:信度和效度,難度和鑒別力。

1.信度

(1)含義

信度是指測驗結果的可靠程度。只有測驗結果接近或等于實際真值或多次測量結果十分接近,才能認為測量結果是可靠的。

(2)信度的種類

重測信度,是先運用某個測驗實施首測,相隔一段時間后對它進行再測,然后計算首測與再測所得分數的相關。

復本信度,是先運用同一測驗的一型或A型施測,隨后在最短的時間內運用二型或B型進行再測,然后再求它們得分的相關系數。

內在一致性信度,常用的方法是將一個測驗分裂為兩個假定相等而獨立的部分,然后計算這兩部分的記分的相關系數(一般是以項目的奇數為一組,偶數為另一組),繼而再用斯皮爾曼—布朗公式來估計整個測驗的信度。

(3)信度系數

信度高低可用相關系數來表示,即用相關系數來估計兩個隨機變量一致性變化的程度。不同的測驗內容,對相關系數的要求有所不同。一般標準智力測驗應達到0.85以上,個性測驗和興趣測驗一般應達0.70~0.80水平。學業成就測驗要求信度在0.90以上,才能被稱為是一個良好的測驗。

2.效度

(1)含義

效度表示一個測驗實際測量出所測特性或功能的真實性程度。它是指一個測驗真正確實地測量到它所欲測量的東西的程度。效度是心理測驗最重要的客觀性指標,沒有效度指標的測驗是不能使用的。鑒別一個測驗的好壞,其首要指標就是效度。

(2)效度的種類

內容效度:表示測驗所選的項目(測題)符合所欲測驗內容的程度。確定內容效度的方法有兩個:

a.邏輯法:即請有關專家對測驗題進行考核,看測驗是否能夠測出所要測的內容;

b.經驗法:即通過實踐檢查測驗能否測出欲測的內容。

結構效度:表示測驗實際測量出所欲測量的心理結構或特征的程度。

效標關聯效度:又稱實證效度或準則關聯效度,它是測驗分數與作為效標的另一獨立測驗結果之間的一致程度。在某些情況下,往往把準則關聯效度也包含在結構效度內。

a.同時效度:指效標分數與測驗分數是同時獲得的。主要用來查明修訂或自編測驗的效度。

b.預測效度:指效標分數在測驗之后相當時間獲得的。主要用來評價測驗的預測能力。

(3)考查智力測驗效度的常用方法

求測驗結果與另一種已經標準化的測驗結果的相關。

求測驗結果與學生學業成績、教師評定之間的相關。

觀察每項測題通過人數的百分比,是否隨年齡或年級的增長而增加。

觀察每項測題與全量表是否有連貫性。

3.難度與鑒別力

(1)項目的難度

項目難度是衡量測題難易水平的數量指標。估計項目難度的方法通常是以被試通過每個項目的百分比來決定的。如果某一項目通過百分比太高或太低,這說明該項目太易或太難。

(2)項目的鑒別力

項目的鑒別力是衡量測題對不同水平被試區分程度的指標。估計項目鑒別力的方法通常是以不同水平的被試通過每個項目的百分比之差來決定。項目的難度和鑒別力之間有一定的關系。一般中等難度的項目鑒別力最高。一個好的測驗項目安排要客觀,項目的選擇也應客觀。

四、測驗的種類

(一)根據測量的對象分類

依據測驗測量的事物的屬性和特質的不同,測驗可分為認知測驗和人格測驗兩大類。

1.認知測驗

認知測驗又稱為能力測驗,這類測驗主要包括智力測驗、能力傾向測驗(又稱性向測驗)、教育測驗(又稱成就測驗)及創造力測驗等。

(1)智力測驗:目的在于測量受測者智力的高低。

(2)能力傾向測驗:目的在于發現被試的潛在才能,深入了解其長處和發展傾向。包括一般能力傾向測驗和特殊能力傾向測驗。

(3)教育測驗:又稱成就測驗,測量一個人(或團體)經教育訓練或學習后對知識和技能的掌握程度。包括學科測驗和綜合測驗。

2.人格測驗

它測量的是個性中除能力以外的部分,即非能力測驗。主要測量性格、情緒、需要、動機、興趣、態度、焦慮、氣質及自我概念等方面的個性心理特征及其相關行為。

(二)根據測驗的人數分類

根據一次測驗時測試人數的多少,測驗又可分為個別測驗和團體測驗兩種。

1.個別測驗

(1)含義

個別測驗是一名主試在一段時間內測量一名被試的測驗。

(2)優點

主試對被試的言語、情緒狀態和行為反應有仔細的觀察和控制的機會;

有充分的機會與被試合作,激發被試測試的積極性;

其結果比較正確可靠,適用于一些特殊對象,如幼兒和文盲。

(3)缺點

時間長,施測手續復雜,對主試要求高,主試需要經過嚴格訓練,因而一般人不易掌握。所以個別測驗僅在有特殊目的時才使用。

2.團體測驗

(1)含義

在一段時間內一位主試同時測量許多人的測驗。

(2)優點

可以節省人力、物力和時間。

主試也不必經過嚴格的專門訓練,只要事先熟悉測題和指導語,在施測時能掌握測試時間并能控制測驗現場即可。

團體測驗的記分和評分較個別測驗更為嚴格和客觀。一般每題都有標準答案。

因為標準化樣組規模相當大,故團體測驗更易建立常模。

(3)缺點

由于同一時間內接受測量的被試多,不易有效地控制被試的行為,容易產生測量誤差,從而影響測量的信度和效度。

(三)根據測驗材料分類

根據測驗材料或者測驗內容的呈現方式來分類,主要分為語言或文字測驗、非文字測驗或操作測驗兩大類。

1.語言或文字測驗

(1)含義

語言或文字測驗的題目是以語言或文字呈現的,受試者也要用文字或語言作答。

(2)優點

它可以測量人類高層次的心理功能,其編制和實施也較容易,因而應用范圍較廣。團體測驗多數采用文字測驗形式。

(3)缺點

語言或文字測驗不能應用于語言有困難的人。

對語言文化背景不同的被試加以比較時,也有明顯的局限性。

在同一文化背景下,被試文化程度和教育背景的不同,也會對測驗結果產生影響。

2.非語言測驗或操作性測驗

(1)含義

此類測驗題目不用文字來呈現,而是以圖畫(圖形)、符號或實物(如方塊、積木、儀器和工具等)為測驗材料。被試的作答無需使用語言或文字,常以操作表達或回應。

(2)優點

它不受文化因素的限制,因而可方便地用于學前兒童和不識字的成人。

可進行不同文化背景的差異比較研究。

(3)缺點

費時,不易團體實施等。

(四)按測驗的記分方式分類

按測驗的記分方式可分為客觀測驗與非客觀測驗。

1.客觀測驗:指記分有明確的標準或有正確答案可資參照比較的測驗。此種測驗的記分能較好避免計分者的主觀差異。

2.非客觀測驗:指計分無固定標準答案可資遵循的測驗,它的評分會因評分者的寬嚴程度不同而有差異。

(五)其他分類標準

1.依據測驗的命題形式來分,有選擇反應測驗及結構反應測驗兩種類型。

2.依據測驗結果的解釋模式來分,有常模參照測驗和標準參照測驗之別。

3.依據測驗測查的程度又可分為篩選性測驗和診斷性測驗。

五、測驗的應用

(一)了解個別差異

這是心理測驗的最基本功能。個別差異是指一個人在成長過程中,因受遺傳與環境的相互影響,在生理和心理特征上顯示出的各不相同的特點。人的個別差異主要體現在認知、人格和社會背景這三方面。

(二)診斷、預測和評價

1.測驗的診斷功能不只限于臨床。在教育實踐中,還可用測驗來發現學生適應不良和學習困難的真實原因。了解這些不良適應和學習困難的原因,從而為采取適當的幫助和補救措施提供依據。

2.測驗還有預測的功能。如能力測驗可用來預測學生未來的成就。

3.測驗結果可以用來評價一個人在能力和性格上的相對長處(強)和短處(弱),評價兒童已達到的發展階段等。作為評價手段,測驗既可用于個人,也可用于群體。

(三)甄選、分類和安置

“因材施教”和“人盡其才”是人才培養和使用的兩個最主要原則。根據對“材”這樣的特質進行測驗而得到的結果,可在眾多的候選人中確定最大可能成功者。以此選拔和培養人才,可大大節省財力和物力。也可將人的“材”加以分門別類,篩選出最適當的人員,安排至最適當的位置。智力測驗和能力傾向測驗可以作為職業指導的工具。測驗在這方面的應用可提高職業指導的效率,有助于人事決策者作出更為準確的決策。

(四)為心理輔導和心理咨詢服務

適當地利用標準化的測驗與量表的量化結果資料,有助于當事人發現自己未知的潛能以及情緒困擾和人格障礙的問題所在,從而為其升學和擇校、課程和職業選定等提供有價值的參考消息。這既有利于使心理輔導和心理咨詢工作者的指導和幫助更有針對性,同時也使當事人的自我決策和行為矯正奠基于科學的根據之上。

(五)心理和教育科研的輔助手段

在心理和教育科研中,測驗已經成為研究者搜集資料(也即量化的原始資料)的有力工具。人們常用測驗對被試進行實驗分組以達到等組化的要求;在進行科研成果的評定時也常常利用測驗;由于心理測驗在收集數據資料方面的功能,因此它在心理學和教育學基本理論的研究方面也發揮著重要的作用;它具有建立和檢驗假設的功能;不同教育措施的效果也可通過測驗來比較和檢驗。

主站蜘蛛池模板: 长垣县| 蕲春县| 万源市| 明光市| 远安县| 无为县| 柳林县| 宜城市| 富蕴县| 新蔡县| 鹤庆县| 祥云县| 三穗县| 富宁县| 公安县| 惠州市| 荣昌县| 清水县| 健康| 五指山市| 武强县| 新乡市| 凭祥市| 东阳市| 莱西市| 吴忠市| 南安市| 开封县| 博野县| 潞城市| 翁源县| 静安区| 洛扎县| 怀宁县| 西贡区| 当涂县| 会理县| 锡林郭勒盟| 北票市| 霍林郭勒市| 衡南县|