官术网_书友最值得收藏!

02 智商

今天是我的審判日

“會痛嗎?”我問媽媽。我們開車沿著蜿蜒曲折的道路向學校心理咨詢辦公室駛去。“不會的斯科特,一點兒也不痛。”媽媽安慰我說。于是我不再去擔心這個問題了。“好的。可要是那人發現我真的愚蠢到家,必須去上那種很特殊的特殊學校,怎么辦?”媽媽嘆了口氣,想盡辦法來減輕我內心的恐懼,可這種恐懼依然揮之不去。我知道緊要關頭到了。

今天的測驗結果將決定我接下來的一年何去何從。四年級馬上要結束了,可我在讀的公立學校打算把資源教室撤掉。他們要把有學習障礙的學生重新扔回到額外支持極少的主流班級,我父母為此寢食難安,決定帶我去看一個有執照的學校心理專家。我很害怕參加他的測驗,尤其想到幾年前我在一次智商測驗中的糟糕表現,更讓我恐懼不已。我真正想去的學校是當地的一所私立名校——哈弗福德男校預備學校(Haverford Boys Prep)。每次上學經過那里時,我都會用艷羨的目光打量學校里身穿整潔校服的學生。我心里清楚得很:今天就是我的審判日。

“嗨!”我走進測驗室,害羞地打了個招呼。“你好,斯科特。”這位心理專家微笑著說,“不要有壓力,我們只是做幾個拼圖游戲而已。”他的話讓我感到更加緊張。他把一些積木放在桌上,讓我參照給出的圖片把積木拼在一起。我盡量不讓自己分心,可還是感覺到自己開始出汗了。我從來都不擅長做空間題目,就連去我家附近街道盡頭的那個公交站都常常會迷路,通常都是媽媽開車送我過去。

我把積木混合在一起,嘗試不同的組合,但依然感覺毫無進展。“你行的,”心理專家鼓勵我說,“相信自己!”然后他在他的筆記本上寫了些什么。我繼續渾身冒汗。

做每一道題目的時候我都不斷懷疑自己。對每一道新的題目,我都能看到多個可能的答案,我反復問自己:為什么我必須得從現有答案中選擇一個呢?如果我可以證明不止一個答案是正確的又會怎樣?如果我把題目稍作修改,他會介意嗎?

測驗結束了,我垂頭喪氣地離開了測驗室。“他是不是發現我真的很笨?”那一周晚些時候,在吃晚飯時我問我的父母。“沒有,”爸爸深深地嘆了口氣說,“不過,他的確注意到了你測驗時的焦慮。事實上,他認為你是他見過的最有創造力的學生之一,可惜這個測驗沒有創造力得分這一項。”

我最擔心的事情終于發生了。上哈弗福德男校預備學校的夢想破滅了,他們把我從現在的公立學校中“揪”了出來,扔到一所專為學習障礙兒童開設的學校。就這樣,一次測驗,我的命運便被一劍封喉。

智商測驗之父——比奈

現代智商測驗的發明者阿爾弗雷德·比奈(Alfred Binet)是一個孤獨的人。學生時代的比奈有些漠視一切,他在一段短暫的法律專業學習之后宣稱:“這只是一個男人尚未選定事業前的工作。”1后來他在巴黎薩博特慈善醫院(Salpetriere Hospital)讓-馬丁·沙爾科(Jean-Martin Charcot)的神經學實驗室里做了短期的志愿者。37歲時,比奈獲得了自然科學博士學位,他的博士論文主題是“昆蟲的腸下神經系統”。但他主要的精力不是放在以上這些事情上。

大約從22歲起,比奈大部分時間都泡在法國國家圖書館(French National Library),啃那個時代主要思想家關于人類行為的著述。很快,他便開始在心理學領域著書立說。他在23歲時發表了第一篇論文,并在短短6年后出版了他的第一本著作。他在論文和著作中,從廣闊的視角探討了各種心理過程,包括注意力和知覺。

雖然他申請的三個教授職位全部被拒絕了,但他最終謀得了索邦大學生理心理學實驗室主任這一職位(他任此職直到去世)。千萬別被這個花哨的頭銜蒙蔽,這可是一個與法國主流學術界相脫離且沒有一分錢報酬的職位,維系他心理學研究的唯一經濟來源是他的家庭財產。

而這一點卻使得比奈這位多產學者的成就無論從質量還是數量上來講都更加出類拔萃。從1890年直到去世,比奈發表的著作、論文和評論超過200種,幾乎涵蓋了心理學的所有領域。比奈的研究在他所處的時代來說具有驚人的原創性。他生活在一個似乎人人都為異常行為著迷的時代,而與他們不同,比奈深入探討了各種不同形式的人類心理活動。他著迷于個體差異,研究了人類心智的各個層面,包括意識、意志、注意力、感覺、知覺、美學、創造力、暗示、催眠、認知風格、愛和情欲戀物癖情欲戀物癖(erotic fetishes)和性戀物癖(sexual fetish)是比奈創造的詞匯。、痛閾值、心理疲勞、語言發展、記憶發展以及概念發展。

比奈不滿足于僅以臨床群體為研究對象,他的研究對象群體包括兒童、成人、精神殘疾者及其他臨床病癥患者、象棋專家、心算專家、專業演員、導演、作家和藝術家等,人群之多元令人驚嘆。

正如發展心理學家羅伯特·西格勒(Robert Siegler)所說:“極具諷刺意味的是,人們如此強烈地認為比奈的最大貢獻就是將智力簡化成了一個數字——智商分數,然而比奈的研究中反復出現的一個主題卻是智力的顯著多樣性。”2

比奈的超前研究令其同時代的學者望塵莫及。他在普通文本記憶、目擊證人證詞、群體壓力導致的從眾心理、內在動機、國際象棋技藝和心算等領域的工作為這些領域的現代研究拉開了序幕。甚至他在認知發展領域的工作也領先于皮亞杰在該領域的一些開創性研究成果。奇怪的是,皮亞杰很少承認比奈所做的工作。很難想象皮亞杰會不熟悉比奈的思想和研究成果。至于皮亞杰為何如此明顯地有意忽略比奈的開創性研究的動機,我不敢妄加揣測。如羅伯特·凱恩斯(Robert Cairns)所說:“實驗兒童心理學花了70年才趕上比奈在認知和記憶組織方面的一些深刻見解。”3

最了不起的是,比奈完全是自學成才的。1901年,比奈在給朋友的一封信中寫道:“我沒有受到任何老師的教導,完完全全屬于自學。現今我在科研上取得的成就完全是憑借我一己之力獲得的,沒有任何人曾幫助過我,一個也沒有。”西塔·沃爾夫(Theta Wolf)在她的傳記中指出,比奈的說法可能有些許夸大,因為忒阿杜勒·里博(Theodule Ribot)等一些學者曾給他提供過資助。4

究其原因,部分乃個性使然。通過對比奈的家人、朋友和同事的采訪,我們逐漸看到一個害羞、喜歡獨居、精力充沛且全身心投入工作的比奈的形象。

比奈去世后,他的女兒瑪德琳寫下的一番描述或許捕捉到了他主要的性格特點:

總的來說,我的父親是一個活潑的人,他喜歡微笑,說話通常具有諷刺意味,但舉止文雅、判斷力強,當然也通常心存疑慮……他本性善良、毫不做作、坦誠直率,但他鄙視一切形式的平庸。他對科學研究者十分親切和藹,但他對浪費他時間和打斷他工作的人非常冷酷無情……他似乎總是在沉思。5

然而,比奈大多數輝煌的研究成果卻被他所處的時代忽略了,這是一個莫大的悲哀。究其原因,毫無疑問主要在于他的個性以及他與主流學術界的疏離。他從未離開過法國,也未能在學術會議上報告他的工作。由于他沒有一官半職,因而也沒有大量的學生來繼續他的事業。用西格勒的話說:“比奈的產品極強,但營銷甚弱。”6

第一個智商測驗問世

1894年對比奈來說意義深遠。這一年,他拿到了自然科學博士學位,創辦了《心理學年報》(L’Année Psychologique,至今仍然存在),出版了一本關于日歷推算的心理學的書,并與他的合作者維克托·亨利(Victor Henri)及其他索邦大學實驗室的科學家合作出版了一本書,發表了許多論文,涉及暗示、記憶、性格和教育心理學等領域。

而比奈與亨利在1894—1898年的合作對第一個智商測驗的問世尤其重要。比奈與亨利一道尋求全新的方法以對“個體復雜、多樣的能力傾向進行精確的觀察”。71895年,他們宣布了開發智力測試的構想,勾勒出了一個雄心勃勃的計劃,將對記憶力、意象能力、想象力、注意力、理解力、暗示力、審美情趣、道德情操、肌肉力量/意志力,以及運動能力/手眼協調能力等10項不同的能力進行測量。

盡管較低級的感覺過程也被他們列入計劃,但他們明確指出,對更復雜的推理能力的測量可以成就更佳的智力測試。這一點與高爾頓、詹姆斯·卡特爾(James McKeen Cattell)及其他同時代的智力研究人員的想法不同。他們認為:“要研究兩個個體之間存在的差異,從最能體現智力的最復雜的過程著手是必要的;相較而言,考量簡單、基本的過程,其必要性則次之。”8該觀點預示了他們的后續發現。

作為第一步,比奈開始觀察甚至測試他的兩個女兒瑪德琳和愛麗絲,讓她們做各種認知和人格測驗。他為自己女兒做的很多心理測驗今天依然在使用,包括說出單詞、在單詞之間建立聯系、補充句子、描述物體和圖片、回憶各種信息,這些信息包含圖片信息以及陌生的外語句子。

有趣的是,比奈最初關于他的孩子的分析是定性分析。比奈信奉定性分析的重要性,密切關注錯誤、認知方式和力量模式。比奈為他的孩子在線性、常規性和原創性等維度的思維過程打分。在他最早發表的關于其觀察成果的論文里,他詳細深入地討論了兩個孩子身上的諸多不同點,指出瑪德琳表現出了極大的“穩定性”,能夠自愿、隨意地將注意力聚焦在某事上。他還注意到瑪德琳更加務實,但想象力差。相反,愛麗絲表現出更大的“易變性”,她對自己不感興趣的材料學習很困難,但表現出更加豐富的想象力。9反思型(reflection)和沖動型(impulsivity)的區別似乎一直以來都是比奈非常關注的一個話題。他在1903年出版的著作《智力的實驗研究》(The Experimental Study of Intelligence)一書里介紹了他的最終觀察結果。當時他的孩子們已經步入了青春期。10

在他的研究成果問世之后他補充說道,是時候繼續前進了。他注意到女兒性格上發生的巨大變化,他評論說對她們的最新描述與幾年前相比已不太適用。比奈深信,個體的心理發展從童年向成年的邁進必須予以重視,他認識到這樣的發展進程很有意義。

“假使有人成功地測量了智力,即對推理、判斷、記憶、抽象等能力的測量(對我來說這并非絕無可能),那么他會發現,代表一個成人智力發展平均水平的分數與代表一個兒童智力發展平均水平的分數將呈現完全不同的關系。”11

宛如命中注定,大約在1892年,西奧多·西蒙(Theodore Simon)找到了比奈。當時的西蒙是一位年輕的實習醫師,可以接觸到臨床病患人群。西蒙向比奈請教如何教育他在精神科實習時遇到的“不正常”人群。雖然沒有正式的學術頭銜,比奈還是同意指導西蒙寫博士論文,如此促成了心理學歷史上最為重要的合作之一。

在19世紀末,西歐和北美眾多國家的商界領袖和社會精英聯合起來推動了公共義務教育的普及。然而這里出現了一個嚴重的問題:如何對如此多樣化的兒童群體進行教育?一些倡導團體、教師組織和教育心理學家展開游說,讓特殊學校來滿足有心理障礙兒童的需求。

天賦實驗

1904年10月,千載難逢的機會出現了。時任公共教育部長的約瑟夫·肖米耶(Joseph Chaumie)設立了一個委員會,該委員會旨在識別需要接受另類教育的學生。作為法國集團(the French group)的積極成員,比奈看到了可以完成其測驗并將其付諸實踐的機會,比奈和西蒙立即投入工作。關于智力,他們提出了最接近其操作性定義的觀點:“我們認為,智力包括一項根本的能力,其變更或缺失對現實生活至關重要。這種能力就是判斷,或者稱作理智、實踐感、主動性,亦即適應環境的能力。智力的基本活動包括良好的判斷、理解和推理能力。”12

比奈認為,判斷有三個顯著的方面:指向性(direction)、調整性(adaptation)和批判性(criticism)。指向性是指專注于任務且確定解決問題必須要做的事情是什么的能力;調整性是指選擇恰當的策略以及監控策略是否有效的能力;批判性是指對自己的思維和行為做出批評,并以此為基礎做出改變,以提高任務表現的能力。

人們認為比奈和西蒙的評估對兒童來說具有“游戲的氣息”,他們強調對被試進行鼓勵。他們使用了比奈多年來開發的許多測驗項目,以創紀錄的時間(只花了短短一年)完成了第一個版本的測驗,促成了比奈-西蒙智力量表(Binet-Simon Intelligence Scale)的問世。13依照他們對智力的界定,最初的測驗項目只涉及日常實用技能,包括說出人體各部分名稱、說出圖片上物體的名稱、下定義、重復一串數字或將句子補充完整、描摹一個菱形、說出紙和紙板的區別或蒼蠅和蝴蝶的區別,以及在1分鐘內找出盡可能多的押韻詞的能力。

比奈和西蒙明確指出了他們測驗的目的:

我們的宗旨是要測量一個孩子的智力是正常的還是落后的。因此,我們應當去研究這個孩子在當前階段的狀況,僅此而已。我們不關心他的過去和未來是怎樣的,因此我們應當忽視他的病因,同時我們也無意區分他是后天性愚鈍還是先天性白癡……我們也無意提供預后,也不去回答其智力落后是否可以治愈以及是否不可避免的問題。我們僅把測驗局限于確定他目前的真實心理狀態上。14

他們的測驗用時20分鐘,包括30個項目,按照難度遞增的順序排列,每一個測試項目旨在反映不同年齡的典型兒童的能力。他們最開始為50名3~11歲的兒童做了測驗,在所有30個項目中,被認為是“白癡”(idiots)的兒童基本只能做到第6項,而“低能”(imbeciles)兒童很少能超過第15項。15在第一版的測驗中,他們提出了“五部分歸類方案”,包括盲、聾、醫學上異常、智力落后和情緒不穩定。

伴隨測驗,他們也附帶了一些警告說明。他們明確指出他們的測驗衡量的不是一個人智力的絕對水平。他們警告說,他們的測驗不能像直尺一樣提供精確的測量。相反,他們的測驗分數只不過是一種分類而已,這種分類是與其他同齡人的測驗分數相比較而言的。比奈無疑受到了他在圖書館啃書期間讀到的19世紀英國哲學家約翰·穆勒的影響,穆勒曾寫道:“關于人性的科學……遠遠不及當今天文學上所達到的精確標準。”16

比奈和西蒙也承認許多智力以外的因素可能會影響到測驗結果,例如不自然的測驗狀態以及測驗可能帶給兒童的恐懼感等。17他們還提到一些長期的影響因素,如生活背景、成長經歷、健康狀況和努力程度等。鑒于這些潛在影響因素的存在,他們強調對個體的測驗結果應當僅在擁有相似生活背景的個體之間進行比較。18最后,他們指出持續重新測驗的重要性,因為個體的成熟速率和智力體驗不同,其智力的發展進步速率也不同。比奈和西蒙后來對測驗進行了幾次修訂。修訂后的量表由56個項目組成,參照各年齡段通過相應測試項目的兒童所占的百分比(他們測驗了約200名年齡介于3~15歲的兒童),確定難易程度并進行排序。最重要的是,他們提出了智力年齡(metal age)的概念。舉個例子,如果一名兒童通過了10歲級別的測驗,但沒有通過11歲級別的測驗,那么便認為這個孩子擁有典型10歲兒童的智力,不管他的實際年齡有多大。1911年版量表的適用范圍擴大為3歲至成人,一共分為11個層級,每個層級包含5個項目。19

值得注意的是,比奈-西蒙智力量表從未催生出智力商數(IQ)。比奈去世多年后,西蒙曾表示,將智力歸結為一個簡略的智商分數偏離了他們設計測驗的初衷。20雖然比奈和西蒙的初衷是高尚的,但是我們必須得搞清楚:當時大多數法國人只不過是想把有智力缺陷的兒童剔除掉,以免拖累“正常”的學生。21對于那些具有“另類”教育需求人群的教育問題,當時并沒有成型的解決方案。他們關注的重點是將有智力缺陷的兒童甄別出來,而不是為他們提供補救措施。

比奈和西蒙為此深感擔憂:“成為特殊學校的一員永遠不應作為區分兒童的標志,請不要為這個標簽做辯護,萬不可以此對兒童蓋棺定論。”22

可惜啊,比奈提出的警告及注意事項幾乎完全被法國當局當成了耳邊風。比奈發現他又一次被邊緣化了。1909年4月15日,法國立法機關發表了一項聲明,宣布關于接受特殊教育的資格的判定,應當由一名醫師、一位督學以及一名主任或教師組成的團體來做出。立法機構壓根兒沒有提到心理學家,也沒有提到用智力測試對學生進行評估。23比奈和西蒙如此巨大的付出竟然在自己的祖國大地上被忽略了。比奈深感自己是個失敗者。

然而很快,他們的測驗像野火一樣蔓延到全球各地,尤其是美國。可令比奈駭然的是,他們使用測驗的目的是他始料未及的。在他生命的最后階段,他怒筆寫下了下面的句子,以抨擊認為測驗分數低的兒童永遠不會取得某些成就的觀點:

“永遠不會!”多么偏激的用詞!這種蓋棺定論是多么可悲!然而似乎竟有少數現代哲學家對此言論施以道義上的聲援,斷言個體的智力是一成不變、無法提升的。我們必須提出抗議,并用行動來反抗這近乎殘忍的悲觀論調。我們會證明,這樣的說法毫無根據……我們能夠通過練習、培訓以及最重要的——方法,來提升我們的注意力、記憶力和判斷力,從而真正提高我們的智力水平。24

為了表明智力是可修復的,比奈開發了各種“心智整形術”(mentalorthopedics),即智力練習,但是太晚了。1911年10月28日,比奈中風去世,年僅54歲。大規模測驗運動在美國剛剛興起,然而這些測驗的擁護者們對人類智力所持的定義卻完全不同。

哪些人屬于“智力孱弱”

亨利·戈達德(Henry Goddard)是新澤西州芬尼蘭訓練學校(Vineland Training School)的校長,他曾兩次接觸到比奈-西蒙智力量表,第一次是在1908年春到訪布魯塞爾途中,一年后又一次接觸到。但是兩次他都不以為然,沒有認識到這個測驗與他的工作對象——“智力孱弱”“智力孱弱”(feebleminded)這一術語最終被其他一系列術語所取代。首先是“智力缺陷”(或心理缺陷,mental deficiency),之后是“智力落后”(mental retardation),再后來是“智力障礙”(intellectual disability)。個體的相關性。戈達德后來指出:“這份量表的批評者中也許沒有一個比我第一次讀到時更抗拒它了。按照那種方法將智力劃分等級似乎不太可能,未免也太容易、太簡單了。”25但是這顆種子已經埋下了。

戈達德嘗試了一下這個測驗,很快便為之折服。他指出:“量表的使用帶給我們驚喜和滿足。它滿足了我們的需求。根據量表對兒童進行分類的做法與我們的制度經驗是契合的。”顯然,他一下子就被這份量表征服了。戈達德立即將比奈-西蒙智力量表的1908年版翻譯成英文,成為該測驗的美國“首席宣傳官”。他在學術會議上宣讀自己的研究結果,表明該測驗能夠可靠地劃分不同程度的“智力孱弱”個體,并在他1914年的著作《智力孱弱》(Feeble-Mindedness)里,采用高爾頓有缺陷的研究方法得出智力孱弱的血脈在家族當中流淌,因而具有遺傳性的結論。

盡管戈達德不能穿越時空給芬尼蘭訓練學校兒童的老祖宗們做比奈的測驗,但是他對自己的使命有清晰的認識,并以他自己對智力的定義為指導,他對智力的定義是:“一個受制于與生俱來的神經機制的單一心理過程……除非遭遇能夠造成該機制部分破壞的重大變故,否則該機制受后天因素的影響微乎其微。”

想必戈達德的說服力頗強,因為他說動了新澤西州當地學區的負責人允許他給當地普通學童做測驗。1911年,戈達德在題為《兩千名正常兒童接受比奈智力量表測驗》的論文中發表了他的研究成果。

教育工作者也開始為這個量表狂熱。1914年,有幾十個學區采用了比奈和西蒙的測驗。截至1916年,比奈和西蒙在1908年發表的論文(由戈達德翻譯)被復制分發了22 000份,連同發放了88 000套空白測驗題目。26

讓我們把與智商測驗相關的一切都放在歷史情境中看一下。在戈達德將目光投向比奈的測驗之前很長一段時間里,社會上已經出現了要求提出優生方案的巨大公眾壓力,這些方案不只是針對智力孱弱群體,而是針對范圍廣泛的“不受歡迎者”(undesirables),包括精神失常者、癲癇患者、慣性酗酒者、罪犯、妓女、流浪漢和貧民。在戈達德將比奈的測驗介紹給從事智力孱弱兒童教育的教師之前,已經有6個州出臺了成文的絕育法案,許多其他的州也出臺了禁止“不受歡迎者”之間通婚的法律。27

因此并不能指責智商測驗運動是美國絕育事件的唯一原因。盡管如此,戈達德也非完全無辜。他的確讓更多公眾關注到了智力孱弱這個“問題”,并且智商測驗也的確被用來為絕育做辯護。截至1964年,美國約有6萬人被強制實施絕育手術,而在德國,這一數字更加龐大。其中近乎一半受害者的絕育理由是智力缺陷,而智商測驗無疑為智力缺陷的診斷提供了依據。

“智商王國”的等級

對比奈-西蒙智力量表興趣盎然的美國人并非只有戈達德一個。斯坦福大學心理學教授劉易斯·推孟(Lewis Terman)同樣為之傾倒。他與戈達德都相信量表可以用于評定一個人是否“智力孱弱”,是否應該受到“社會保護”,然而與戈達德不同的是,推孟看到了量表的另一個用途。他對智商分布的上端部分很感興趣。他寫道:

事實上,早在1908年比奈-西蒙智力量表發行之前,年齡差異對智力的影響鮮為人知。當時的心理學家們未能意識到一名12歲的愚鈍兒童與一名8歲的正常兒童之間驚人的相似之處。一定程度的智力落后或加速發展對未來心理發展的重要性并沒有得到他們的認可……當比奈試行他們的1908年智力量表時發現,該量表在鑒定天賦優異兒童方面的價值一目了然。很明顯,以任何合理的標準去界定,智力年齡增速顯著的兒童都比智力年齡不超過實足年齡(chronological age,即實際年齡)的兒童更聰穎。28

推孟迫不及待地開始將比奈量表付諸實踐,他修訂了1911年版的比奈-西蒙智力量表,在1916年推出斯坦福-比奈測驗(Stanford-Binet test)。29從本質上講,推孟的測驗版本可謂煥然一新,他新增了40個項目,每個年齡6個項目,涵蓋3~14歲的兒童(比奈-西蒙智力量表為每個年齡設計了5個項目)。例如,9歲兒童的測驗包括以下類似項目:

1.日期:今年是哪一年?今天是本周的第幾天?

2.將5個重物從重到輕排序;

3.心算;

4.倒背4個數字;

5.用3個特定的詞造一個句子;

6.找韻律。

起初,比奈和西蒙的測驗對象是大約50名被教師評定為“智力一般”的兒童,而推孟則選擇了大約1 000名4~14歲的兒童。他所選擇的兒童來自各所學校,學生們社會階層分布平均。與比奈的量表相比,在不同項目的難度層面,這樣的大型標準化樣本給予了推孟更為精確的信息。以這些信息為基礎,推孟認為有必要將比奈量表中的大部分項目按照不同的年齡階段重新組合。

評分步驟是推孟取得的另一項進展。他保留了比奈的“智力年齡”理念,但也借鑒了德國心理學家威廉·斯特恩(William Stern)的智力商數觀點——智力年齡除以實足年齡。30這一公式能將那些智力年齡相同但實際年齡不同的人區分開來,因此十分有用。推孟不喜歡小數點,因此他決定將斯特恩的公式乘以100以得到整數。由此,計算智商的公式就變成:

智商=智力年齡/實足年齡×100

(IQ=MA/CA×100)

天賦實驗

讓我們來觀察3名“智力年齡”相同的實驗對象,以便了解該公式是如何運作的。正如表2-1所示,3人的測驗得分相同(換言之,“智力年齡”相同),但他們的智商將取決于他們的實足年齡。毋庸置疑,智商公式是推孟對比奈量表的一大改進,然而它的弱點也很快顯露無遺。對成人而言,智商意味著什么?假設你的實足年齡為60歲,而智力年齡為50,那么你的智商就是83;但如果你的實足年齡為50歲,智力年齡為60,那么你的智商就驟然升至120。我們真的能推斷智力年齡在20歲和10歲之間的差別與60歲和50歲之間的差別相同嗎?我希望大家能從中覺察出問題所在。

表2-1 推孟智商公式實驗

在對成人進行測驗時,推孟的應對之策即在公分母實足年齡上加16。后來他又將該數字改為15,因為他發現智商的平均值差不多在這個年齡停止了增長。31當然,鑒于他從未真正測驗過18歲以上的人群,因此這不過是他的猜測而已。對此,推孟的辯解是:“15歲的智力年齡也就代表了16歲及以上被試智商的常模。”當代衰老研究并未證實這一說法,公平而言,他對這項研究也是一知半解。

推孟認識到智商的另一個棘手“問題”——易變性。并非每個年齡群體都表現出相同的智力增長幅度。智商的平均浮動幅度為16點——根據年齡階段不同有12~20點的差異。起初,推孟僅將浮動幅度列為偶然現象,然而他發現,12歲的年齡群體中呈現出了20點的變動,這樣顯著的數字是很難被忽視的。最終,他將這種現象歸結為“青春期的開啟”,盡管無人向他證明青春期與認知發展速率相關。

顯而易見,推孟不得不摒棄智商這一理念,表明測驗分數偏離平均分數程度的標準分數更合適,因為標準分數將年齡造成的浮動納入了考慮范圍。然而完全摒棄智商理念并非易事,因為智商已經滲透到美國公共教育系統的“靈魂深處”,且標準分數更為繁雜,不易被學校心理專家參悟。因此在1973年的修訂版本中,推孟和梅里爾(Merrill)保留了智商分數,但加入了一份轉化表,學校心理專家可將智商數值轉換為標準分數。

那么分級是如何進行的呢?推孟不得不為每個波段的智商分數定義一個標簽,以便學校心理專家解讀各個分數。在第一版斯坦福-比奈測驗的基礎之上,推孟引入了世界上第一個智商分級系統,見表2-2。

表2-2 世界上第一個智商分級系統

以上并非是推孟智商分級系統的全部內容,還包括下面這些:

智力孱弱群體中,智商介于50~70之間的人大部分為愚魯(moron,高度、中度、低度),那些介于20或25至50的群體則被分級為低能,低于20或25的則為白癡。32

如果你深究的話,可以發現推孟的偏見所在。他認為區分“智力孱弱”的不同級別用處不大,聲稱“低于智商平均值的每個個體都或多或少地存在智力孱弱”。需要明確的一點是:對智商分級的第一種方案完全是基于一個研究者對自己測驗對象的個人之見。推孟與戈達德都深信自己的測驗所評估的“智力孱弱”狀態是永恒不變、代代相傳的。

有一點可以確定,推孟的結論經久不衰。他的測驗不僅成為所有新的智商測驗的黃金標桿,他所制定的智商分級標簽還影響了整整一代的智商分級模式。有趣的是,連推孟都為自己的影響力感到震驚。第一版測驗發行大約15年后他寫道:“我知道我對比奈量表的改編比其他同期的測驗都先進,但我當時沒想到它竟如此風行,我還想象著它可能在數年間就會被更好的測驗所取代呢。”33

然而事實并非如此。

離差智商:鐘形曲線上有所有人的智商分布

斯坦福-比奈測驗在半個世紀里都是美國智商測驗的首選。當美利堅舉國上下都沉浸在大規模智商測驗的狂熱中時,紐約市貝爾維醫院(Bellevue Hospital)的首席心理學家戴維·韋克斯勒(David Wechsler)卻對智力表達了不同的見解。韋克斯勒對實踐的敏感度是對智商測驗建立初衷的回歸。韋克斯勒與比奈都將智力視為一個人理解、應對其所處環境的能力,并將智商測驗視為揭露一個人人格中重要信息的臨床工具。

韋克斯勒于1939年創造的韋克斯勒-貝爾維智力量表(Wechsler-Bellevue Intelligence Scale)是智商測驗歷史上一大重要成就。34自此,他的很多決定都影響了后世智商測驗的編制。韋克斯勒所取得的部分成就是技術層面上的,他提出了離差智商(deviation IQs)的理念,并將其與舊的比率智商(ratio IQs)區分開來。但新的理念未能屹立不倒:比率智商的概念已經深入人心,所有人都把韋克斯勒的離差智商理解為比率智商。盡管如此,離差智商的提出仍是一大進步。

在創造離差智商這一理念的道路上,韋克斯勒不得不做出一些武斷的決定。首先,他將100定義為智商的平均值。之所以選擇這個數字,是因為它在舊的公式里已經為人所熟知。同時,他還需選出一個標準差,他的選擇是15,因為這是個容易被整除的數字,并且與推孟和梅里爾所使用的16相近。35以上都是他個人的武斷決定,但這些決斷也有道理可循,因為它們所采用的數值都是自推孟首次發布他的測驗方法以來為公眾所熟知的。36離差智商數值允許測試人員將數值記錄在一條鐘形曲線上,如圖2-1所示。如果平均智商為100,而一個人的智商為115,那么這個人就比平均值高一個標準差;相反,如果智商為85,則比平均值低一個標準差。

約68%的人智商介于85~115,95%的人介于70~130,這也就意味著有5%的人位于鐘形曲線的兩個極端——左側長尾和右側長尾各占2.5%。

圖2-1 智商分數分布

對于喜歡與數字而不是與圖表打交道的讀者來說,表2-3就是與不同標準分數(智商分數)相符的比率排行清單。智商分數(即智力年齡除以實足年齡得到的數值)自20世紀30年代起已經不再為人使用,但這個稱謂如今仍深入人心。當今,一個人的智商數值在嚴格意義上來說是一種比率排行,它告訴你在同一橫斷測驗里有多少同齡人得分在你之下。假如你在韋克斯勒測驗中得到110分,那也就意味著你的得分高于參加同樣測驗的75%的同齡人。

表2-3 智商分數比率排行單

嚴格意義上說,這就是一個智商分數的全部意義。正如比奈早在1898年指出的那樣,你的智商測驗分數并非智力的絕對體現,它只是一個相對的分數。智商沒有絕對的零分,正如體重和身高一樣。你不能僅僅因為你的智商是160,就吹噓自己比智商為80的朋友聰明一倍。同樣,140分與160分之間20分的智商差距,與90分與110分之間的差距相比,未必具有相同的心理學意義。

然而,韋克斯勒最重要的創新并非測驗的內容(他的很多測驗項目都直接取材于前人的測驗),也并非用離差智商取代智力年齡/實足年齡的公式(盡管此舉意義非凡),他最大的進步在于明確測驗的目的:作為臨床工具。他把項目分為兩類——言語量表和操作量表,以便從業人員在個人施測的情況下亦可觀察學生回應模式的質量。

該量表的出版者對此心存疑慮:為何要大費周章地去測驗一個人的智力?這與美國人崇尚的快速、廉價、高效地將人群分類的方式大相徑庭。于是韋克斯勒自費出版了自己的測驗方式。他主動出擊,對來自科尼艾蘭(Coney Island)、布魯克林及紐約市的2 000名兒童、青少年及成年人進行了測驗。重要的是,他意識到找到一個代表性樣本的重要性。比如,如果你想知道7~70歲的美國人在一場智商測驗中表現如何,那你就要去測驗每個年齡階段在人口統計學中具有代表性的人群,包括他們的性別、年齡、社會層級、所在區域等。當然,當韋克斯勒在紐約第一次將研究付諸實踐時,他并沒有地區性的代表樣本。當韋克斯勒將他的測驗在其他重要人口統計數據上進行仔細地規范之后,美國心理公司(The Psychological Corporation)突然表示有興趣出版該量表。

由于斯坦福-比奈測驗深得人心,所以韋克斯勒的測驗未能一炮走紅。然而到了20世紀60年代,天平開始向韋克斯勒的測驗傾斜,人們體會到了突破單一智商分數的需求,教育者們也意識到了評估一名兒童智商分數模式的好處。韋克斯勒的原始測驗包括10項子測驗,包含獨立的言語智商和操作智商測驗分數。而斯坦福-比奈測驗直到第四版,37仍僅能提供言語導向的單一智商分數。

韋克斯勒的測驗修訂協作伙伴之一艾倫·考夫曼(Alan Kaufman)擴展了韋克斯勒將智商測驗作為臨床工具這一目的。1979年,他引入了智力測試(intelligent testing)的理念。這一方法將臨床醫師置于測試之上,使得測試人員能夠將每一名兒童看作獨立的個體:“測試的焦點是兒童本身,主要目標是將對測試結果的交流放在特定的情境中進行——考慮兒童的特定背景、特有行為以及使用測試項目的方法。不再強調總體評分,而是要求測試人員具備靈活性和洞察力。測試被視為一項動態輔助機制,而非作為分級安置、貼標簽或是任何其他形式學術壓制手段的工具。簡言之,對智力的測試就是關鍵所在。”38

許多現代智商測驗都有內置的智能測試方法。韋克斯勒兒童智力量表第四版(WISC-IV)以及韋克斯勒成人智力量表(WAIS-IV)都包括“過程分數”(process scores),基于伊迪絲·卡普蘭(Edith Kaplan)的波士頓過程研究法(Boston Process Approach),該分數允許臨床醫師洞察導致一名兒童答錯一道問題的過程。韋克斯勒兒童智力量表的第四版包含了一本手冊,以便臨床醫師更好地理解一名兒童對測驗項目作出獨特反應的原因所在。其他的現代智商測驗,比如考夫曼兒童成套評估測驗(Kaufman Assessment Battery for Children)第二版同樣內置質量指標(QIs),以便在測試過程中引導測試人員對兒童進行觀察。正如艾倫·考夫曼在《智商測驗101》(IQ Testing 101)中提到的那樣:“這里的經驗教訓是,智商測驗是基于臨床觀察建立的,比起一堆測驗分數,智商測驗能為技能嫻熟的專業測試人員提供更多信息,而一位心理學家的測試經驗是不可忽視的無價財富。”39

斯坦福-比奈測驗已經出到了第五版,更加成熟。然而更新到第四版的韋克斯勒測驗仍是大部分美國心理從業人員的心頭之選。40

CHC框架:終于有了一個關于人類認知能力的總結

在20世紀的大部分時間里,智力理論與智力實踐之間是涇渭分明的。在地球的這一邊是對認知測驗實踐運用興致不高的科學家們在辯論智力中是否存在一般智力因素(見第10章),而在地球的另外一個角落,智商測驗編制者們卻在對20世紀二三十年代的測驗進行細小的改進。雙方鮮少交流,少到幾乎能讓人認為他們完全屬于兩個星球。

20世紀60年代,神經心理學領域開始取得進展。該領域影響較大的神經心理學團隊是諾貝爾生理學及醫學獎獲得者羅杰·斯佩里(Roger Sperry)和他的研究生邁克·加扎尼加(Michael Gazzaniga)。加扎尼加在他的學術自傳《雙腦記》中詳細講述了裂腦研究的故事。該書中文簡體字版已由湛廬文化策劃、北京聯合出版公司出版。——編者注他們對癲癇患者進行研究,這些患者的腦胼胝體(連接大腦左右半球的纖維束)已經斷裂,這些進行過手術的“裂腦”患者表現出更少的癲癇癥狀,但是他們也出乎意料地表現出完全分裂的心智狀態。

大約在同一時期,關于裂腦的研究正如火如荼,艾倫·考夫曼偶然接觸到神經心理學的研究并好奇為什么智商測驗的編制者沒有將最新的研究發現融入測驗。不久,艾倫和他的妻子納丁(Nadeen)研發了新的智商測驗,其主要進步體現在“教學項目”(teaching items)的運用上,“教學項目”是指測試者首先瀏覽幾個測驗項目樣本并解釋答案背后的推理過程,以確保被試理解這個測驗。測試者還需要使用各種方式與兒童交流,在必要的情況下需要用不同的單詞、手勢、語言甚至是美國手勢語(American Sign Language)。這些進步使得被試能夠獲得個性化的測驗指導,而且增加了測試者和被試之間的交流。這樣,智商測驗有更大可能衡量到被試的重要能力,而不僅僅是讓他們被困于對測驗指令的理解上。

盡管后來很快證明他們的測驗主要考察的是短時記憶能力和視覺加工能力,但是他們的測驗意義重大,因為這是首個基于理論、針對個體實施的臨床智商測驗。2004年,艾倫和納丁修訂了他們的考夫曼兒童成套評估測驗,增加了對計劃和學習能力的測驗。20世紀80年代后期,神經心理學和認知測驗繁榮發展,對一系列認知功能進行了衡量。于是,為所有不同的測驗設置共同行業語言的時候到了。

1986年在達拉斯召開的會議以及1999年在北卡羅來納州教堂山(Chapel Hill)召開的會議皆就此問題展開討論。會議結束后不久,經伍德科克-約翰遜認知能力測驗的作者理查德·伍德科克(Richard Woodcock)的協調,與會的兩名智力理論家——約翰·霍恩(John Horn)和約翰·卡羅爾(John Carroll)同意將他們的理論融合成一個統一的框架,即“卡特爾-霍恩-卡羅爾(Cattell-Horn-Carroll,簡稱CHC)認知能力理論”,如此,關于認知能力最具影響力的理論框架誕生了。42

最終,從業人員擁有了可供使用的行業通用語言,這種語言不管在何種特定測驗中都能應用。學校心理專家同樣可以挑選采用他們需要的測驗來評估學生認知的優勢和劣勢領域,他們可以運用這些信息制定具體的行動計劃來幫助學生提升他們有困難的方面。

CHC框架包含認知能力的不同等級。最低一級是70多種“窄域”(narrow)能力,它們組成了更高一級的9種“寬域”(broad)能力。最高級別只有“一般智力”(見第10章),然而,由于其在指導設計干預方面實用性極低,因此這一層面分析的重要性在CHC框架中被削弱。圖2-2體現了CHC框架中的9種寬域認知能力(完整框架見書后所附CHC智力模型2.2版直觀圖示)。CHC框架是至今最全面的關于認知能力的分類,它影響了當代所有智商測驗的編制,包括斯坦福-比奈測驗的第五版(最新版本)、考夫曼兒童成套評估測驗第二版、伍德科克-約翰遜認知能力測驗第三版,以及差異能力量表(Differential Ability Scales)的第二版。43盡管目前使用的其他智商測驗并沒有體現出明顯的CHC理論基礎,但是人們已經采用了新的統計技術將現代測驗映射到CHC術語庫中。如此一來,所有人都可以使用同樣的行業語言了。

圖2-2 卡特爾-霍恩-卡羅爾(CHC)認知能力理論中的定義

資料來源:W.J.Schneider and K.McGrew,“The Cattell-Horn-Carroll Model of Intelligence,”in Contemporary Intellectual Assessment:Theories, Tests, and Issues, ed.D.Flanagan and P.Harrison,3rd ed.,99-144(New York:Guilford,2012).經許可使用。

表2-4所列為時下使用范圍最廣的一些智商測驗以及各測驗所衡量認知能力的CHC術語表述。45

表2-4 CHC術語表述

關于CHC模型實用價值的研究鳳毛麟角,大多數與學校或學業相關的CHC研究都是使用伍德科克-約翰遜的認知能力測驗展開的。盡管如此,近期凱文·麥格魯(Kevin McGrew)和芭芭拉·溫德林(Barbara Wendling)對20多年間關于CHC框架的研究進行了綜述,他們在論文中提出了以下重要結論:45

●大多數的“行動”都處于窄域能力的層面。正是這些具體技能(而非總體智商分數)對理解與發展針對閱讀和數學的干預措施有重大意義。

●專業人員應當采取智能測試方法并摒棄“一測定乾坤”的慣用做法:“評估方法的智慧設計不是來自某個更高的權威,而是來自已有研究的綜合與專業經驗和臨床經驗的整合。”

●不同的能力會在發展過程的不同時期促進成就的獲得。“在進行數學和閱讀評估之前,從業者在設計最初的評估措施之時,應當問以下問題:當前關注的子領域是什么?學生的年齡有多大?研究表明有哪些CHC框架中的能力與該年齡段學生在這個(些)領域的相關性最大?”

●智商測驗是有未來的。“過去20年中時代變了,智商測驗也發生了很大變化……當代智商測驗應被視為一個寶貴的工具箱,每一件工具都是由‘智力匠人’根據目前所面臨的問題精心挑選的……我們不認為當前的綜述是這一旅程的終點,相反,這是朝著理解認知能力和學業成就之間的關系所邁出的重要一步。”

但是時代真的變了嗎?問題的答案取決于你問的對象。在業內人士中,有人會告訴你智商測驗得到了真正的革新,也有人會說今天的智商測驗不過是20世紀初的舊藥換了新瓶。毋庸置疑,自智商測驗被誤用和濫用猖獗的時期至今,我們的確取得了長足的進步,如今智商測驗不再被隨意用作以往的目的。

但是智商測驗真的有未來嗎?智商測驗尤其是兒童CHC認知能力的測量真的能夠預測他們的成就并指導教育者對他們做出教育安置決定嗎?在本章,我嘗試為大家再現智商測驗的歷史及其發展。我對眾多現代智商測驗理論家和編制者懷有無上的尊重,我相信他們都帶著最好的意圖,而且他們當中的很多人都被我當作朋友。

但是這并不意味著我會盲目地認為他們的測驗是中肯的。在接下來的幾章中,讓我們一起近距離地審視智商測驗如何被用來把人分成三六九等并打上不同的標簽。我們首先要看一看“學習障礙”這個標簽,然后我們將探討“天賦優異”。近距離審視十分重要,因為每天都有成千上萬甚至上百萬個決定在很大程度上是依照現代智商測驗結果做出的。這些決定非同小可,關乎人們未來成功的機會和夢想的實現。

主站蜘蛛池模板: 海南省| 久治县| 昌江| 额敏县| 桃江县| 军事| 怀仁县| 读书| 双城市| 桐城市| 韶山市| 方山县| 新兴县| 贵港市| 郴州市| 松滋市| 曲松县| 石渠县| 惠来县| 建昌县| 新巴尔虎左旗| 盐亭县| 出国| 同德县| 娄底市| 洞头县| 佛学| 民县| 财经| 临夏市| 枝江市| 九龙城区| 石狮市| 房山区| 壤塘县| 古田县| 轮台县| 金门县| 吕梁市| 岳西县| 溧阳市|