官术网_书友最值得收藏!

2.1 教學評價

Russell和Airasian(2012:3)把課堂中的教學評價定義為“收集、綜合和解讀信息來做決策的過程。教學評價貫穿于課堂生活中”。Turner(2012:65)則認為在語言教育領域,課堂評價的定義目前還沒有權威的論斷。但是課堂評價的主要特征可以總結如下:課堂評價包含了教師運用一系列策略來規劃和進行各類關于學生語言運用信息的收集,也包含教師分析和解讀這些信息,給出反饋,并運用這些信息來為促進教學和學習做出決策。Turner(ibid:67)指出,在文獻中與課堂評價這個術語緊密相關的術語有:另類評價(Fox,2008),真實性評價(O’Malley & Valdez Pierce,1996),動態評價(Lantolf & Poehner,2008),診斷性評價(Alderson,2005),表現性評價(McNamara,1996),基于課堂的評價(Genesee & Upshur,1996),基于教師的評價(Davison & Leung,2009),校本評價(Davison,2007),促學評價(Black & Wiliam,2003)等。這些評價與傳統的外部命題、通過大規模測試來篩選和實行教育問責的做法構成鮮明的對比。但是這些評價活動共同構成教師日常教學中需要面臨的教學評價。由于課堂是教師評價活動的主要場所,因此本節重點討論課堂評價。

2.1.1 課堂教學與評價融合的理論基礎

根據Shepard(2000),課堂教學與評價的融合是從20世紀90年代開始的。它受到了兩個方面因素的影響。第一、關于學習的理論轉向認知和建構主義。認知理論基于皮亞杰(1954;1970)等,強調了個人認知的發展和對知識的建構,而建構主義基于Vygotsky(1978),強調知識是在社會中建構的。皮亞杰的發展理論是一種整體模式。學習是不斷發展的過程,其中有變化、自我產生和建構,每次進步都基于已有的學習經歷。學習經歷吸收、協調和平衡的過程,新的經歷被吸收融合入現有的圖式,然后經過協調,最后達到平衡,于是產生新的知識(Kaufman,2004:304)。

Vygotsky(1978)的社會建構主義理論強調了社會文化環境對學習和知識產生的影響。學習是在社會中完成的。他的最近發展區域(ZPD)描繪了學習者當前水平與當下能夠達到的水平之間的距離。基于最近發展區域的描述,教師可以設計相應的活動支撐學習者的學習。

Shepard(2000)指出這種學習理論認為:知識是在某種社會文化中獲得的;學習者在社會環境中建構知識和理解;新知識受到已有知識和文化視角的影響;有智慧的思想包含了對學習和思想的“元認知”意識或者自我監控;深刻的理解扎根于個人腦中并能夠轉換;認知表現依賴于個人情感和自我認同。

在這種思想的影響下,產生了影響課堂評價的第二個因素:人們對課程論有了新的認知,即認為所有的學生都有學習的能力;富有挑戰性的學習對象應該著眼于高層次思維和問題的解決;對不同的學習者學習機會均等;對學科的語篇和實踐采用社會視角;校內的學習內容在校外真實存在;要培養出重要的情感和思維習慣;在關愛的社區中踐行民主的行為。在這種視角下,傳統的大規模測驗已經很難滿足這種多元的學習結果。新的課堂評價要能夠誘發高層次的思維,既要關注結果還得關注過程,而且學生也應該能夠積極地參與(Shepard,2000:8)。同時,Pellegrino及同事(2001)也試圖將認知科學與測量的理論和實證前沿發展結合起來,提出評價的觀察結果和解釋應該與學習者在某個領域的認知模式結合起來。

在外語教學領域,Kaufman(2004)認為建構主義也在逐漸影響外語教學。在這種情況下,傳統的測試也不能完整地對學習者的語言進行評價,研究者們提出了另類評價。Maslovaty和Kuzi(2002:200)認為另類評價就是基于建構主義的原則上的,因為它蘊含著真實性的任務,對學習起到重要作用,并跟學習者的真實世界緊密相關。另類評價也跟社會文化理論有緊密的關系。Fox(2008:101)指出,社會文化理論中的重要概念,如Vygotsky的最近發展區域或者介入性的支持都與另類評價非常一致。

2.1.2 課堂評價的歷史變遷

從總體上說,課堂評價經歷了從直接采用外界測量專家命制的標準化測驗來促進學校進步,到關注課堂環境,更多運用教師根據實際教學情況編寫的多樣化的評價手段來收集學生進步信息進而提供反饋的過程。

二十世紀初,測量專家們認為客觀性測試能夠用來研究和提高學校成績,并根據學生個體需求提供診斷和分班(Symonds,1927;Thorndike,1913)。在這一思想的影響下,人們通常認為測試專家們要編制標準化測試,而教師可以直接使用這些測試來幫助他們做課堂決策。此外,測量專家傳授給教師們怎樣根據測量學原則去設計自己的測試。Shepard(2006:623)指出,在這一階段,測量學教材的框架就是教授教師們效度、信度、試題設計、題目格式、題項分析、試后數據分析等。這種幾乎完全依賴正式的測試、小測驗和評分的框架至今還在深刻地影響著今天的教育測量學教材。可以說,這段時間課堂評價被看作是大規模測驗的“衍生物”(Turner,2012)。在語言測試領域,這種做法被廣泛地體現在會議發言,甚至是在給教師們撰寫的語言測試教材中。換句話說,大規模測試中的測試類型/任務,結果的解釋、使用和匯報都被認為能夠被應用于課堂評價中。

二十世紀末,另外一種范式出現。這種范式更加關注學生的理解和形成性評價,使得評價成為學生學習過程中很重要的環節(Black & Wiliam,1998;Gipps,1999;Shepard,2000)。Black 和Wiliam(1998)強調課堂評價可以幫助教師收集信息來及時地滿足學生的學習需求。同時他們也展示了設計良好、被恰當地使用的形成性課堂評價對學生,尤其是那些慢進的學生的進步有非常深刻的影響。

在此背景下,語言測試與評價也在不斷地演變,并開始注意到課堂學習環境的重要性和獨特性,也關注到教師在解讀課堂環境語言評價中的重要角色。Turner(2012:65)指出,在20世紀90年代,為職前和在職教師準備的語言評價教材開始將課堂評價看作是獨特的范式,其中較為典型的教材有Genesee和Upshur(1996),O’Malley和Valdez Pierce(1996),Brown(2013a)等。而研究者們也逐漸地對語言課堂評價研究產生興趣,并有了探索性的研究(如Leung,2004;Rea-Dickins,2006)。研究者們的焦點之一是教師的角色。

2.1.3 課堂評價的模型

基于建構主義視角,Shepard(2000)構建了學習文化中的課堂評價功能。在其中,她勾畫出了課堂評價的七條原則,包括運用富有挑戰性的任務來誘發高層次思維、關注學習結果的同時關注學習過程、把評價看作不間斷的過程并與教學緊密融合、形成性地使用評價結果來支持學生學習、讓學生明確了解教學預期目標、學生積極地評價自己的成果、評價結果既用于評價學生也用于評價教學。

Davison和Leung(2009)對基于教師的評價的特征進行了概括。認為它自始至終都有教師的參與:從評價規劃到確定和設計合適的評價任務再到基于評價做出推斷。他們對基于教師的評價的特征概括為以下九點:

↘允許教師運用多種任務,收集一系列學生作品;

↘能夠被教師修改以便符合特定的班級和學生的教學目標;

↘在普通的課堂內實施,而不是在考場進行;

↘評價由學生的任課教師進行;

↘能夠使學生更加緊密地參與評價過程,尤其是與同伴互評和自我評價相結合時更是如此;

↘開啟了學習者主導的詢問,從而實現教師對學生學習的支持;

↘允許教師提供給學生及時并富有建構性的反饋;

↘鼓勵連續評價,刺激對教學的及時調整;

↘是對外部考試等評價形式的補充。

(譯自Davison & Leung,2009:395-396)

Davison(2008)對教師的課堂評價框架直觀地展示了教師、學生、課程和課堂間的關系(圖2.1)。其中,我們可以看出教、學、評同時處于課堂評價框架的核心部位。而課堂評價總體上被分為四個步驟,即規劃評價、收集關于學生學習成果的信息、做出專業性的判斷和提供恰當的反饋或建議。貫穿每個步驟的重要內容是記錄。從這個框架中,我們也可以看出教師在其中扮演的角色和應該擁有的素養。

1

圖2.1 Davison課堂評價框架(改編自Davison,2008)

Davison的課堂評價與促學評價有極大的相似性。促學評價(Assessment for Learning)首先是20世紀80年代末在英國由評價改革小組(Assessment Reform Group)提出的(Assessment Reform Group,1999,2002;Black & Wiliam,1998)。評價改革小組(1999:2)指出,促學評價是相對應于對學習的評價(Assessment of Learning)而提出的。對學習的評價是為了評定學生等級及記錄學生成績,它有確立的程序,也是終結性評價。促學評價要求評價有優先的次序、新的步驟和新的承諾。評價改革小組(1999:7)提出了促學評價的幾個重要特征:

↘將評價看作是教學和學習的重要部分;

↘與學生分享學習目標;

↘旨在幫助學生了解和明確他們想達到的標準;

↘學生參與自我評價;

↘給出反饋,幫助學生認識他們自己的下一步行動,以及如何去行動;

↘認為每個學生都能進步;

↘教師和學生審閱和反思評價資料。

同樣地,Earl(2013:27)指出,在促學評價中,教師會運用任何能夠提供給教師關于學生學習進展情況的手段,例如觀察、練習、課堂提問、討論,來明確地了解學生的優勢和不足,以便給學生反饋,促進他們的學習。在促學評價中,教師也會運用到他們對學生情況的了解、他們對評價環境的了解,以及課程目標來確定學習需求。

在促學評價這個框架中,Earl(2013:28)衍推出另外一種評價行為,即以評帶學(Assessment as Learning)。它強調的是運用評價作為培養和支持學生元認知的過程。Earl的“以評帶學”進一步強調了學生在評價過程中的角色。學生不僅是學習和評價過程的貢獻者,而且是學習和評價中至關重要的連接者。

2.1.4 課堂評價對學習的作用

有關課堂評價對學習的影響的研究越來越多,多數研究發現了課堂評價對學習有促進作用。Crook(1988)綜述了課堂評價對學生學習的作用。他的研究涵蓋了傳統的課堂評價(如測試)、非正式的評價(如課后練習),以及教師課堂提問。他的結論是教師的課堂評價過多地關注評分,而太少關注評價對學習的幫助作用。過度重視評分不僅浪費了原本可以用于其他更好的教學活動的時間,而且對學生來說是有危害的,因為它打擊學生的學習興趣,使得成績差的學生的自我效能更低,降低了反饋對學習的效用,使得學生之間的關系更糟糕。

Bangert-Drowns及同事(1991)綜述了課堂評價實踐對學生學習的影響。他們調查了頻繁課堂測驗的效果,發現在15周內至少有一次測試的學生比沒有測試的學生的成績要高出0.5個標準差,測試越多成績越好,但是頻率為兩周一次的就沒有更明顯的效果了。他們還匯報了對40個研究元分析的58個效應值,發現反饋的功效取決于反饋的性質、方式和是否能夠提高學生的意識。

Black和Wiliam(1998)審閱了世界范圍內關于評價的且具有影響力的文章。發現評價可以顯著提高學生的學習成績。形成性評價的效應量在0.4~0.7之間,比大多數教育干預手段的效果都要好。其中,反饋是課堂評價或形成性評價的核心。

Hattie(2009)在長達15年之久的研究過程中對800多項影響學生學習的元分析進行了綜合,其中,關于頻繁測試的效應量為0.34(p.178),關于反饋的效應量為0.73(p.173)。在元分析基礎上,他提出了在教育領域要達到卓越表現教師們應該擁有的六條指標。其中跟本研究最相關的有兩條:教師在學生學習中擁有巨大的影響力;教師要理解學習意圖和學習成功的標準,理解所有的學生在何種程度上達到了這些標準,以及針對學生目前的知識和理解跟設定目標之間的差距明確下一步該如何做,也就是要關注“往哪里去”、“怎么去”和“下一步怎么做”的問題(Hattie,2009:238)。

Wiliam(2007/2008)認為,形成性評價如果運用恰當,可以使得學生的學習速度翻倍。在關于教師使用形成性評價的綜述中,Wiliam(2011)指出,我們現在有很強的理論和實踐證據證明將評估和教學整合起來,將對學生的投入和學習成果都起到前所未有的作用。因此,可以認為,教師擁有評價素養,可以激發教學評價作為教學的催化劑的功能。教師越是了解評價,越能夠挑選那些能夠幫助他們教學的評價。這些評價不僅僅是評判教師教學效果的工具,更是直接成為教師教學的工具。

Earl(2013:53)指出在“以評帶學”框架中,教師采用下面的方法就能夠促進學生發展:

↘告訴學生何為自我評價并傳授自我評價的技能

↘指導學生設定目標,并監控進步情況

↘提供給學生優秀的、能夠反映課程目標的學習成果的模板和樣例

↘指導學生培養內部反饋或自我監控的機制,并使用它們來驗證或質疑他們自己的想法;指導學生自如地應對學習新內容中不可避免的模糊和不確定性

↘經常地提供富有挑戰性的機會來讓學生變成更加自信、熟練的自我評價者

↘監控學生的元認知過程以及他們的學習,并提供描述性的反饋

↘創造安全的環境讓學生能夠冒險,并隨時給予支持

(譯自Earl,2013:53)

另外一方面,學者們針對教師在課堂評價中的反饋問題作了大量的研究。最早關于反饋的研究和理論源自100多年前,而其主要的心理學根據是行為主義(Thorndike,1913)。積極的反饋被看作是“積極的鞏固”,而消極的反饋則被看作是“懲罰”。兩者都會影響學習,但是不同反饋的效果是不同的。

Sadler(1989)關于形成性評價的模型受到廣泛的認同。他指出教師如果僅僅反饋給學生答案是否正確是遠遠不夠的。為了讓形成性評價促進學習,要讓反饋與表現標準緊密相關,并且提供給學生如何改進的策略。同樣,Sadler(1998)認為形成性評價對學生學習,特別是能力水平相對較低的學生,有很大的促進作用。而這其中,反饋的作用尤其大,因此反饋的質量尤為重要。Sadler將常見的教師反饋分為如下三個步驟:第一,教師必須關注學習者的產出。第二,教師將學生的產出跟評價指標相對比,經過思考,看出學習者的優缺點。第三,教師做出明確的反應,比如給分或者寫評語。

Brookhart(2008:1)明確地指出,給出良好的反饋是教師們必須掌握的,因為它是好的形成性評價的關鍵部分。反饋的性質和反饋的環境都是很關鍵的。

近年來,研究者們試圖從100多年的研究中挑選出哪些反饋有效,哪些反饋無效(如Bangert-Drowns,Kulik,Kulik,& Morgan,1991;Butler & Winne,1995;Hattie & Timperley,2007;Kluger & DeNisi,1996)。一些研究者也試圖研究有效的反饋的特征(Johnston,2004;Tunstall & Gipps,1996)。例如,Kluger和DeNisi(1996)對反饋研究進行了元分析。他們的主要發現是反饋的平均效果是0.41,也就是在所有這些研究中,得到反饋的組比控制組平均高0.41個標準差。Hattie和Timperley(2007)構建了反饋模型,分為四個層面,即關于任務的反饋(答案是否正確,指出答案不充分)、關于任務如何運作的反饋(說明可以運用的策略)、關于學生如何調節自我進一步學習的反饋(學生自我評價)以及對個人總體評價式的反饋(如“做得很好”等話語)。研究表明,關于學生如何調節自我進一步學習和關于任務如何運作的反饋都是非常有利的,而關于任務的反饋效果不佳,對個人的總體評價的反饋作用無效。

2.1.5 評價文化

評價文化指的是與現行的意識、社會期望、態度和價值觀相一致的教育評價(Inbar-Lourie,2008b:285)。它植根于建構主義理論,成形于建構主義理論所認為的知識是如何建構的和處理的框架之中。它批判性地認識到了評價的社會角色,并重視其在教與學的過程中的重要貢獻(Broadfoot & Black,2004)。雖然評價文化是相對于測試文化而提出的,但是評價文化的理論和實踐框架都比測試文化要寬泛許多。評價數據從宏觀和微觀的源頭通過多種渠道來收集,而所有的利益相關者都在評價過程中起積極的作用(Shepard,2000)。與傳統測試文化的邏輯實證主義哲學基礎不同,評價文化基于解釋主義(Inbar-Lourie,2008b:290)。

Gipps(1994)勾畫了一種有更加寬泛意義的教育評價,是評價文化的重要體現。它具有如下特點:(1)這種教育評價認識到知識域和構念是多維的和復雜的;對學生成績的評價并不是嚴格意義上的科學;學生與任務和環境之間的互動很復雜,很難將從一種任務和環境中得出的結果概化到其他任務和環境中。(2)在這種教育評價中,建立了清晰的標準來評價學生的表現;標準和評價過程都為學生所了解(隨著學生年齡的增長,學生會更多地了解標準和評價過程);鼓勵學生監控和反思他們自己的作品和表現,教師可以給出一些積極和有建設性的幫助,學生會在這種元認知策略訓練中培養出自我監控能力。作為評價過程中的重要因素,給學生的反饋應該強調學生掌握情況和進步,而不是跟其他學生進行比較。(3)教育評價鼓勵學生思考,而不是根據所給選項判斷,即教師要鼓勵學生組織和融合想法,跟材料互動,對論證背后的邏輯進行評判。高質量的評價需要高質量的任務:任務必須基于重要和相關的學科知識,任務的性質和呈現方式要基于相關研究中所驗證的公平和引人入勝的評價任務。(4)能夠讓學生充分發揮水平的評價,其任務應該是具體的,并跟學生的經歷相匹配。任務呈現要清晰明了。任務要跟學生當前關心的事情相關。任務的施測環境不會讓學生焦慮。(5)評價標準要更加綜合,以便評價更加復雜的技能;應該提供樣本給教師和其他相關人員來幫助解讀這些標準。(6)教育評價要讓教師或者經過培訓的人士進行評分工作。為了提高評分信度,教師必須理解分數等級劃分以及各個分數段的表現如何。這可以通過一系列評分培訓和提供樣本來實現。樣本和試評要提供給所有參與評價的教師。樣本和標準也服務于向教師介紹教學中的技能和概念。(7)與傳統的測試文化靠計算題目答對的數量來決定得分不同,整體應答質量成為決定分數的因素。在教育評價中,更加重視用“豐富”的描述來描寫學生成果。(8)教師本身對學生的評價是教育評價的關鍵部分。這種評價可以是互動的,能夠讓學生積極參與,從而衡量學生的理解和誤解;它還支持學習過程,可以在一系列環境中評價學生的表現。(9)正如教師如果不理解學科內容就不能教學一樣,不理解學科內容就無法進行評價。教師必須要理解評價的構念,以此決定測試任務;他們應該知道如何確定學生的知識程度和理解水平,從而知道該采用何種題型,以及如何充分考慮學生的生理、社會和認知情況,誘發出學生的最佳表現。(10)教育評價為低利害評價。將外部的高利害考試和課堂的低利害評價相結合,能夠降低外部考試可能存在的不良影響。同時,利用清晰的標準對學生個體的表現進行評判并輔以良好的反饋,避免了與他人比較而產生的挫敗感,能夠維持學生的興趣(p.159-161)。

Hamp-Lyons(2007)將評價文化看作是一種上位的概念,下分為學習文化和考試文化。這里的學習文化也就等同于上文Inbar-Lourie的評價文化和Gipps的教育評價。Hamp-Lyons對評價文化(或者說課堂評價)的特征進行了描述,認為它聚焦于語言流利度,更加關注學生個體,更加關注學生的學業進步和成績,更加關注學習者,更加關注學習過程,強調教師和學生的聲音,更加關注促學評價。她認為在香港這樣測試文化根深蒂固的地方,教師要能夠在評價方面發出聲音,必須在教學評價方面有充足的職前準備和在職發展。

主站蜘蛛池模板: 包头市| 绥棱县| 东海县| 新平| 达日县| 临安市| 肇源县| 丰县| 德安县| 九寨沟县| 昔阳县| 明溪县| 电白县| 株洲县| 平乐县| 延川县| 毕节市| 武平县| 辽中县| 额尔古纳市| 新邵县| 凤凰县| 安陆市| 浮山县| 宜州市| 扎兰屯市| 花莲县| 和硕县| 富顺县| 高碑店市| 米脂县| 玉环县| 沾益县| 盱眙县| 库车县| 沐川县| 安泽县| 新安县| 观塘区| 连城县| 红原县|