不朽情缘4滴血是多少倍

書名：對外漢語教學的成績測試
作者名：楊翼
本章字數： 10519字
更新時間： 2020-09-24 13:31:51

第二節
漢語成績測試的主要類型

從不同的角度或目的出發，漢語成績測試可分為多種不同的類型。我們把漢語教師通常會給學生施行的測試類型歸納如下：

一、按漢語要素分類

語音、詞匯、語法、漢字通常被視為漢語的四大要素。但是，在漢語測試的實際操作過程中，還會有基于漢語的語言長度單位來專門測試短語（詞組）、句子、語段^[1]語篇^[2]的情況。為了使漢語測試類型的劃分不但具有系統性，而且能跟日常漢語教學的測試操作相銜接，我們按照漢語教材的處理方式，把短語歸入詞匯測試的范圍，把句子、語段、語篇歸入語法測試范圍，這樣我們就有下列幾種關于漢語要素測試的再分類：

1.語音測試

漢語語音測試的內容包括漢語普通話的語音和語調兩大部分。語音部分包括字母、音節、聲母、韻母、聲調、輕聲、兒化韻等八項內容；語調部分包括詞重音、句子重音、音長、節拍、停頓、句調和幾種句子（陳述句、疑問句、祈使句、感嘆句等）的基本語調。語音測試的范圍跟語音教學的內容是一致的。

語音測試主要考查學生能否：正確辨音辨調；讀準聲、韻、調；正確讀、寫漢語拼音；認讀漢語拼音和漢字；在語流中正確流利地表達等。對不同學習階段的學生，在測試重點方面有所區別。在初級階段著重考察辨音辨調、讀準聲、韻、調，在中、高級階段著重考察在語流中能否用正確的聲、韻、調進行流利的漢語表達。

2.漢字測試

漢字測試的內容包括漢字基本筆畫、漢字字形結構；字形與字音、字義之間的聯系；獨體字的因形見義；合體字的部件分解；合體字中的會意；合體字中的形聲；聲符或形符的歸類排隊；字與詞的結合（借助字義理解詞義、由字→單音詞→復音詞的組合）等。

漢字測試主要考查學生能否：正確認寫（字、詞、句等）；用拼音方案給漢字注音，進行同音字和多音字辨析，進行形聲字辨析；利用象形、會意、形聲字的規律認讀漢字和辨析漢字字義，達到規定的漢字書寫速度和準確率等。

3.詞匯測試

漢語詞匯測試的內容包括詞語的內部和詞語的外部兩個層次^[3]一方面是在詞的內部進行突出個性的微觀測試；另一方面是在詞的外部進行富有網絡語義聯系的中觀測試。

在微觀測試層次上，有幾項主要內容：（1）根據詞義與語素義關系的類型解釋詞義。包括根據語素義直接解釋詞義、根據語素義部分地解釋詞義、根據語素義間接地解釋詞義、在語素失落原義的情況下解釋詞義、在語素義完全不表示詞義的情況下解釋詞義^[4]等。（2）“挑明”詞的暗含因素。（3）義素分析。它包括詞語的感情色彩、語體風格等。

在中觀測試層次上，有幾項主要內容：（1）掌握詞義的類聚群。它包括概念義同中略異的同義詞、概括義相關相涉的近義詞、概念義相反相對的反義詞、概念義有類屬關系的上下位詞。（2）能以同一語素為基礎建立同素詞群。（3）詞語搭配。通過一個詞與不同的詞語形成不同的搭配關系來顯示其詞義和組合能力。

漢語詞匯測試主要考查學生能否：識別詞語搭配；識別同義詞、近義詞、反義詞、上下位詞；生成詞義類聚、同素詞；列舉詞語搭配；判斷詞語在句子中的位置、詞語的含義；進行詞義辨析、詞語聯想，在特定的語境中使用詞語等。

4.語法測試

漢語語法測試的內容包括詞法測試、句法測試、語段測試、語篇測試等。詞法測試以詞語的用法為主，它主要包括：常見量詞、方位詞、能愿動詞、副詞、介詞、連詞、助詞等的用法；動詞、形容詞和名詞的重疊。句法測試主要包括：幾種主要補語、定語、狀語的用法；詞語順序、常用詞組和習慣用語等；幾種特殊句式（如“把”字句等）的用法；比較的方式、提問的方式、常用復句等。語段測試主要包括：句與句的因果關系、并列關系、承接關系、轉折關系等；句與句的連貫和銜接等。語篇測試主要包括：段與段的因果關系、并列關系、承接關系、轉折關系等；段與段的連貫和銜接等。

漢語語法測試主要考查學生：掌握漢語語法結構的程度；按照語境的需要前后連貫、恰當地使用詞語的能力；對長句、復句、語段的掌握程度及其成段表達的能力。

二、按漢語技能^[5]分類

上面所說的漢語成績測試類型是從語言要素的角度來進行分類，我們常常把語言要素歸入語言知識的范疇。這是否就說明語言知識可以脫離言語技能而孤立存在呢？答案是否定的。因為在實際的漢語交際中，漢語的言語技能和漢語要素總是緊密地結合在一起的，或者說漢語要素存在于漢語的言語技能之中。在漢語作為第二語言教學的過程中，漢語要素教學總是與漢語言語技能訓練有機結合的。具體地說，我們既通過漢語要素的教學來進行漢語的言語技能訓練，又通過漢語的言語技能訓練來進行漢語要素教學。因此，漢語成績測試還常常從言語技能和言語交際技能的角度分為以下四種類型：

1.聽力測試

這里的“聽力”指漢語學習者聽漢語的能力。根據第二語言習得的研究成果，在第二語言學習者言語技能的發展過程中，聽的能力總是先于說的能力（RodEllis，1994）。在實際的漢語交際過程中，也需要漢語學習者的輸入（聽漢語）能力大于輸出（說漢語）能力。由此可見，培養和測試漢語學習者的聽力都很重要。

漢語聽力測試的內容包括語音識別、語義理解、推測和判斷。語音識別包括聲、韻、調、連讀、停頓、重音、語調、語氣等。語義理解包括對關鍵詞義、詞組、句子的理解等；對成段講話、對話基本大意的理解等。推理和判斷指根據聽到的內容進行相關的推測和確定，比如確定說話人的目的和態度，對事態的進一步發展做出推測等。

漢語聽力測試主要考查學生能否：抓住主要信息，獲悉某些重要細節，進行正確的推測和判斷，準確理解說話人的目的和態度等。

2.口語測試

這里的“口語”指漢語學習者用漢語進行口頭表達的能力，而不是指語體^[6]。狹義的口頭表達包括學習、日常生活、社交、會議、會談等口頭交流；廣義的口頭表達包括講課、講演、辯論、解說等（呂必松，1992）。漢語口頭表達不但把漢語語音、語法、詞匯這些語言要素知識融為了一體，而且還帶有濃厚的漢語語用和文化色彩。

漢語口頭表達能力的測試內容包括語音能力（聲、韻、調、停頓、重音、語調、語氣等）、用詞造句能力、成段表達能力、語用能力、跨文化的口語交際能力等。

漢語口頭表達測試主要考查學生：能否用正確的語音語調得體、流利地交流和表達；在表達過程中，詞語的使用是否豐富、恰當，語氣是否自然；語法結構、口語句式是否正確；能否根據交際的需要靈活選擇和變換不同的說法，表達是否流暢，是否能達到交際目的。

3.閱讀測試

這里的“閱讀”指漢語學習者的漢語閱讀技巧和閱讀理解能力。漢語閱讀技巧的測試內容包括^[7]：（1）認讀字、詞的技巧。比如，根據漢字的表意形旁來猜測字義、根據漢語構詞法猜測詞義、從全句或上下文猜測生詞的意義等。（2）閱讀長句、難句的技巧。比如，用壓縮的方法理解長句、根據關聯詞理解復句、根據修辭特點和上下文理解難句等。（3）快速閱讀的技巧^[8]。比如，掃讀、跳讀、抓關鍵、跳障礙等。閱讀理解能力的測試內容包括：（1）理解關鍵詞語和句子。（2）理解段落。比如，找出段落主句，抓住段落主旨、根據提示詞語把握段落的內容。（3）理解文章主題等。比如，概括出文章的主題，找出文章的主題句或主題段等。（4）理解作者的目的和態度等。比如，作者贊成還是反對，作者的寫作意圖等。

漢語閱讀技巧和閱讀理解測試主要考查學生：快速查找信息的能力，掌握所讀文章的大意和作者意圖的能力，了解文章主要事實，跳躍障礙、捕捉所需細節的能力，根據所讀文章的內容進行引申和推斷的能力，領會作者的深層含義及其思想、態度和情緒的能力等。

4.寫作測試

這里的“寫作”指漢語學習者的書面表達能力，而不是單純的命題作文。在“聽、說、讀、寫”四種漢語言語技能中，對漢語非母語的外國學生而言，漢語書面表達的難度最高，因為它涉及對學過的漢字、詞匯、語法、語段、語篇、語體、語用和表達技巧的全面運用。

漢語書面表達能力的測試內容既包括練習性質的聽后寫、看圖寫、看影視后寫、擴寫、縮寫、改寫等，又包括應用性質的寫便條、啟事、書信、日記、公文等；既有寫人、寫事的，又有寫景、寫物的；既有記敘文，又有議論文、說明文等。

漢語書面表達能力測試主要考查學生：漢語書面形式的表意是否清楚，中心是否突出。段落和句際間是否銜接和連貫，遣詞造句是否準確、恰當，語句表達是否豐富、有變化性。書面表達的病句有多少，寫作格式和標點是否正確等。

三、按教學時段分類

以一個學期為單位，漢語教學活動可以按照教學進程的時間長短劃分為若干階段，不同的時段需要不同的成績測試與之匹配。因此，按照教學時段來分類，我們可以把成績測試分為以下四種類型：

1.隨堂測試

隨堂測試又稱為隨堂小測驗。它是在漢語教學過程中，以漢語教材的某一課為單位，在完成該課的漢語教學活動以后，對學生所進行的形成性測試。這種測試出現的頻率高，題量小，測時短，施測的方式很靈活，在每課的漢語教學活動結束后都可以進行。這種形成性測試可以檢查學生對所學內容的掌握情況，引導漢語學習者注意復習他們學過的漢語知識和技能，同時也有助于發現他們的學習弱點，以便采取補救措施。隨堂測試的內容一般限制在該課所學的范圍內。

2.單元測試

單元測試是在漢語教學過程中，以漢語教材的一個教學單元為單位，在完成該單元的漢語教學活動以后，對學生所進行的漢語形成性階段測試。它在實施測試的間隔周期上大于隨堂測試，因為一個漢語教學單元通常是由若干節課組成的，只有這若干節課的教學任務都完成以后，才算完成了一個單元的漢語教學活動。單元測試的內容一般限制在某個教學單元的范圍之內，對學習者漢語學習成果的概括水平高于隨堂測試。

3.周考

周考是在漢語教學過程中，以一周的教學時間為單位，在每周的漢語教學活動完成以后所進行的形成性測試。周考也屬于階段性漢語測試，在每周的漢語教學活動結束時都要進行，所以它也是經常性的。

周考與單元測試既有相同之處，也有不同之處。二者的區別在于，實施測試的計算單位不一樣。前者以教學時間“周”為計算單位，后者以教材內容“單元”為計算單位。這種形成性測試的周考可以引導漢語學習者掌握他們必備的漢語知識和漢語技能，發現他們的中介語偏誤類型和成因，從而使教、學雙方采取適當的補救措施。周考的內容一般限制在一周所學的某個教學單元的范圍內，對學習者漢語學習成果的概括水平高于隨堂測試。

4.期中考試

期中考試是在漢語教學過程中，以半個學期的教學時間為單位，在每半學期的漢語教學活動完成以后所進行的測試。期中考試也屬于階段性漢語測試，是對漢語學習者在半學期之內取得的漢語學習成果及其達到教學目標的程度所進行的全面測試。期中考試的內容通常要覆蓋一門漢語課程的若干個教學單元，對學習者漢語學習成果的概括水平高于周考和單元測試。

期中考試既可以視為形成性評價的組成部分，又可以視為終結性評價的組成部分，這取決于從什么角度來看它。以一學期為界，期中考試可以視為形成性評價的組成部分。以半學期為界，期中考試又可以視為終結性評價的組成部分。

5.期末考試

期末考試是以一個學期為單位，在每一學期的漢語教學活動完成后所進行的測試。期末考試屬于終結性測試，它以預先設定的一學期的漢語教學目標為基礎，在一門漢語課程的整個教學活動結束后，對這一學期漢語學習者的最終學習成果及其達到教學目標的程度所進行的全面測試。它是為了評定漢語學習者的學業成績，為其漢語能力或資質作證明。考試內容覆蓋一門漢語課程的全部教學單元，對學習者漢語學習成果的概括水平高于期中考試。

四、按測試目的分類

成績測試是服務于漢語教學目標的，它應該匹配相應的漢語教學法，有助于判斷漢語教學的效果，有助于隨時調控漢語教學的發展進程。隨著漢語教學的不斷推進，成績測試的目的也會不斷變化。按照測試目的的不同，成績測試還可以分為以下四種類型：

1.分班測試

分班性測試（placementtest）又稱為分級測試、安置性測試。它一般在新學期開課前施行，主要目的是為把非零起點的漢語學習者合理地安置在適合其漢語能力的班級學習而搜集信息。因此，測試結果往往就成了對漢語學習新生進行分班的依據。

分班性測試屬于鑒別性測試，需要注意提高漢語測試的區分性，以便把不同漢語能力層次的學生區分開來。具體地說，漢語試卷難度要適宜，應具有難、中、易的階梯層次，并按一定的比例來搭配。反之，漢語試卷太容易或太難，大家的漢語測試成績都差不多，在分班或分級方面就會產生困難。但是，分班測試對學生漢語能力的區分只要求能達到可以辨別學生的上、中、下水平層次的效果。實際上，這樣的區分效果十分粗略，因而不要求該測試的記分很精確。另外，在測試內容上要精簡，在測試程序上要簡化。這是因為分班工作的效率直接影響到能否按時開學上課，如果測試內容繁雜，測試程序繁瑣，就不能在短期得到測試結果，從而延誤新學期的開課。

2.發展性測試

發展性測試（progressachievementtest）又稱為進步性測試、形成性測試。它一般在漢語教學過程中頻繁地施行，并以系列測試的形式出現，比如，若干個隨堂小測試、若干個單元測試等。目的是測量漢語學習者所取得的進步，檢查他們是否掌握了課堂上所學的內容，此外，還為調整教學策略搜集信息。

因為漢語學習者所取得的“進步”是逐漸趨向于最終的漢語課程教學目標的“進步”，所以頻繁施行的一系列發展性測試也應該與最終的漢語課程教學目標有關。但是，怎么才能使發展性測試既能與最終的課程教學目標有關，又能與他們現實的漢語進步有關呢？那就需要建立若干個面向終結性測試的發展性測試，逐次、逐層地向同樣基于課程教學目標的終結性測試推進。如果把這種推進過程看成是一種有序的、動態的線性運動的話，那么序列中的每一個發展性測試都是推進中的一個點，每一個點都朝著終極目標前進了一小步。因此，很好地定義每一個點的短期目標，才能保證最后實現最終的課程教學目標。

3.診斷性測試

診斷性測試（diagnostictest）是在漢語教學過程中多次施行的，用來確定學生的漢語學習缺陷或障礙的一種測試，以便教師采取有針對性的漢語教學措施，以便學生有針對性地調整漢語學習策略。

診斷性測試的目的決定了它的測試內容具有自身的特點。首先，測試內容要集中在測試者想了解的問題方面。比如，想了解學生對“把”字句的掌握情況，那么測試內容就應該圍繞這一主題來進行。其次，針對某一問題的測試內容要細化、深入。比如，想了解學生在“把”字句上存在的問題，可以分別從“把”字句的語義、語法、語用，甚至使用“把”字句的人、使用“把”字句的目的等多方面去探測，才有可能發現問題，找到原因。正因為如此，針對某一問題而進行的診斷性測試，在試題數量（廣度）和試題內容（深度）上都傾向于多而細，這使得單純為了診斷學生的學習問題而一次性地構建測試和施行測試很不經濟。為了解決這個矛盾，第二語言教學界開始出現了電腦診斷性測試。

因為診斷性測試是為了發現學生的問題，所以它的題項設計應該有利于誘發學生的有關漢語學習問題，有利于追溯該問題產生的原因。測試的評分反而不重要了，甚至可以不評分。

4.終結性測試

終結性測試（finalachievementtest）又稱為總結性測試。它一般在學期末課程結束時施行，目的是總結評定漢語學習者的學習成果。

終結性測試內容顯然與課程的教學內容有密切關系。但是，測試內容與教學內容之間究竟是一種什么性質的關系？如何發生聯系？這在語言教學測試界還存在著爭議。一些人認為，測試內容應該直接基于詳細的課程教學大綱或者教材內容。因為這樣的測試內容，測的就是所教的，也就是學生實際上學過的東西。上述解釋似乎很合理，至少這樣的測試可以被看成是一個公平的測試，但是這樣做也冒著很大的風險。我們設想一下，如果課程教學大綱設計得不合理，或者教材內容有缺陷，那么以此為基點而編制的試卷也是不可靠的，這樣的測試結果就不能準確地反映學生在漢語課程教學目標上成功的程度，甚至還會誤導學生，因為測試結果反饋的信息有差錯。因此，還有一些人建議^[9]，終結性測試內容應該直接基于課程教學目標，ArthurHughes就是他們的代表。

五、按測試方式分類

在如何測試第二語言能力的問題上，語言測試界實際上還存在著較大的分歧。一些人認為，語言是由許多成分構成的，掌握一種語言就是要掌握這些構成成分。測試語言能力就是考察人們對其成分的了解和使用（劉潤清、韓寶成，2000）。還有一些人不贊成上述看法，認為人們在實際使用語言時，都是把語言作為一個整體來使用的，對單項語言成分的掌握并不一定就等于對語言整體的掌握，所以用單項語言成分測試上的得分來推測某人的語言使用能力是不合理的。這些人更主張全面考察學生的綜合運用語言的能力。按照測試方式的不同，漢語成績測試還可以分為以下兩種類型：

1.分離式測試

分離式測試（discretepointtest）又稱為離散考點測試。它把漢語知識和技能分解為若干個小成分，每題只測一個成分。如果有若干個成分，那么就由若干個題目來對這些成分逐一進行測量。比如，先把漢語分解為語音、詞匯、語法、漢字四大要素。若要測學生的漢語語法能力，則再把漢語語法分解為若干成分，然后編制一系列語法試題，一個語法題每次只測量一個特定的漢語語法點（如“把”字句）。在很多情況下，分離式測試都表現為間接測試（indirecttest）^[10]，這可能是因為它大量地使用多項選擇題的緣故。分離式測試的突出優點是覆蓋面大，閱卷方便、經濟，信度較高，缺點是效度較低。

2.綜合式測試

綜合式測試（integrativetest）要求學生綜合使用多種漢語知識和技能去完成一個測試任務。它可以在一次測試中，同時考查學生多方面的漢語知識和技能的綜合使用情況。比如，寫漢語作文、邊聽漢語講演邊記筆記、邊閱讀漢語文章邊填空等都屬于綜合式測試。在很多情況下，綜合式測試都表現為直接測試（directtest）^[11]，這導致它大量地使用主觀性試題，因而出現信度較低、覆蓋面小、閱卷費時費力的缺點，但同時它又具有效度較高的優勢。

六、按認知層次分類

在第二語言測試領域，參照Bloom對教育目標的分類，從認知角度來劃分，可以把經過學習后所形成的第二語言能力劃分為不同的層次^[12]這樣的劃分對設計試卷的難度階梯尤具意義，因為所考察的語言能力層次的高低跟試題的難度有密切關系。第二語言的能力層次是由低到高逐漸發展形成的，高一級的能力層次是在低一級的能力層次基礎上發展而來的。按照由低到高的順序有如下五種漢語成績測試類型：

1.識別性測試

識別性測試主要通過喚起學生的回憶、對照、提取等認知心理活動來完成測試任務。測試內容包括識別漢字、語音、語法、詞匯、文化等。比如，識別漢字的形音義，識別漢語的聲、韻、調，識別同義詞、近義詞、反義詞、上下位詞，識別句法的語境等。學習者需要根據已學過的漢語知識和技能，通過一系列較為簡單的漢語認知思維活動來完成測試任務。

從測試目的來看，識別性測試主要是考查學習者對學過的較為簡單的漢語知識和技能的掌握情況，這是漢語學習者應該具備的最低的能力層次。

2.理解性測試

理解性測試主要通過引起學生的注意、分析表層形式、從形式建構意義、加工成命題^[13]認知心理活動來完成測試任務。測試內容包括理解漢字、語音、詞匯、語段、語篇、文化等的表面意義和深層含義。比如，理解漢字的形音義，理解漢語聲、韻、調的意義，理解詞匯的字面義和使用中的引申義，理解不同語境下的不同用法和含義等。學習者需要根據已學過的漢語知識和技能，通過一系列較為復雜的漢語認知思維活動來完成測試任務。

從測試目的來看，理解性測試主要是考查學生對學過的較為復雜的漢語知識和技能的掌握情況，這是漢語學習者應該具備的較高的能力層次。

3.判斷性測試

判斷性測試主要通過引發學生的分析、歸納、判斷等認知心理活動來完成測試任務。測試內容包括判斷對漢字、漢語的語音、詞匯、語段、語篇、文化等的釋義及其不同語境下的使用。比如，判斷漢字形音義的匹配，判斷漢語聲、韻、調的匹配，判斷漢語詞匯的本義和使用中的引申義，判斷它們在不同語境下的恰當用法和含義等。學習者需要根據已學過的漢語知識和技能，通過一系列較為復雜的漢語認知思維活動來完成測試任務。

從測試目的來看，判斷性測試主要是考查學生對學過的較為復雜的漢語知識和技能的掌握情況，這是漢語學習者應該具備的較高的能力層次。

4.推斷性測試

推斷性測試主要通過學生的分析、歸納、判斷、推理等認知心理活動來完成測試任務，以此考查學生對學過的漢語知識和技能的掌握情況。測試內容包括推斷漢字、語音、詞匯、語法結構、語段、語篇等的缺失部分，推斷說話人的“言外之意”，推斷事件或事物的發展趨勢等。學習者需要根據已學過的漢語知識和技能，通過一系列較為復雜的漢語認知思維活動來完成測試任務。

從測試目的來看，推斷性測試主要是考查學生對學過的較為復雜的漢語知識和技能的掌握情況，這是漢語學習者應該具備的高級能力層次。

5.運用性測試

運用性測試指測試任務涉及多種漢語知識和技能的綜合運用，需要通過學生的多種漢語認知心理活動才能完成。它包括理解、分析、歸納、判斷、推理、整合^[14]、輸出^[15]等綜合性的認知心理活動。測試內容包括在一定的語境下，選擇合適的語體和措辭，對漢語語段或語篇等恰當地、生成性地輸出，并能達到預定的交際效果。學習者需要根據已學過的漢語知識和技能，通過一系列復雜的漢語認知思維活動來完成測試任務。

從測試目的來看，運用性測試主要是考查學生對學過的各種漢語知識和技能的綜合掌握情況，這是漢語學習者應該具備的最高級的能力層次。

七、按閱卷方式分類

成績測試的評分一般都由閱卷人來完成。對試題的評分存在著幾種不同的情況，有的試題對閱卷人的主觀判斷依賴很大，有的試題對閱卷人的主觀判斷依賴較小，還有一些試題不依賴閱卷人的主觀判斷。按照試題對閱卷人主觀判斷的依賴程度，漢語成績測試還可以分為以下三種類型：

1.主觀性測試

主觀性測試（subjectivetest）指對題目的回答比較靈活，題目可以有多種具體的答案，因此評分時對閱卷人主觀判斷的依賴性很強。比如，漢語口頭或書面回答、作文等。它的優點是效度比較好，靠猜測得分比較難，容易測出學生實際的漢語使用能力。缺點是信度不易把握，評分比較費時費力。

2.客觀性測試

客觀性測試（objectivetest）指對題目的回答很固定，題目的答案只有一個，并且是命題者預先設定的，因此評分時不依賴閱卷人的主觀判斷。最典型的客觀性測試是多項選擇題。它的優點是測試內容的覆蓋面大，針對性強。答案確定、唯一，信度較好，評分簡單方便，省時省力。它既可以讓專業人員閱卷，又可以讓非專業者參與閱卷。

3.半客觀性測試

半客觀性測試（semi-objectivetest）指對題目的回答比較固定，題目的答案可以有幾個，并且這幾個答案是命題者預先設定的，因此評分時對閱卷人的主觀判斷性依賴較小。最典型的漢語半客觀性測試是排列句序題。半客觀性測試的評分信度也比較高。

八、按教學方法分類

語言測試是隨著語言教學的發展而發展的，有什么樣的教學法，就要求有什么樣的測試法與之匹配。由于近年來語言交際教學法的發展，語言任務型教學的出現，又先后出現了交際性測試和任務型測試。因此，從語言教學方法的角度，漢語成績測試還可以分為以下兩種類型：

1.交際性測試

交際性測試（communicativetest）注重在交際過程中測試使用語言，主張語言運用是第二語言學習的最終目標。它認為語言能力有更廣泛的內涵，不僅包括語言知識和技能，還包括語言使用的適當性等。交際性測試的標準是看學生能否在目的語語境中有效地進行交際。在它的考題設計中常常出現“信息差”（informationgap），并要求學生能通過已知信息獲取未知信息。它還提倡考試材料和題目要貼近現實的語言使用環境，具有真實性等。

交際性測試的主要特征是：（1）注重意義。（2）試題語境化。（3）有帶著交際目的的恰當的語言活動。（4）有具備實際使用價值的言語。（5）真實的語言材料。（6）交際結果不可預見。（7）以互動為基礎。（8）學生在真實的心理狀態下表現語言能力。（9）根據實際交際結果判斷成績。（Weir，1993：167）

漢語交際性測試是對外漢語教學界在努力探索的領域，有關方面的測試活動還不夠成熟，研究成果還不多見。

2.任務型測試

任務型測試（task-based language assessment）是以任務為核心的（韓寶成，2003）。它把任務作為測試分析的基本單位，從任務出發去選擇測試的項目，以任務為基礎來編寫試題，根據學生完成任務的表現（taskperformance)來評定成績。

需要注意的是，語言測試的目標是測量語言能力，所以學生完成測試任務本身并不是測試的目標，真正的測試目標是學生完成任務所具備的語言能力。任務型測試既然是“基于”任務的，那就表明“任務”只是途徑和必要條件，我們主要是通過學生完成語言測試任務所表現出來的語言行為來評價他們的語言能力（劉壯等，2008）。

對于設計和實施基于任務的語言測試，Long& Norris(2000：600)提出了六個步驟：（1）確定測試的用途。這包括：誰將使用測試后獲得的信息？測試應提供哪些信息？測試的目的是什么？哪些人會因測試受到影響？測試會帶來哪些后果？等等。（2）根據需求分析確定目標任務，并按任務特征分類。（3）根據對任務特征進行分析得到的信息，來設計測試及項目規范。（4）確定詳細的評分標準，以便對學生完成任務的情況做出評價。（5）從測試的預期用途、效率、合適程度和效果等方面對測試任務、工具、步驟及評分標準進行評估。（6）對測試進行系統的、不間斷的效度研究。

實際上，要實施任務型漢語測試必須解決兩個問題：（1）如何準確地選擇和描述現實中的任務。（2）如何解釋測試中的任務與現實中的任務二者之間的關系。因為對這兩個問題的回答不僅影響到漢語測試的準確性，而且影響到根據測試結果對漢語學習者所作推論的有效性。

目前對外漢語教學界的任務型漢語測試還處于探索、起步階段，有關方面的測試活動和研究報告都還很罕見。

[1] 語段指大于單、復句，意思連貫的語言片段。

[2] 在不同的著述中，“語篇”有不同的含義。這里的“語篇”指大于語段，意思連貫的語言片段。

[3] 參見楊翼（2001a）。

[4] 參見符淮青（1985）。

[5] 這里的漢語技能指漢語言語技能和漢語言語交際技能。

[6] 漢語語體可以分為口語和書面語，這種意義上的“口語”跟“口語測試”中的口語含義不同。

[7] 參見陳田順主編（1999：30）。

[8] 參見呂必松（1996：210）。

[9] 參見Arthur Hughes（1989）。

[10] 間接測試指測試者要求被試所表現的行為不是測試者想測的技能。比如，想測“說”的技能卻讓被試用紙筆方式進行選擇性判斷。

[11] 直接測試指測試者要求被試所表現的行為就是測試者想測的技能。比如，想測“寫”的技能就讓被試寫一篇作文。

[12] 參見高蘭生、陳輝岳（1996：42）。

[13] 參見魯忠義、彭聃齡（2003）。

[14] 信息整合。

[15] 漢語語義和形式的輸出。

官术网_书友最值得收藏!

對外漢語教學的成績測試

第二節 漢語成績測試的主要類型