良心正规红包游戏

書(shū)名：計(jì)算機(jī)自適應(yīng)語(yǔ)言測(cè)試模型設(shè)計(jì)與效度驗(yàn)證
作者名：何蓮珍閔尚超
本章字?jǐn)?shù)： 2390字
更新時(shí)間： 2020-01-03 10:34:08

2.3 多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型

多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型是一組用于闡述考生在多級(jí)計(jì)分項(xiàng)目中的答題行為與潛在能力之間關(guān)系的數(shù)學(xué)模型。在多級(jí)計(jì)分項(xiàng)目中，考生在題目上的得分有0分、1分、2分等多種可能性，如簡(jiǎn)答題、利克特量表。簡(jiǎn)答題中評(píng)分者往往根據(jù)考生回答題目的完整性，分別給予不同的分?jǐn)?shù)或等級(jí)。利克特量表中考生的答題反應(yīng)通常被分為完全不贊成、不贊成、無(wú)所謂、贊成、完全贊成五類，并分別賦予1～5分。

與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型一樣，多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型根據(jù)參數(shù)數(shù)量，可分為單參數(shù)、雙參數(shù)、三參數(shù)。更為復(fù)雜的是，多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型根據(jù)不同的模擬過(guò)程，可分為減法式模型（difference models）與除法式模型（divide-by-total models）（Thissen & Steinberg, 1986; Embretson &Reise, 2000）。

減法式模型分兩步確定考生在多級(jí)計(jì)分模型中得到相應(yīng)分?jǐn)?shù)的概率。最常見(jiàn)的減法式模型為Samejima（1969）的等級(jí)反應(yīng)模型（graded response model）。除法式模型中，考生得到相應(yīng)分?jǐn)?shù)的概率通過(guò)計(jì)算單個(gè)方程式一步得出。最常見(jiàn)的除法式模型為分部評(píng)分模型（partial credit model; Masters, 1982）與廣義分部評(píng)分模型（generalized partial credit model; Muraki, 1992）。盡管文獻(xiàn)中至少存在幾十種多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型，我們?cè)诖藘H詳細(xì)介紹使用最為廣泛的三種模型，即等級(jí)反應(yīng)模型、分部評(píng)分模型、廣義分部評(píng)分模型。

2.3.1 等級(jí)反應(yīng)模型

等級(jí)反應(yīng)模型（Samejima, 1969）源于Thurstone量表法（Thurstone, 1925, 1928），用于模擬有序的多級(jí)反應(yīng)項(xiàng)目。等級(jí)反應(yīng)模型是雙參數(shù)模型在多級(jí)項(xiàng)目情況下的延伸，采用兩個(gè)步驟模擬考生回答多級(jí)計(jì)分項(xiàng)目的方式。第一步，將得分類別人工一分為二，然后計(jì)算能力為θj的考生 j在項(xiàng)目i上得 x 分的條件概率：

其中，是條件概率，ai是項(xiàng)目i的區(qū)分度參數(shù)，bix是項(xiàng)目i的類別分?jǐn)?shù)x與 x-1之間的類別閾值（category threshold）。等級(jí)反應(yīng)模型中，不同項(xiàng)目的區(qū)分度參數(shù)ai不一樣，但同一項(xiàng)目所有類別的區(qū)分度參數(shù)是一樣的。同一項(xiàng)目的各個(gè)類別的類別閾值bix不一樣，且需滿足bx-1＜ bx＜ bx+1。

第二步，將兩個(gè)相鄰類別的條件概率相減，則得到考生在該項(xiàng)目上得到相應(yīng)類別分?jǐn)?shù)的概率。可以用以下公式表示：

同時(shí)，等級(jí)反應(yīng)模型限定考生得分為最低類別分?jǐn)?shù)或超過(guò)最低類別分?jǐn)?shù)的概率為，考生得分超過(guò)最高類別分?jǐn)?shù)的概率為。設(shè)置了這些限定條件后，公式（8）即可適用于任何類別分?jǐn)?shù)。

2.3.2 分部評(píng)分模型

分部評(píng)分模型由Master（s 1982）首次提出。該模型是Rasch模型的拓展，假定不同項(xiàng)目的區(qū)分度參數(shù)相同。正如上文所述，分部評(píng)分模型為常見(jiàn)的除法式模型，可以直接計(jì)算考生得分為某一類別分?jǐn)?shù)的概率。除模型類別不同之外，分部評(píng)分模型不同于等級(jí)反應(yīng)模型的另一個(gè)方面是：等級(jí)反應(yīng)模型中用類別閾值（category threshold）描述考生得分從一個(gè)類別跨到另一個(gè)類別的概率，而分部評(píng)分模型采用難度階（step）參數(shù)進(jìn)行描述。也就是說(shuō)，分部評(píng)分模型認(rèn)為考生回答項(xiàng)目的方式就如通過(guò)一系列連續(xù)的“階段”。能力為θj的考生j在項(xiàng)目i上得x分的概率Pix（θj）用分部評(píng)分模型可表示如下：

其中，mi是項(xiàng)目i的所有得分類別之和減去1, bik是項(xiàng)目i中得分為k 的難度階參數(shù)。分部評(píng)分模型中的難度階參數(shù)bik不同于等級(jí)反應(yīng)模型中的類別閾值參數(shù)。分部評(píng)分模型中的難度階參數(shù)指考生得分從一個(gè)類別跨到另一個(gè)類別的難度，其值為類別反應(yīng)曲線中兩個(gè)相鄰類別得分概率相同的那個(gè)點(diǎn)。等級(jí)反應(yīng)模型中的類別閾值指的是考生得分為該類別分?jǐn)?shù)的概率等于或大于50%的那個(gè)點(diǎn)。同時(shí)，分部評(píng)分模型中的難度階參數(shù)不一定按從小到大的順序排列，而等級(jí)評(píng)分模型中的類別閾值遵循從小到大的順序（Embretson &Reise, 2000）。

2.3.3 廣義分部評(píng)分模型

廣義分部評(píng)分模型由Muraki（1992）首次提出，是雙參數(shù)函數(shù)在多級(jí)計(jì)分項(xiàng)目中的拓展。能力為θj的考生j在項(xiàng)目i上得x分的概率Pix（θj）用廣義分部評(píng)分模型可表示為：

其中，mi和bik的概念跟分部評(píng)分模型中的概念一樣。ai指項(xiàng)目i的區(qū)分度參數(shù)。從公式（10）中可以看出，當(dāng)限定ai為1時(shí)，公式（10）便與公式（9）完全一樣。因此，分部評(píng)分模型是嵌套于廣義分部評(píng)分模型中的一種更為簡(jiǎn)約的模型。分部評(píng)分模型中不允許項(xiàng)目區(qū)分度參數(shù)在不同項(xiàng)目中有所不同，而廣義分部評(píng)分模型則允許不同的項(xiàng)目有不同的區(qū)分度參數(shù)。需要指出的是，多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的區(qū)分度參數(shù)概念與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的區(qū)分度參數(shù)概念不完全一致。在多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中，項(xiàng)目的區(qū)分度不僅取決于區(qū)分度參數(shù) ai，還取決于項(xiàng)目各類別反應(yīng)曲線上類別閾值（對(duì)于等級(jí)反應(yīng)模型而言）或類別交叉點(diǎn)（對(duì)于分部評(píng)分模型與廣義分部評(píng)分模型而言）的分布狀況（Embretson & Reise, 2000; DeMars, 2010）。各類別閾值或類別交叉點(diǎn)之間的距離越遠(yuǎn)，說(shuō)明項(xiàng)目各類別越能更好地區(qū)分考生的能力水平；距離越近，則類別間差異越小，即區(qū)分能力越弱。

總之，等級(jí)反應(yīng)模型與廣義分部評(píng)分模型都是雙參數(shù)模型的拓展。只有兩個(gè)反應(yīng)類別時(shí)，兩者可以互換。但是，有三個(gè)或三個(gè)以上的反應(yīng)類別時(shí)，這兩種模型中估計(jì)出來(lái)的參數(shù)不存在可比性，因?yàn)檫@兩種模型模擬考生反應(yīng)過(guò)程的方式不同。分部評(píng)分模型是單參數(shù)模型的拓展，嵌套于廣義分部評(píng)分模型中。

2.3.4 多級(jí)計(jì)分模型的項(xiàng)目信息量與測(cè)試信息量

計(jì)算多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型的項(xiàng)目信息量與測(cè)試信息量時(shí)，需采用比二級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型更為復(fù)雜的方法，因?yàn)槎嗉?jí)計(jì)分項(xiàng)目中涉及多個(gè)類別，而每個(gè)類別都提供一定量的信息。Samejima（1969）認(rèn)為多級(jí)計(jì)分項(xiàng)目i的類別信息量函數(shù)可以表示為：

其中，Pix（θ）代表能力為θj的考生j在項(xiàng)目i上得x分的概率，為Pix（θ）的一階導(dǎo)數(shù)，為Pix（θ）的二階導(dǎo)數(shù)。

多級(jí)計(jì)分項(xiàng)目i的項(xiàng)目信息量函數(shù)可以表達(dá)為：

相對(duì)于二級(jí)計(jì)分項(xiàng)目而言，多級(jí)計(jì)分項(xiàng)目的信息量大小不僅取決于區(qū)分度參數(shù)，還取決于類別參數(shù)的分布狀況（DeMars, 2010）。

由于多級(jí)計(jì)分項(xiàng)目中包含多個(gè)反應(yīng)類別，因此多級(jí)計(jì)分項(xiàng)目往往能在更大的能力區(qū)間上提供更多的信息（Ostini & Nering, 2006; Jiseon, 2010），且有可能出現(xiàn)多個(gè)項(xiàng)目信息量峰值（DeMars, 2010）。

多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的測(cè)試信息量概念與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論一致。同樣，測(cè)試信息量可以表述為項(xiàng)目信息量的總和。若采用最大似然估計(jì)法，則測(cè)試信息量與能力估計(jì)標(biāo)準(zhǔn)誤差之間存在反向關(guān)系。

官术网_书友最值得收藏!

計(jì)算機(jī)自適應(yīng)語(yǔ)言測(cè)試模型設(shè)計(jì)與效度驗(yàn)證

2.3 多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型

2.3.1 等級(jí)反應(yīng)模型

2.3.2 分部評(píng)分模型

2.3.3 廣義分部評(píng)分模型

2.3.4 多級(jí)計(jì)分模型的項(xiàng)目信息量與測(cè)試信息量