官术网_书友最值得收藏!

2.3 多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型

多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型是一組用于闡述考生在多級(jí)計(jì)分項(xiàng)目中的答題行為與潛在能力之間關(guān)系的數(shù)學(xué)模型。在多級(jí)計(jì)分項(xiàng)目中,考生在題目上的得分有0分、1分、2分等多種可能性,如簡(jiǎn)答題、利克特量表。簡(jiǎn)答題中評(píng)分者往往根據(jù)考生回答題目的完整性,分別給予不同的分?jǐn)?shù)或等級(jí)。利克特量表中考生的答題反應(yīng)通常被分為完全不贊成、不贊成、無(wú)所謂、贊成、完全贊成五類,并分別賦予1~5分。

與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型一樣,多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型根據(jù)參數(shù)數(shù)量,可分為單參數(shù)、雙參數(shù)、三參數(shù)。更為復(fù)雜的是,多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型根據(jù)不同的模擬過(guò)程,可分為減法式模型(difference models)與除法式模型(divide-by-total models)(Thissen & Steinberg, 1986; Embretson &Reise, 2000)。

減法式模型分兩步確定考生在多級(jí)計(jì)分模型中得到相應(yīng)分?jǐn)?shù)的概率。最常見(jiàn)的減法式模型為Samejima(1969)的等級(jí)反應(yīng)模型(graded response model)。除法式模型中,考生得到相應(yīng)分?jǐn)?shù)的概率通過(guò)計(jì)算單個(gè)方程式一步得出。最常見(jiàn)的除法式模型為分部評(píng)分模型(partial credit model; Masters, 1982)與廣義分部評(píng)分模型(generalized partial credit model; Muraki, 1992)。盡管文獻(xiàn)中至少存在幾十種多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型,我們?cè)诖藘H詳細(xì)介紹使用最為廣泛的三種模型,即等級(jí)反應(yīng)模型、分部評(píng)分模型、廣義分部評(píng)分模型。

2.3.1 等級(jí)反應(yīng)模型

等級(jí)反應(yīng)模型(Samejima, 1969)源于Thurstone量表法(Thurstone, 1925, 1928),用于模擬有序的多級(jí)反應(yīng)項(xiàng)目。等級(jí)反應(yīng)模型是雙參數(shù)模型在多級(jí)項(xiàng)目情況下的延伸,采用兩個(gè)步驟模擬考生回答多級(jí)計(jì)分項(xiàng)目的方式。第一步,將得分類別人工一分為二,然后計(jì)算能力為θj的考生 j在項(xiàng)目i上得 x 分的條件概率:

其中,是條件概率,ai是項(xiàng)目i的區(qū)分度參數(shù),bix是項(xiàng)目i的類別分?jǐn)?shù)xx-1之間的類別閾值(category threshold)。等級(jí)反應(yīng)模型中,不同項(xiàng)目的區(qū)分度參數(shù)ai不一樣,但同一項(xiàng)目所有類別的區(qū)分度參數(shù)是一樣的。同一項(xiàng)目的各個(gè)類別的類別閾值bix不一樣,且需滿足bx-1bxbx+1

第二步,將兩個(gè)相鄰類別的條件概率相減,則得到考生在該項(xiàng)目上得到相應(yīng)類別分?jǐn)?shù)的概率。可以用以下公式表示:

同時(shí),等級(jí)反應(yīng)模型限定考生得分為最低類別分?jǐn)?shù)或超過(guò)最低類別分?jǐn)?shù)的概率為,考生得分超過(guò)最高類別分?jǐn)?shù)的概率為。設(shè)置了這些限定條件后,公式(8)即可適用于任何類別分?jǐn)?shù)。

2.3.2 分部評(píng)分模型

分部評(píng)分模型由Master(s 1982)首次提出。該模型是Rasch模型的拓展,假定不同項(xiàng)目的區(qū)分度參數(shù)相同。正如上文所述,分部評(píng)分模型為常見(jiàn)的除法式模型,可以直接計(jì)算考生得分為某一類別分?jǐn)?shù)的概率。除模型類別不同之外,分部評(píng)分模型不同于等級(jí)反應(yīng)模型的另一個(gè)方面是:等級(jí)反應(yīng)模型中用類別閾值(category threshold)描述考生得分從一個(gè)類別跨到另一個(gè)類別的概率,而分部評(píng)分模型采用難度階(step)參數(shù)進(jìn)行描述。也就是說(shuō),分部評(píng)分模型認(rèn)為考生回答項(xiàng)目的方式就如通過(guò)一系列連續(xù)的“階段”。能力為θj的考生j在項(xiàng)目i上得x分的概率Pixθj)用分部評(píng)分模型可表示如下:

其中,mi是項(xiàng)目i的所有得分類別之和減去1, bik是項(xiàng)目i中得分為k 的難度階參數(shù)。分部評(píng)分模型中的難度階參數(shù)bik不同于等級(jí)反應(yīng)模型中的類別閾值參數(shù)。分部評(píng)分模型中的難度階參數(shù)指考生得分從一個(gè)類別跨到另一個(gè)類別的難度,其值為類別反應(yīng)曲線中兩個(gè)相鄰類別得分概率相同的那個(gè)點(diǎn)。等級(jí)反應(yīng)模型中的類別閾值指的是考生得分為該類別分?jǐn)?shù)的概率等于或大于50%的那個(gè)點(diǎn)。同時(shí),分部評(píng)分模型中的難度階參數(shù)不一定按從小到大的順序排列,而等級(jí)評(píng)分模型中的類別閾值遵循從小到大的順序(Embretson &Reise, 2000)。

2.3.3 廣義分部評(píng)分模型

廣義分部評(píng)分模型由Muraki(1992)首次提出,是雙參數(shù)函數(shù)在多級(jí)計(jì)分項(xiàng)目中的拓展。能力為θj的考生j在項(xiàng)目i上得x分的概率Pixθj)用廣義分部評(píng)分模型可表示為:

其中,mibik的概念跟分部評(píng)分模型中的概念一樣。ai指項(xiàng)目i的區(qū)分度參數(shù)。從公式(10)中可以看出,當(dāng)限定ai為1時(shí),公式(10)便與公式(9)完全一樣。因此,分部評(píng)分模型是嵌套于廣義分部評(píng)分模型中的一種更為簡(jiǎn)約的模型。分部評(píng)分模型中不允許項(xiàng)目區(qū)分度參數(shù)在不同項(xiàng)目中有所不同,而廣義分部評(píng)分模型則允許不同的項(xiàng)目有不同的區(qū)分度參數(shù)。需要指出的是,多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的區(qū)分度參數(shù)概念與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的區(qū)分度參數(shù)概念不完全一致。在多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中,項(xiàng)目的區(qū)分度不僅取決于區(qū)分度參數(shù) ai,還取決于項(xiàng)目各類別反應(yīng)曲線上類別閾值(對(duì)于等級(jí)反應(yīng)模型而言)或類別交叉點(diǎn)(對(duì)于分部評(píng)分模型與廣義分部評(píng)分模型而言)的分布狀況(Embretson & Reise, 2000; DeMars, 2010)。各類別閾值或類別交叉點(diǎn)之間的距離越遠(yuǎn),說(shuō)明項(xiàng)目各類別越能更好地區(qū)分考生的能力水平;距離越近,則類別間差異越小,即區(qū)分能力越弱。

總之,等級(jí)反應(yīng)模型與廣義分部評(píng)分模型都是雙參數(shù)模型的拓展。只有兩個(gè)反應(yīng)類別時(shí),兩者可以互換。但是,有三個(gè)或三個(gè)以上的反應(yīng)類別時(shí),這兩種模型中估計(jì)出來(lái)的參數(shù)不存在可比性,因?yàn)檫@兩種模型模擬考生反應(yīng)過(guò)程的方式不同。分部評(píng)分模型是單參數(shù)模型的拓展,嵌套于廣義分部評(píng)分模型中。

2.3.4 多級(jí)計(jì)分模型的項(xiàng)目信息量與測(cè)試信息量

計(jì)算多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型的項(xiàng)目信息量與測(cè)試信息量時(shí),需采用比二級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型更為復(fù)雜的方法,因?yàn)槎嗉?jí)計(jì)分項(xiàng)目中涉及多個(gè)類別,而每個(gè)類別都提供一定量的信息。Samejima(1969)認(rèn)為多級(jí)計(jì)分項(xiàng)目i的類別信息量函數(shù)可以表示為:

其中,Pixθ)代表能力為θj的考生j在項(xiàng)目i上得x分的概率,Pixθ)的一階導(dǎo)數(shù),Pixθ)的二階導(dǎo)數(shù)。

多級(jí)計(jì)分項(xiàng)目i的項(xiàng)目信息量函數(shù)可以表達(dá)為:

相對(duì)于二級(jí)計(jì)分項(xiàng)目而言,多級(jí)計(jì)分項(xiàng)目的信息量大小不僅取決于區(qū)分度參數(shù),還取決于類別參數(shù)的分布狀況(DeMars, 2010)。

由于多級(jí)計(jì)分項(xiàng)目中包含多個(gè)反應(yīng)類別,因此多級(jí)計(jì)分項(xiàng)目往往能在更大的能力區(qū)間上提供更多的信息(Ostini & Nering, 2006; Jiseon, 2010),且有可能出現(xiàn)多個(gè)項(xiàng)目信息量峰值(DeMars, 2010)。

多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的測(cè)試信息量概念與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論一致。同樣,測(cè)試信息量可以表述為項(xiàng)目信息量的總和。若采用最大似然估計(jì)法,則測(cè)試信息量與能力估計(jì)標(biāo)準(zhǔn)誤差之間存在反向關(guān)系。

主站蜘蛛池模板: 沙湾县| 南陵县| 义乌市| 台南市| 衢州市| 平定县| 瑞金市| 神农架林区| 贵溪市| 信丰县| 大宁县| 宣武区| 水城县| 潮州市| 满洲里市| 萍乡市| 东海县| 沂源县| 岱山县| 五寨县| 周至县| 巨鹿县| 同德县| 遂宁市| 临沧市| 怀宁县| 遵义县| 新宁县| 仲巴县| 陆河县| 金乡县| 平南县| 察雅县| 九龙城区| 斗六市| 瑞安市| 耿马| 南召县| 石嘴山市| 公主岭市| 郯城县|