- 計(jì)算機(jī)自適應(yīng)語(yǔ)言測(cè)試模型設(shè)計(jì)與效度驗(yàn)證
- 何蓮珍 閔尚超
- 2390字
- 2020-01-03 10:34:08
2.3 多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型
多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型是一組用于闡述考生在多級(jí)計(jì)分項(xiàng)目中的答題行為與潛在能力之間關(guān)系的數(shù)學(xué)模型。在多級(jí)計(jì)分項(xiàng)目中,考生在題目上的得分有0分、1分、2分等多種可能性,如簡(jiǎn)答題、利克特量表。簡(jiǎn)答題中評(píng)分者往往根據(jù)考生回答題目的完整性,分別給予不同的分?jǐn)?shù)或等級(jí)。利克特量表中考生的答題反應(yīng)通常被分為完全不贊成、不贊成、無(wú)所謂、贊成、完全贊成五類,并分別賦予1~5分。
與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型一樣,多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型根據(jù)參數(shù)數(shù)量,可分為單參數(shù)、雙參數(shù)、三參數(shù)。更為復(fù)雜的是,多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型根據(jù)不同的模擬過(guò)程,可分為減法式模型(difference models)與除法式模型(divide-by-total models)(Thissen & Steinberg, 1986; Embretson &Reise, 2000)。
減法式模型分兩步確定考生在多級(jí)計(jì)分模型中得到相應(yīng)分?jǐn)?shù)的概率。最常見(jiàn)的減法式模型為Samejima(1969)的等級(jí)反應(yīng)模型(graded response model)。除法式模型中,考生得到相應(yīng)分?jǐn)?shù)的概率通過(guò)計(jì)算單個(gè)方程式一步得出。最常見(jiàn)的除法式模型為分部評(píng)分模型(partial credit model; Masters, 1982)與廣義分部評(píng)分模型(generalized partial credit model; Muraki, 1992)。盡管文獻(xiàn)中至少存在幾十種多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型,我們?cè)诖藘H詳細(xì)介紹使用最為廣泛的三種模型,即等級(jí)反應(yīng)模型、分部評(píng)分模型、廣義分部評(píng)分模型。
2.3.1 等級(jí)反應(yīng)模型
等級(jí)反應(yīng)模型(Samejima, 1969)源于Thurstone量表法(Thurstone, 1925, 1928),用于模擬有序的多級(jí)反應(yīng)項(xiàng)目。等級(jí)反應(yīng)模型是雙參數(shù)模型在多級(jí)項(xiàng)目情況下的延伸,采用兩個(gè)步驟模擬考生回答多級(jí)計(jì)分項(xiàng)目的方式。第一步,將得分類別人工一分為二,然后計(jì)算能力為θj的考生 j在項(xiàng)目i上得 x 分的條件概率:

其中,是條件概率,ai是項(xiàng)目i的區(qū)分度參數(shù),bix是項(xiàng)目i的類別分?jǐn)?shù)x與 x-1之間的類別閾值(category threshold)。等級(jí)反應(yīng)模型中,不同項(xiàng)目的區(qū)分度參數(shù)ai不一樣,但同一項(xiàng)目所有類別的區(qū)分度參數(shù)是一樣的。同一項(xiàng)目的各個(gè)類別的類別閾值bix不一樣,且需滿足bx-1< bx< bx+1。
第二步,將兩個(gè)相鄰類別的條件概率相減,則得到考生在該項(xiàng)目上得到相應(yīng)類別分?jǐn)?shù)的概率。可以用以下公式表示:

同時(shí),等級(jí)反應(yīng)模型限定考生得分為最低類別分?jǐn)?shù)或超過(guò)最低類別分?jǐn)?shù)的概率為,考生得分超過(guò)最高類別分?jǐn)?shù)的概率為
。設(shè)置了這些限定條件后,公式(8)即可適用于任何類別分?jǐn)?shù)。
2.3.2 分部評(píng)分模型
分部評(píng)分模型由Master(s 1982)首次提出。該模型是Rasch模型的拓展,假定不同項(xiàng)目的區(qū)分度參數(shù)相同。正如上文所述,分部評(píng)分模型為常見(jiàn)的除法式模型,可以直接計(jì)算考生得分為某一類別分?jǐn)?shù)的概率。除模型類別不同之外,分部評(píng)分模型不同于等級(jí)反應(yīng)模型的另一個(gè)方面是:等級(jí)反應(yīng)模型中用類別閾值(category threshold)描述考生得分從一個(gè)類別跨到另一個(gè)類別的概率,而分部評(píng)分模型采用難度階(step)參數(shù)進(jìn)行描述。也就是說(shuō),分部評(píng)分模型認(rèn)為考生回答項(xiàng)目的方式就如通過(guò)一系列連續(xù)的“階段”。能力為θj的考生j在項(xiàng)目i上得x分的概率Pix(θj)用分部評(píng)分模型可表示如下:

其中,mi是項(xiàng)目i的所有得分類別之和減去1, bik是項(xiàng)目i中得分為k 的難度階參數(shù)。分部評(píng)分模型中的難度階參數(shù)bik不同于等級(jí)反應(yīng)模型中的類別閾值參數(shù)。分部評(píng)分模型中的難度階參數(shù)指考生得分從一個(gè)類別跨到另一個(gè)類別的難度,其值為類別反應(yīng)曲線中兩個(gè)相鄰類別得分概率相同的那個(gè)點(diǎn)。等級(jí)反應(yīng)模型中的類別閾值指的是考生得分為該類別分?jǐn)?shù)的概率等于或大于50%的那個(gè)點(diǎn)。同時(shí),分部評(píng)分模型中的難度階參數(shù)不一定按從小到大的順序排列,而等級(jí)評(píng)分模型中的類別閾值遵循從小到大的順序(Embretson &Reise, 2000)。
2.3.3 廣義分部評(píng)分模型
廣義分部評(píng)分模型由Muraki(1992)首次提出,是雙參數(shù)函數(shù)在多級(jí)計(jì)分項(xiàng)目中的拓展。能力為θj的考生j在項(xiàng)目i上得x分的概率Pix(θj)用廣義分部評(píng)分模型可表示為:

其中,mi和bik的概念跟分部評(píng)分模型中的概念一樣。ai指項(xiàng)目i的區(qū)分度參數(shù)。從公式(10)中可以看出,當(dāng)限定ai為1時(shí),公式(10)便與公式(9)完全一樣。因此,分部評(píng)分模型是嵌套于廣義分部評(píng)分模型中的一種更為簡(jiǎn)約的模型。分部評(píng)分模型中不允許項(xiàng)目區(qū)分度參數(shù)在不同項(xiàng)目中有所不同,而廣義分部評(píng)分模型則允許不同的項(xiàng)目有不同的區(qū)分度參數(shù)。需要指出的是,多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的區(qū)分度參數(shù)概念與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的區(qū)分度參數(shù)概念不完全一致。在多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中,項(xiàng)目的區(qū)分度不僅取決于區(qū)分度參數(shù) ai,還取決于項(xiàng)目各類別反應(yīng)曲線上類別閾值(對(duì)于等級(jí)反應(yīng)模型而言)或類別交叉點(diǎn)(對(duì)于分部評(píng)分模型與廣義分部評(píng)分模型而言)的分布狀況(Embretson & Reise, 2000; DeMars, 2010)。各類別閾值或類別交叉點(diǎn)之間的距離越遠(yuǎn),說(shuō)明項(xiàng)目各類別越能更好地區(qū)分考生的能力水平;距離越近,則類別間差異越小,即區(qū)分能力越弱。
總之,等級(jí)反應(yīng)模型與廣義分部評(píng)分模型都是雙參數(shù)模型的拓展。只有兩個(gè)反應(yīng)類別時(shí),兩者可以互換。但是,有三個(gè)或三個(gè)以上的反應(yīng)類別時(shí),這兩種模型中估計(jì)出來(lái)的參數(shù)不存在可比性,因?yàn)檫@兩種模型模擬考生反應(yīng)過(guò)程的方式不同。分部評(píng)分模型是單參數(shù)模型的拓展,嵌套于廣義分部評(píng)分模型中。
2.3.4 多級(jí)計(jì)分模型的項(xiàng)目信息量與測(cè)試信息量
計(jì)算多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型的項(xiàng)目信息量與測(cè)試信息量時(shí),需采用比二級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型更為復(fù)雜的方法,因?yàn)槎嗉?jí)計(jì)分項(xiàng)目中涉及多個(gè)類別,而每個(gè)類別都提供一定量的信息。Samejima(1969)認(rèn)為多級(jí)計(jì)分項(xiàng)目i的類別信息量函數(shù)可以表示為:

其中,Pix(θ)代表能力為θj的考生j在項(xiàng)目i上得x分的概率,為Pix(θ)的一階導(dǎo)數(shù),
為Pix(θ)的二階導(dǎo)數(shù)。
多級(jí)計(jì)分項(xiàng)目i的項(xiàng)目信息量函數(shù)可以表達(dá)為:

相對(duì)于二級(jí)計(jì)分項(xiàng)目而言,多級(jí)計(jì)分項(xiàng)目的信息量大小不僅取決于區(qū)分度參數(shù),還取決于類別參數(shù)的分布狀況(DeMars, 2010)。
由于多級(jí)計(jì)分項(xiàng)目中包含多個(gè)反應(yīng)類別,因此多級(jí)計(jì)分項(xiàng)目往往能在更大的能力區(qū)間上提供更多的信息(Ostini & Nering, 2006; Jiseon, 2010),且有可能出現(xiàn)多個(gè)項(xiàng)目信息量峰值(DeMars, 2010)。
多級(jí)計(jì)分項(xiàng)目反應(yīng)理論中的測(cè)試信息量概念與二級(jí)計(jì)分項(xiàng)目反應(yīng)理論一致。同樣,測(cè)試信息量可以表述為項(xiàng)目信息量的總和。若采用最大似然估計(jì)法,則測(cè)試信息量與能力估計(jì)標(biāo)準(zhǔn)誤差之間存在反向關(guān)系。
- GB/T 51146-2015 硝化甘油生產(chǎn)廢水處理設(shè)施技術(shù)規(guī)范
- 海上風(fēng)力發(fā)電場(chǎng)勘測(cè)標(biāo)準(zhǔn)
- GB 51227-2017 立井鉆井法施工及驗(yàn)收規(guī)范
- DL/T 5546-2018 自然通風(fēng)冷卻塔防腐設(shè)計(jì)導(dǎo)則
- GB/T51154-2015海底光纜工程設(shè)計(jì)規(guī)范(英文版)
- GB/T 51175-2016 煉油裝置火焰加熱爐工程技術(shù)規(guī)范
- DL/T 5160-2015 電力工程巖土描述技術(shù)規(guī)程
- DL/T5231-2010±800kV及以下直流輸電接地極施工及驗(yàn)收規(guī)程(英文版)
- GB 50588-2017 水泥工廠余熱發(fā)電設(shè)計(jì)標(biāo)準(zhǔn)
- GB50830-2013冶金礦山采礦設(shè)計(jì)規(guī)范(英文版)
- DL/T5161.12-2002電氣裝置安裝工程質(zhì)量檢驗(yàn)及評(píng)定規(guī)程第12部分:低壓電器施工質(zhì)量檢驗(yàn)(英文版)
- 核電廠混凝土結(jié)構(gòu)技術(shù)標(biāo)準(zhǔn)
- GB/T 51325-2018 煤焦化粗苯加工工程設(shè)計(jì)標(biāo)準(zhǔn)
- GB/T 51172-2016 在役油氣管道工程檢測(cè)技術(shù)規(guī)范
- GB 50384-2016 煤礦立井井筒及硐室設(shè)計(jì)規(guī)范