哪里能看不朽情缘直播

書名：計(jì)算機(jī)自適應(yīng)語言測試模型設(shè)計(jì)與效度驗(yàn)證
作者名：何蓮珍閔尚超
本章字?jǐn)?shù)： 1816字
更新時(shí)間： 2020-01-03 10:34:08

2.1 項(xiàng)目反應(yīng)理論的基本假設(shè)

項(xiàng)目反應(yīng)理論有兩大基本假設(shè)，即單維性與局部獨(dú)立性。無論何種情況下，在應(yīng)用項(xiàng)目反應(yīng)理論前都應(yīng)該檢測這兩項(xiàng)基本假設(shè)是否得到滿足。

2.1.1 單維性

項(xiàng)目反應(yīng)理論的第一個(gè)假設(shè)為單維性假設(shè)。該假設(shè)認(rèn)為：一項(xiàng)測試中的所有項(xiàng)目均只測量某一單一能力或特質(zhì)。在語言測試領(lǐng)域，語言能力的單維性一直是一個(gè)頗受爭議的話題。一些研究者認(rèn)為語言能力是一個(gè)單一構(gòu)念，一個(gè)總的能力因子便可完全解釋語言測試中的共同方差（Oller, 1976; Oller &Hinofotis, 1980）。另一些研究者則認(rèn)為語言能力是一個(gè)多維構(gòu)念，不僅存在一個(gè)總的語言能力因子，還存在聽、說、讀、寫等微技能因子（Morgan &Mazzeo, 1988）。目前較為公認(rèn)的一種觀點(diǎn)是：所有測試在一定程度上都是多維的（Choi & Bachman, 1992），單維性只是一個(gè)度的問題，而非存在與否的問題（Laurier, 1999）。

對(duì)于測試的單維性，學(xué)界提出了不同的檢驗(yàn)方法，如信度數(shù)據(jù)（Hattie, 1985）、成分分析法（Hattie, 1985）、探索性因子分析（Hattie, 1985）、驗(yàn)證性因子分析（Wang, 2009）、項(xiàng)目反應(yīng)理論擬合度數(shù)據(jù)（Yen, 1984; Hambleton &Swaminathan, 1985）、DETECT（Zhang & Stout, 1999），以及DIMTEST程序（Stout, 1987; Stout et al., 2001）等。目前使用最為廣泛的方法是探索性因子分析（Jang & Roussos, 2007）。如果第一因子能解釋總方差的20%以上，則說明該測試滿足單維性假設(shè)（Reckase, 1979）。或者，如果第一因子特征值與第二因子特征值的比例較大，也表明測試滿足單維性假設(shè)（Lord, 1980），但迄今為止學(xué)界在確定測試符合單維性假設(shè)的臨界值這一問題上沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)。

2.1.2 局部獨(dú)立性

項(xiàng)目反應(yīng)理論的第二個(gè)假設(shè)為局部獨(dú)立性假設(shè)。該假設(shè)認(rèn)為考生在各道題目上的答對(duì)概率相互獨(dú)立，即考生的潛在能力是影響其作答的唯一因素，當(dāng)排除這個(gè)因素的影響后，考生在不同題目上的作答行為之間不存在任何關(guān)系（Embretson & Reise, 2000; Yen, 1993）。但是在大規(guī)模英語測試中，局部獨(dú)立性假設(shè)往往會(huì)被違反，因?yàn)橛⒄Z測試中常見的題型是題組，即若干個(gè)選擇題基于同一聽力或閱讀篇章。在這種情況下，考生在對(duì)題組中某一個(gè)項(xiàng)目作答時(shí)很容易獲得對(duì)題組中另一項(xiàng)目的作答線索，從而導(dǎo)致局部獨(dú)立性假設(shè)被違反（Hendrickson, 2007）。大量文獻(xiàn)資料表明，在局部獨(dú)立性假設(shè)被違反的情況下，采用標(biāo)準(zhǔn)的二級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型進(jìn)行項(xiàng)目分析，會(huì)導(dǎo)致一系列問題，如對(duì)項(xiàng)目參數(shù)與能力的估值不準(zhǔn)確（Ackerman, 1987; Chen & Thissen, 1997; Bradlow, 1999; Tuerlinckx & De Boeck, 2001），對(duì)測試信息量，即測量精確度的估值過高（Thissen et al., 1989; Sireci et al., 1991; Yen, 1993; Wainer, 1995; Wainer & Thissen, 1996; Zhang, 2010）、等值誤差過高（Lee et al., 2001;Li et al., 2005）以及模型與數(shù)據(jù)的不擬合（Marais & Andrich, 2008）等等。此外，局部獨(dú)立性假設(shè)被違反可能會(huì)帶來一個(gè)新的維度，影響考生的答題反應(yīng)，從而使單維性假設(shè)也無法得到滿足。

解決上述問題的一個(gè)有效方法是采用多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型。該方法把基于同一篇章的若干個(gè)題目視為一個(gè)整體，即把考生在同一題組所有題目上的得分相加，作為一個(gè)多級(jí)計(jì)分題目，運(yùn)用多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型進(jìn)行參數(shù)估計(jì)（Rosenbaum, 1988; Thissen et al., 1989; Wilson & Adams, 1995;Lee, 1998）。需要指出的是，局部獨(dú)立性在任何情況下都是一個(gè)實(shí)證現(xiàn)象，而非先驗(yàn)假設(shè)（Steinberg & Thissen, 1996），因此，在實(shí)證研究中需要首先檢驗(yàn)局部獨(dú)立性假設(shè)是否被違反。否則，盲目地假定基于題組的項(xiàng)目會(huì)因題組效應(yīng)而無法滿足局部獨(dú)立性假設(shè)，從而使用復(fù)雜的項(xiàng)目反應(yīng)理論模型，會(huì)導(dǎo)致更大的項(xiàng)目參數(shù)估計(jì)誤差值（DeMars, 2006），以及更大的能力估計(jì)誤差值（Yang et al., 2012）。

在單維性測試中，局部獨(dú)立性假設(shè)其實(shí)等同于單維性假設(shè)（Lee, 2004），不同之處在于局部獨(dú)立性假設(shè)聚焦較微觀的項(xiàng)目對(duì)（item pair）層次，而單維性假設(shè)聚焦較宏觀的測試總體層次。因此，單維性假設(shè)的檢驗(yàn)方法可作為對(duì)局部獨(dú)立性假設(shè)是否滿足的初步估計(jì)。但是，研究者也提出了一系列從項(xiàng)目對(duì)層次檢驗(yàn)局部獨(dú)立性假設(shè)的統(tǒng)計(jì)指標(biāo)，如Q3值（Yen, 1984）、局部獨(dú)立性χ2值（Chen & Thissen, 1997）、局部獨(dú)立性G2值（Chen & Thissen, 1997）、結(jié)構(gòu)方程模型軟件的修正指標(biāo)（Thissen & Steinberg, 2010）等。前三個(gè)統(tǒng)計(jì)指標(biāo)通常用于二級(jí)計(jì)分項(xiàng)目（Ho, 2010），第四個(gè)統(tǒng)計(jì)指標(biāo)，即結(jié)構(gòu)方程模型軟件的修正指標(biāo)，則通常用于項(xiàng)目較少的測試或問卷調(diào)查，或利克特量表（Thissen & Steinberg, 2010）。

需要特別指出的是，Chen與Thissen（1997）提出的局部獨(dú)立性χ2值被Thissen（2009）拓展為標(biāo)準(zhǔn)化局部獨(dú)立性 χ2值，可以同時(shí)處理二級(jí)計(jì)分項(xiàng)目與多級(jí)計(jì)分項(xiàng)目（Cai et al., 2011）。標(biāo)準(zhǔn)化局部獨(dú)立性 χ2值可以直接從IRTPRO 2.1軟件中的單維項(xiàng)目反應(yīng)理論建模中得出。具體計(jì)算方法是：比較每對(duì)項(xiàng)目的期望頻率與觀察頻率，并進(jìn)行標(biāo)準(zhǔn)化處理，從而使得具有不同反應(yīng)類別數(shù)量的項(xiàng)目之間具有可比性（Thissen, 2009; Cai et al., 2011）。該數(shù)據(jù)為標(biāo)準(zhǔn)化數(shù)據(jù)，因此如果該數(shù)據(jù)大于4，則表明該項(xiàng)目對(duì)之間違反了局部獨(dú)立性假設(shè)；如果大于10，則表明嚴(yán)重違反了局部獨(dú)立性假設(shè)。

官术网_书友最值得收藏!

計(jì)算機(jī)自適應(yīng)語言測試模型設(shè)計(jì)與效度驗(yàn)證

2.1 項(xiàng)目反應(yīng)理論的基本假設(shè)

2.1.1 單維性

2.1.2 局部獨(dú)立性