官术网_书友最值得收藏!

2.1 項(xiàng)目反應(yīng)理論的基本假設(shè)

項(xiàng)目反應(yīng)理論有兩大基本假設(shè),即單維性與局部獨(dú)立性。無論何種情況下,在應(yīng)用項(xiàng)目反應(yīng)理論前都應(yīng)該檢測這兩項(xiàng)基本假設(shè)是否得到滿足。

2.1.1 單維性

項(xiàng)目反應(yīng)理論的第一個(gè)假設(shè)為單維性假設(shè)。該假設(shè)認(rèn)為:一項(xiàng)測試中的所有項(xiàng)目均只測量某一單一能力或特質(zhì)。在語言測試領(lǐng)域,語言能力的單維性一直是一個(gè)頗受爭議的話題。一些研究者認(rèn)為語言能力是一個(gè)單一構(gòu)念,一個(gè)總的能力因子便可完全解釋語言測試中的共同方差(Oller, 1976; Oller &Hinofotis, 1980)。另一些研究者則認(rèn)為語言能力是一個(gè)多維構(gòu)念,不僅存在一個(gè)總的語言能力因子,還存在聽、說、讀、寫等微技能因子(Morgan &Mazzeo, 1988)。目前較為公認(rèn)的一種觀點(diǎn)是:所有測試在一定程度上都是多維的(Choi & Bachman, 1992),單維性只是一個(gè)度的問題,而非存在與否的問題(Laurier, 1999)。

對(duì)于測試的單維性,學(xué)界提出了不同的檢驗(yàn)方法,如信度數(shù)據(jù)(Hattie, 1985)、成分分析法(Hattie, 1985)、探索性因子分析(Hattie, 1985)、驗(yàn)證性因子分析(Wang, 2009)、項(xiàng)目反應(yīng)理論擬合度數(shù)據(jù)(Yen, 1984; Hambleton &Swaminathan, 1985)、DETECT(Zhang & Stout, 1999),以及DIMTEST程序(Stout, 1987; Stout et al., 2001)等。目前使用最為廣泛的方法是探索性因子分析(Jang & Roussos, 2007)。如果第一因子能解釋總方差的20%以上,則說明該測試滿足單維性假設(shè)(Reckase, 1979)。或者,如果第一因子特征值與第二因子特征值的比例較大,也表明測試滿足單維性假設(shè)(Lord, 1980),但迄今為止學(xué)界在確定測試符合單維性假設(shè)的臨界值這一問題上沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)。

2.1.2 局部獨(dú)立性

項(xiàng)目反應(yīng)理論的第二個(gè)假設(shè)為局部獨(dú)立性假設(shè)。該假設(shè)認(rèn)為考生在各道題目上的答對(duì)概率相互獨(dú)立,即考生的潛在能力是影響其作答的唯一因素,當(dāng)排除這個(gè)因素的影響后,考生在不同題目上的作答行為之間不存在任何關(guān)系(Embretson & Reise, 2000; Yen, 1993)。但是在大規(guī)模英語測試中,局部獨(dú)立性假設(shè)往往會(huì)被違反,因?yàn)橛⒄Z測試中常見的題型是題組,即若干個(gè)選擇題基于同一聽力或閱讀篇章。在這種情況下,考生在對(duì)題組中某一個(gè)項(xiàng)目作答時(shí)很容易獲得對(duì)題組中另一項(xiàng)目的作答線索,從而導(dǎo)致局部獨(dú)立性假設(shè)被違反(Hendrickson, 2007)。大量文獻(xiàn)資料表明,在局部獨(dú)立性假設(shè)被違反的情況下,采用標(biāo)準(zhǔn)的二級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型進(jìn)行項(xiàng)目分析,會(huì)導(dǎo)致一系列問題,如對(duì)項(xiàng)目參數(shù)與能力的估值不準(zhǔn)確(Ackerman, 1987; Chen & Thissen, 1997; Bradlow, 1999; Tuerlinckx & De Boeck, 2001),對(duì)測試信息量,即測量精確度的估值過高(Thissen et al., 1989; Sireci et al., 1991; Yen, 1993; Wainer, 1995; Wainer & Thissen, 1996; Zhang, 2010)、等值誤差過高(Lee et al., 2001;Li et al., 2005)以及模型與數(shù)據(jù)的不擬合(Marais & Andrich, 2008)等等。此外,局部獨(dú)立性假設(shè)被違反可能會(huì)帶來一個(gè)新的維度,影響考生的答題反應(yīng),從而使單維性假設(shè)也無法得到滿足。

解決上述問題的一個(gè)有效方法是采用多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型。該方法把基于同一篇章的若干個(gè)題目視為一個(gè)整體,即把考生在同一題組所有題目上的得分相加,作為一個(gè)多級(jí)計(jì)分題目,運(yùn)用多級(jí)計(jì)分項(xiàng)目反應(yīng)理論模型進(jìn)行參數(shù)估計(jì)(Rosenbaum, 1988; Thissen et al., 1989; Wilson & Adams, 1995;Lee, 1998)。需要指出的是,局部獨(dú)立性在任何情況下都是一個(gè)實(shí)證現(xiàn)象,而非先驗(yàn)假設(shè)(Steinberg & Thissen, 1996),因此,在實(shí)證研究中需要首先檢驗(yàn)局部獨(dú)立性假設(shè)是否被違反。否則,盲目地假定基于題組的項(xiàng)目會(huì)因題組效應(yīng)而無法滿足局部獨(dú)立性假設(shè),從而使用復(fù)雜的項(xiàng)目反應(yīng)理論模型,會(huì)導(dǎo)致更大的項(xiàng)目參數(shù)估計(jì)誤差值(DeMars, 2006),以及更大的能力估計(jì)誤差值(Yang et al., 2012)。

在單維性測試中,局部獨(dú)立性假設(shè)其實(shí)等同于單維性假設(shè)(Lee, 2004),不同之處在于局部獨(dú)立性假設(shè)聚焦較微觀的項(xiàng)目對(duì)(item pair)層次,而單維性假設(shè)聚焦較宏觀的測試總體層次。因此,單維性假設(shè)的檢驗(yàn)方法可作為對(duì)局部獨(dú)立性假設(shè)是否滿足的初步估計(jì)。但是,研究者也提出了一系列從項(xiàng)目對(duì)層次檢驗(yàn)局部獨(dú)立性假設(shè)的統(tǒng)計(jì)指標(biāo),如Q3值(Yen, 1984)、局部獨(dú)立性χ2值(Chen & Thissen, 1997)、局部獨(dú)立性G2值(Chen & Thissen, 1997)、結(jié)構(gòu)方程模型軟件的修正指標(biāo)(Thissen & Steinberg, 2010)等。前三個(gè)統(tǒng)計(jì)指標(biāo)通常用于二級(jí)計(jì)分項(xiàng)目(Ho, 2010),第四個(gè)統(tǒng)計(jì)指標(biāo),即結(jié)構(gòu)方程模型軟件的修正指標(biāo),則通常用于項(xiàng)目較少的測試或問卷調(diào)查,或利克特量表(Thissen & Steinberg, 2010)。

需要特別指出的是,Chen與Thissen(1997)提出的局部獨(dú)立性χ2值被Thissen(2009)拓展為標(biāo)準(zhǔn)化局部獨(dú)立性 χ2值,可以同時(shí)處理二級(jí)計(jì)分項(xiàng)目與多級(jí)計(jì)分項(xiàng)目(Cai et al., 2011)。標(biāo)準(zhǔn)化局部獨(dú)立性 χ2值可以直接從IRTPRO 2.1軟件中的單維項(xiàng)目反應(yīng)理論建模中得出。具體計(jì)算方法是:比較每對(duì)項(xiàng)目的期望頻率與觀察頻率,并進(jìn)行標(biāo)準(zhǔn)化處理,從而使得具有不同反應(yīng)類別數(shù)量的項(xiàng)目之間具有可比性(Thissen, 2009; Cai et al., 2011)。該數(shù)據(jù)為標(biāo)準(zhǔn)化數(shù)據(jù),因此如果該數(shù)據(jù)大于4,則表明該項(xiàng)目對(duì)之間違反了局部獨(dú)立性假設(shè);如果大于10,則表明嚴(yán)重違反了局部獨(dú)立性假設(shè)。

主站蜘蛛池模板: 平乐县| 东光县| 万全县| 襄城县| 奉节县| 凤山市| 乌拉特中旗| 武定县| 那曲县| 榆中县| 驻马店市| 凤山县| 博湖县| 阿克陶县| 收藏| 米林县| 姚安县| 牡丹江市| 苍溪县| 余干县| 平泉县| 泰和县| 津南区| 南阳市| 长顺县| 宝山区| 沐川县| 康定县| 托里县| 和平区| 团风县| 杂多县| 长宁区| 册亨县| 阿坝| 宁武县| 资溪县| 新龙县| 蒲江县| 卓资县| 木兰县|