天才一秒记住【热天中文网】地址:https://www.rtzw.net
(OptimalSequentialDesign)(Berger,1992;Jones&Jin,1994;Ying&Wu,1997)。
前人(g,2011;Ying&Wu,1997)证明了在一系列正则条件下,这种最优序列设计将会收敛至最优设计。
这些统计证明为在线标定的实践应用打下了理论基础。
需要注意的是,事实上,在线标定并不完全符合最优设计的情境。
最优设计通过统计计算,为每一道测试题算出最佳样本的取样标准,然后通过这一标准去取样。
在在线标定的情境下,这些样本也就是参加CAT考试的考生们,而符合最优设计的情境是所有的考生形成一个考生样本库,而我们可以任意选择某一考生来回答一道测试题。
然而在真实的CAT情境下,我们无法控制哪些考生来参加考试。
在某一特定时间点,正在参加CAT考试的考生是给定的,可以控制的只有选哪一道测试题给这位考生,如图9-1-1所示。
这一情境与最优设计的情境有所偏差。
另外,这套统计理论只考虑了统计估计上的量化指标。
有的学者会质疑这种基于统计估计效率的最优取样,因为这样获取的样本很容易失去对总体的代表性,从而成为偏置样本。
那么通过这种样本估计出的参数值,尽管量化方面效率提高了,但从质性方面考虑,是否有效呢?这是一个值得探讨的争议。
四、在线标定的主要设计因素
从图9-1-1中可以归纳出在线标定程序中的四大设计因素:
第一,试测题嵌入位置。
在正式的CAT考试过程中,哪些题目位置被安排为试测题?
第二,试测题选题法。
如何根据题目临时参数和考生能力估计值将考生和试测题合理搭配?
第三,参数估计法。
如何将已有常规参数估计方法改编成适合在线标定情境的参数估计方法?
第四,试测终止规则。
在什么条件下终止一道试测题的试测过程?
测量学界对在线标定的探索始于20世纪80年代(Stog,1988)。
目前存在的研究可以归类为两大方向:一是对于在线标定情境下参数估计方法的开发(Ban,Hanson,Wang,Li&Harris,2001;,Way&g,2012;Segall,2003;Stog,1988)。
二是对试测题选题的探索(g&Lu,2010;,Way&g,2012;Kingsbury,2009;vanderLinden&Ren,2015)。
目前,研究试测题嵌入位置和试测终止规则的文献还较少。
另外,大多数可见文献都是关于单维二级评分模型下在线标定的讨论,而在其他模型下(如单维多项评分、多维度模型、认知诊断模型)的研究则仍处于起步状态。
下文将先对文献资料比较成熟的单维二级评分模型下的在线标定进行详细的论述,之后再对其他模型下的研究情况进行概括。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!