两种新的计算机化自适应测验在线标定方法 - 心理学报.PDFVIP

下载本文档

57
0
约9.52万字
约 15页
2017-06-13 发布于天津
举报
版权申诉

两种新的计算机化自适应测验在线标定方法 - 心理学报.PDF

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

两种新的计算机化自适应测验在线标定方法 - 心理学报

心理学报 2016, Vol. 48, No.9, 11841198 Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2016.01184 两种新的计算机化自适应测验在线标定方法* 陈平 (北京师范大学中国基础教育质量监测协同创新中心, 北京 100875) 摘要在线标定技术由于具有诸多优点而被广泛应用于计算机化自适应测验(CAT)的新题标定。Method A 是想法最直接、算法最简单的 CAT 在线标定方法, 但它具有明显的理论缺陷——在标定过程中将能力估计值视为能力真值。将全功能极大似然估计方法(FFMLE)与“利用充分性结果”估计方法 (ECSE) 的误差校正思路融入 Method A (新方法分别记为 FFMLE-Method A 和 ECSE-Method A), 从理论上对能力估计误差进行校正, 进而克服 Method A 的标定缺陷。模拟研究的结果表明：(1)在大多数实验条件下, 两种新方法较 Method A 总体上可以改进标定精度, 且在测验长度为 10 的短测验上的改进幅度最大; (2)当 CAT 测验长度较短或中等 (10 或 20 题 ) 时 , 两种新方法的表现与性能最优的 MEM 已非常接近。当测验长度较长(30 题 ) 时 , ECSE-Method A 的总体表现最好、优于 MEM; (3)样本量越大, 各种方法的标定精度越高。关键词全功能极大似然估计 ; 计算机化自适应测验 ; 项目反应理论 ; 在线标定; 题库建设分类号 B841 1 引言量新的技能类型(如知识状态); (4)与多级项目反应理论(Polytomous Item Response Theory , PIRT)结合在传统纸笔测验 (Paper-and-Pencil , PP) 中, 可以提供基于表现的题目类型(如开放题); (5)与多所有被试不论能力高低都作答相同的一批题目, 所维 IRT (Multidimensional IRT , MIRT)相结合可以提以 PP 中题目的难度分布较广, 一般覆盖整个能供被试在多个分维度上的精细信息 ; (6)主试如果感力范围。于是, 题目对高能力被试而言大多比较容兴趣还可以记录被试在每个题目上的反应时, 以作易、对低能力被试来说大多比较难, 不利于对被试为评价被试能力的辅助指标(Wang, 2012); (7)当题能力的准确估计(漆书青, 戴海琦, 丁树良, 2002)。计库得到良好维护时, 测验可以全年提供, 被试可以算机化自适应测验(Computerized Adaptive Testing, 选择方便的时间参加测验(Cheng, 2008) 。上述优点 CAT) 的基本思路是让计算机自动模仿聪明主试的使得国内外很多大规模的选拔性与资格性考试都做法 , 每次都呈现最适合被试作答的题目 (Wainer 推出 CAT 版本的测验, 例如美国商学院研究生入学 et al., 1990) 。因此, 相对于 PP, CAT 使用更少的题考试与美国医生护士资格考试(Chang, 2012, 2015), 目就能达到相同的能力估计精度(如 Weiss, 1982), 还有我国第四军医大学对应征公民进行的图形智力大大提高了测验效率。CAT 还有很多其他优点, 比测验( 田健全, 苗丹民, 杨业兵, 何宁, 肖玮, 2009)等。如：(1)随着计算机硬件的不