基于XML自适应考试系统设计与实现.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于XML的自适应考试系统的设计与实现 Design and Implementation of XML-Based Computerized adaptive tests 袁国民 海军指挥学院教育技术中心 Tel:025-4829865 E-mail:yuangaoming@ 本文介绍了项目反应理论(IRT)和计算机化自适应考试(CAT)的基本理论和实现过程。并提出了一个基于XML语言的自适应考试系统的基本组成和三层结构模型,介绍了各个过程中的关键技术和实现手段。 关键词:XML CAT 远程教育 E-Learning 1 引言 当前,考试的指导理论主要有两种:1〕以真分数理论为代表的经典测试理论(CCT),2〕项目反应理论(IRT)。经过了近百年的发展,经典测试理论建立了一系列题目分析的公式,如表示难度的p值,表示区分度的题目与测试相关系数,估计分数真值的标准误差及由此推算出来的信度公式等。经典测试理论对建立试卷、考分转换与等值等均有一套较为完整的方法。但此理论仍有不够完善的地方:考生分数和题目难度有着密切关系,即题目难度是相对于考生而言的。如何使得题目参数稳定,不受受测样本影响,项目反应理论正是在这种背景下出现的。 项目反应理论是以受测者的回答问题的情况,经题目特征函数的运算,推测受测者的能力。根据项目反应理论,能力为θ的人答对题(u=1)的概率如公式(1)所示: (1) 式中: θ: 受测者能力值 a:题目的区分度 b:题目的难度 c:题目的猜测系数 P:能力为θ的人答对此题目的概率 2 计算机化自适应考试(Computerized Adaptive Test—CAT) 计算机自适应考试(CAT)。它的核心思想是:系统会根据用户答题情况不断计算被试者的能力值及信息量,并实时地根据这些参数调整出题策略,最终给被试者一个恰当的评价。简单的说就是:CAT在做测验时,先从题库中选取一个试题实施测试,如果受试者答对了就选取一个较难的题再施测;如果受试者答错了就选取一个简单的题目再施测;不断重复测验过程,一直到受试者的能力被精确估计出来为止。 整个测试过程如图1所示: 下面对CAT系统进行测试的各个环节加以详细描述。 2.1 建立IRT题库 建立题库是一个复杂的系统工程,首先要建立系统的IRT数学模型,然后确定试题的属性指标以及试题的组成结构,再组织大批量的优秀学科教师编写试题。 为了保证这些试题的科学性和有效性,还要组织大量的被试样本,进行抽样测试。题库作为一个教育测量工具,它不仅仅是只有试题管理和组卷的功能,它更重要的功能是收集测试数据,并对这些测试数据进行统计与分析,发现题库中所存在的问题,发现教师教学过程中的问题,发现学生学习过程中的问题。 2.2 系统初始化 参数的初始化是指在受测者在进行测试之前,对受测者的能力值进行初始估计,一般有以下几种方法: (1)选择中等难度的试题,即假定受测者的能力为中等,在题库中随机抽取难度为中等的题目,作为测试的开始点。 (2)根据历史记录确定受测者的初始能力值,受测者可能参加过测试,可以根据以前的测试记录决定此次的开始题目,或根据以前其他受测者的测试记录决定开始题目。 (3)受测者自行选择,由受测者自行决定自己的能力程度,选择测试起始题目。 2.3 根据考生的估算能力值选择合适的题目 不断抽取和受测者能力相适应的题目是CAT的基本原则。通常,我们利用IRT题库中题目的最大信息函数来确定所选择的题目。IRT用题目的信息函数I(θ)来表示题目参数与受测者能力的关系。 (2) 其中: θ:受测者能力估计值 aj,bj,cj:第i题的区分度、难度、猜测系数 对于不同能力的受测者,题目有不同的信息量,信息量取最大值时,它所对应的能力值即是最适合于采用此题目测试的人员的能力值。因此,在CAT系统中,根据前面推测的能力值,系统搜寻相应信息量最大的题目进行测试。另外,还可以采用Bayes方法选取试题。它是以能力估计值在测试之后的改变作为选择标准,即选择使得能力估计值在测试之后改变最小的题目进行测试。 2.4 估计考生的能力值 正确估计受测者的能力是CAT顺利进行的前提,为计算其能力值通过对下式进行反复迭代 (3) 其中: (4) 直到公式(3)的右边很小为止。 2.5 终止条件 式(5)用于计算其标准误差,当值小于某个给定值时,考试结束。 (5) 3 XML语言的特点及系统的DTD数据结构 XML是eXtensible Markup Language(可扩展的置标语言)的缩写,是W3C组织于1

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档