- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于XML的自适应考试系统的设计与实现
Design and Implementation of XML-Based Computerized adaptive tests
袁国民
海军指挥学院教育技术中心
Tel:025-4829865
E-mail:yuangaoming@
本文介绍了项目反应理论(IRT)和计算机化自适应考试(CAT)的基本理论和实现过程。并提出了一个基于XML语言的自适应考试系统的基本组成和三层结构模型,介绍了各个过程中的关键技术和实现手段。
关键词:XML CAT 远程教育 E-Learning
1 引言
当前,考试的指导理论主要有两种:1〕以真分数理论为代表的经典测试理论(CCT),2〕项目反应理论(IRT)。经过了近百年的发展,经典测试理论建立了一系列题目分析的公式,如表示难度的p值,表示区分度的题目与测试相关系数,估计分数真值的标准误差及由此推算出来的信度公式等。经典测试理论对建立试卷、考分转换与等值等均有一套较为完整的方法。但此理论仍有不够完善的地方:考生分数和题目难度有着密切关系,即题目难度是相对于考生而言的。如何使得题目参数稳定,不受受测样本影响,项目反应理论正是在这种背景下出现的。
项目反应理论是以受测者的回答问题的情况,经题目特征函数的运算,推测受测者的能力。根据项目反应理论,能力为θ的人答对题(u=1)的概率如公式(1)所示:
(1)
式中:
θ: 受测者能力值
a:题目的区分度
b:题目的难度
c:题目的猜测系数
P:能力为θ的人答对此题目的概率
2 计算机化自适应考试(Computerized Adaptive Test—CAT)
计算机自适应考试(CAT)。它的核心思想是:系统会根据用户答题情况不断计算被试者的能力值及信息量,并实时地根据这些参数调整出题策略,最终给被试者一个恰当的评价。简单的说就是:CAT在做测验时,先从题库中选取一个试题实施测试,如果受试者答对了就选取一个较难的题再施测;如果受试者答错了就选取一个简单的题目再施测;不断重复测验过程,一直到受试者的能力被精确估计出来为止。
整个测试过程如图1所示:
下面对CAT系统进行测试的各个环节加以详细描述。
2.1 建立IRT题库
建立题库是一个复杂的系统工程,首先要建立系统的IRT数学模型,然后确定试题的属性指标以及试题的组成结构,再组织大批量的优秀学科教师编写试题。 为了保证这些试题的科学性和有效性,还要组织大量的被试样本,进行抽样测试。题库作为一个教育测量工具,它不仅仅是只有试题管理和组卷的功能,它更重要的功能是收集测试数据,并对这些测试数据进行统计与分析,发现题库中所存在的问题,发现教师教学过程中的问题,发现学生学习过程中的问题。
2.2 系统初始化
参数的初始化是指在受测者在进行测试之前,对受测者的能力值进行初始估计,一般有以下几种方法:
(1)选择中等难度的试题,即假定受测者的能力为中等,在题库中随机抽取难度为中等的题目,作为测试的开始点。
(2)根据历史记录确定受测者的初始能力值,受测者可能参加过测试,可以根据以前的测试记录决定此次的开始题目,或根据以前其他受测者的测试记录决定开始题目。
(3)受测者自行选择,由受测者自行决定自己的能力程度,选择测试起始题目。
2.3 根据考生的估算能力值选择合适的题目
不断抽取和受测者能力相适应的题目是CAT的基本原则。通常,我们利用IRT题库中题目的最大信息函数来确定所选择的题目。IRT用题目的信息函数I(θ)来表示题目参数与受测者能力的关系。
(2)
其中:
θ:受测者能力估计值
aj,bj,cj:第i题的区分度、难度、猜测系数
对于不同能力的受测者,题目有不同的信息量,信息量取最大值时,它所对应的能力值即是最适合于采用此题目测试的人员的能力值。因此,在CAT系统中,根据前面推测的能力值,系统搜寻相应信息量最大的题目进行测试。另外,还可以采用Bayes方法选取试题。它是以能力估计值在测试之后的改变作为选择标准,即选择使得能力估计值在测试之后改变最小的题目进行测试。
2.4 估计考生的能力值
正确估计受测者的能力是CAT顺利进行的前提,为计算其能力值通过对下式进行反复迭代
(3)
其中:
(4)
直到公式(3)的右边很小为止。
2.5 终止条件
式(5)用于计算其标准误差,当值小于某个给定值时,考试结束。
(5)
3 XML语言的特点及系统的DTD数据结构
XML是eXtensible Markup Language(可扩展的置标语言)的缩写,是W3C组织于1
您可能关注的文档
最近下载
- 2023年武汉科技大学计算机科学与技术专业《计算机网络》科目期末试卷B(有答案).docx VIP
- 乳腺癌-病例讨论.ppt VIP
- 职业教育课程思政.pptx
- 2020 电力市场交易人员培训考核规范.docx VIP
- Q_GDW 12070-2020 配电网工程标准化设计图元规范.docx VIP
- csds_CSDS100-21-0 对苯二甲酸物质安全资料表SDS或化学品安全技术说明书MSDS.pdf VIP
- 《纪律处分条例》修订课件.ppt VIP
- 乳腺癌病例讨论.ppt VIP
- 护理学术会议心得体会汇报.pptx
- 2023年武汉科技大学网络工程专业《计算机网络》科目期末试卷A(有答案).docx VIP
文档评论(0)