基于XML自适应考试系统设计与实现.docVIP

下载本文档

5
0
约 5页
2017-09-10 发布于重庆
举报
版权申诉

基于XML自适应考试系统设计与实现.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于XML的自适应考试系统的设计与实现 Design and Implementation of XML-Based Computerized adaptive tests 袁国民海军指挥学院教育技术中心 Tel:025-4829865 E-mail:yuangaoming@ 本文介绍了项目反应理论（IRT）和计算机化自适应考试（CAT）的基本理论和实现过程。并提出了一个基于XML语言的自适应考试系统的基本组成和三层结构模型，介绍了各个过程中的关键技术和实现手段。关键词：XML CAT 远程教育 E-Learning 1 引言当前，考试的指导理论主要有两种：1〕以真分数理论为代表的经典测试理论（CCT），2〕项目反应理论（IRT）。经过了近百年的发展，经典测试理论建立了一系列题目分析的公式，如表示难度的p值，表示区分度的题目与测试相关系数，估计分数真值的标准误差及由此推算出来的信度公式等。经典测试理论对建立试卷、考分转换与等值等均有一套较为完整的方法。但此理论仍有不够完善的地方：考生分数和题目难度有着密切关系，即题目难度是相对于考生而言的。如何使得题目参数稳定，不受受测样本影响，项目反应理论正是在这种背景下出现的。项目反应理论是以受测者的回答问题的情况，经题目特征函数的运算，推测受测者的能力。根据项目反应理论，能力为θ的人答对题(u=1)的概率如公式(1)所示：（1）式中： θ: 受测者能力值 a：题目的区分度 b：题目的难度 c：题目的猜测系数 P：能力为θ的人答对此题目的概率 2 计算机化自适应考试（Computerized Adaptive Test—CAT）计算机自适应考试（CAT）。它的核心思想是：系统会根据用户答题情况不断计算被试者的能力值及信息量，并实时地根据这些参数调整出题策略，最终给被试者一个恰当的评价。简单的说就是：CAT在做测验时，先从题库中选取一个试题实施测试，如果受试者答对了就选取一个较难的题再施测；如果受试者答错了就选取一个简单的题目再施测；不断重复测验过程，一直到受试者的能力被精确估计出来为止。整个测试过程如图1所示：下面对CAT系统进行测试的各个环节加以详细描述。 2.1 建立IRT题库建立题库是一个复杂的系统工程，首先要建立系统的IRT数学模型，然后确定试题的属性指标以及试题的组成结构，再组织大批量的优秀学科教师编写试题。为了保证这些试题的科学性和有效性，还要组织大量的被试样本，进行抽样测试。题库作为一个教育测量工具，它不仅仅是只有试题管理和组卷的功能，它更重要的功能是收集测试数据，并对这些测试数据进行统计与分析，发现题库中所存在的问题，发现教师教学过程中的问题，发现学生学习过程中的问题。 2.2 系统初始化参数的初始化是指在受测者在进行测试之前，对受测者的能力值进行初始估计，一般有以下几种方法：（1）选择中等难度的试题，即假定受测者的能力为中等，在题库中随机抽取难度为中等的题目，作为测试的开始点。（2）根据历史记录确定受测者的初始能力值，受测者可能参加过测试，可以根据以前的测试记录决定此次的开始题目，或根据以前其他受测者的测试记录决定开始题目。（3）受测者自行选择，由受测者自行决定自己的能力程度，选择测试起始题目。 2.3 根据考生的估算能力值选择合适的题目不断抽取和受测者能力相适应的题目是CAT的基本原则。通常，我们利用IRT题库中题目的最大信息函数来确定所选择的题目。IRT用题目的信息函数I(θ)来表示题目参数与受测者能力的关系。（2）其中： θ：受测者能力估计值 aj，bj，cj：第i题的区分度、难度、猜测系数对于不同能力的受测者，题目有不同的信息量，信息量取最大值时，它所对应的能力值即是最适合于采用此题目测试的人员的能力值。因此，在CAT系统中，根据前面推测的能力值，系统搜寻相应信息量最大的题目进行测试。另外，还可以采用Bayes方法选取试题。它是以能力估计值在测试之后的改变作为选择标准，即选择使得能力估计值在测试之后改变最小的题目进行测试。 2.4 估计考生的能力值正确估计受测者的能力是CAT顺利进行的前提，为计算其能力值通过对下式进行反复迭代（3）其中：（4）直到公式（3）的右边很小为止。 2.5 终止条件式（5）用于计算其标准误差，当值小于某个给定值时，考试结束。（5） 3 XML语言的特点及系统的DTD数据结构 XML是eXtensible Markup Language（可扩展的置标语言）的缩写，是W3C组织于1