计算机辅助测验.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第10章 计算机辅助测验 学习目标 掌握教育测验的基本知识。 了解计算机辅助测验的理论基础。 掌握教育测验的系统结构并能进行系统设计。 了解计算机辅助测验的实施过程。 掌握题库系统的结构与功能。 教育测验基础 测验的定义 阿娜斯塔西(Anastasi,A)给测验下的定义:“测验实质上是行为样本的客观的和标准化的测量。”这一定义包含了三个基本因素: 行为样本:通常在测验中我们只选取一组有代表性的行为来考查个体在特定行为领域的行为特征。因此测验的行为样本的是特定行为领域的一个有效代表。 标准化:标准化是指测验的编制、实施、记分以及测验分数解释程序的一致性。测验标准化除了能使不同人的测验结果具有可比性;还可以提高测验的质量,增加测验的客观性,使其结果更准确、可靠。 客观测量的评价指标:对测验客观性程度的评价指标主要有 : (1)题目质量分析,包括难度和区分度,这是筛选题目以构成一个好测验的基础; (2)信度,指测验结果的可靠性程度; (3)效度,指测验结果的有效性程度,这是评价测验质量最重要的指标。 教育测验的功能 评价学生的学习情况:教育测验可用于诊断学生目前学习状况,预测对学生未来成功与否,还可以使学生正确地进行自我评价,充分了解自身的学习状况,有效地激发学生争取更大进步。 通过测验来了解学生可以得到一个更客观的结果。 评价教学:测验可以选拔与评定学校管理人员与教师,提高师资水平;还可以评价和鉴定教材与教学方法从而提高教学质量。 教育测验的分类 常模参照测验:常模参照测验以被试伙伴总体为参照系,以评价被试在团体中的相对地位的一种测量与评价类型。也就是说,其参照的标准是对团体进行测验以后确定的,其目的在于考查被试的个体差异。 标准参照测验:标准参照测验以教学目标为参照系,以学生是否达到教学目标来评价学生的学习成就,参照标准是在测验以前确定的,它关心的是评价对象达标的程度。 计算机辅助测验的理论基础 经典测量理论 经典测量理论(Classical Test Theory, 缩写为CTT )的基本思想是: 对某个学生进行测验所得分数X 可看作是代表该生实际知识或能力水平的真实分数T和测验误差分数E 的线性组合,即: X=T+E。分析单个题目时有难度、区分度、迷惑效力的计算公式等。另外, 经典测试理论对于各种测验的编制、考分的转换与等值等均有一套较为完整的方法。 测验题目的统计分析技术 题目难度:难度是指题目的难易程度,它是题目对学生知识和能力水平的适合程度的指标。 难度的计算:难度的指标通常以通过率来表示,即以答对或通过该题的人数比例来表示。当题目的分数是二分变量(即答对为1,答错为0)时: P=R/N 式中:P为题目难度值;R为答对或通过该题的人数;N为全体人数。 当题目的分数是多分值时,难度是全体被试在该题上的平均数与该题满分的比例: 因为被试可能猜测选择题的解答,故需对难度系数加以校正 CP=(KP-1)/(K-1) CP:校正后难度值;P:实际得到的通过率;K:选项数目 客观题极端分组法 根据测验分数按高低排序,用两个极端组在某项目上的平均通过率表示项目的难度 P=(PH+PL)/ 2 计算步骤:按测验总分由高到低排序;从高分段向下选出全部试卷的27%作为高分组;从低分段向上选出全部试卷的27%作为低分组;按照上述公式计算项目难度值。 测验题目难度水平的确定:测验测验题目难度水平的适当与否,取决于测验的目的、性质和题目的形成。对于一般的常模参照测验而言,其目的主要在于测量个体差异,当P值接近于0.50时,题目才能把被试做最大程度的区分。但在实际工作中,若每一道题目的难度值均为0.50,那么此测验很可能只能区分出好与差两种极端被试的差异,却不能对各种被试作更精确地区分。因此一般只要求测验题目的平均难度为0.50,而各题难度可在0.50+0.20之间。而在标准参照测验中,可以不必过多地考虑难度,只要施测者认为重要的内容就可以采用。 测验难度水平的确定:整个测验的难度水平取决于组成测验的题目难度。分数结果应呈正态分布,如果分数是明显偏态时可以是正偏态或负偏态,前者被试分数大多集中于低端,说明测验对于所测被试团体而言难度偏高,应增加一定数量的易题;后者则相反,被试分数集中于高端,说明测验对于所测被试团体而言难度偏低,应增加一定数量的难题。 b、题目区分度:指测验题目对学业水平不同的考生的区分程度或鉴别能力。 如果一道题,学业水平、实际能力都较高的考生都答对,学业水平、实际能力都较低的考生都答错,则可认为该题目有好的区分度。 区分度分析主要以效标为依据,考察被试在每个题目上的反应与其在效标上的表现之间的相关程度。所谓效标是指衡量测验或题目有效性的

文档评论(0)

kaku + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8124126005000000

1亿VIP精品文档

相关文档