- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信度-黑龙江大学外语教学研究部
第五章 语言测试的信度研究
美国应用语言学教授Lyle F Bachman,现任国际语言测试协会ILTA 副主席, 是世界著名的语言测试专家, 其理论专著 Fundamental Considerations in Language Testing 曾获得美国Midenberger 奖, 在测试领域产生了广泛而深远的影响。信度 Reliability也称可靠性或一致性 Consistency, 是Bachman 的主要研究领域之一。Bachman 认为, 信度所回答的主要问题是:考生的测试成绩中有多少误差是由考生本身能力之外的因素引起的? 换言之, 考生的成绩在多大程度上是可靠的或可信的?
信度的定义
Bachman(1996)把信度定义为“测试的一致性”(consistency of measurement)。简言之就是测试结果的可信度、可靠度, 即考分的一致性(consistency of test scores)。例如, 我们可以这样来检验测试的信度:使用同样一份试卷, 在两种不同的场合、环境中, 在较短的时间间隔内施与同样的学生,如果测试结果基本吻合,那么证明测试是有信度的。一份试卷的测试结果如果缺乏信度, 就没有使用价值, 同时也减弱了考试的公正性。当然, 要完全消除不一致性也是不可能的, 我们能做的是尽量把影响不一致性的不利因素控制在最低程度, 以便于提高测试信度。
语言测试专家Brown把信度定义为“测试结果的一致或稳定的程度”。换句话说,有信度的试题应在任何时间、任何地点通过测试都能够得到一致的结果。试题的信度可以通过比较两套试题的结果或试题内容来获得, 其结果接近或一致, 说明试题是有信度保证的。教育测试的目的是要衡量某种相对稳定的东西, 我们不苛求一份试题经反复测试之后, 每次结果都绝对一致, 但几次测试结果不应相差太大。例如, 我们用标准、准确的软尺去测量一张桌子的长度, 第一次测量的结果和第二次测量的结果都是九十九公分, 那么, 这两次测量的结果是一致的, 也就可靠。但教育测量的对象是人, 不是物。而人的因素不稳定, 要想完全排除误差几乎不可能。如果把一份试题分成份量和难度相当的两部分, 分别在两天考完。假如某学生第一天得了85 分, 第二天他不一定能得 85 分, 但如果得了83 分, 也能证明这次测试是可靠的。我们不苛求一份试题经反复测试之后, 每次的结果都绝对一致才可靠, 但几次结果不应相差太大。所以教育测试的目的是要衡量某种相对稳定的东西。有公式2. 信度的定义是基于真分数理论的。所谓真分数, 就是没有误差的值, 或者可以说, 真分数是一个人在某一次测验中的大量理论上是无限的相等形式中所得到的平均分数。但是在心理、教育及社会行为测量中,真分数是永远不可能得到的,是假设的,只在理论上存在。
测试信度是通过测试结果的相关性得出的,相关系数越大,信度也就越高。测试信度的相关系数通常介于0 - 1 之间。那么, 对语言测试而言,相关系数多少才可称为高信度? Lado (1961) 认为, “一份好的词汇、语法结构或阅读试卷信度通常在0. 9 - 0. 99 之间; 听力试题通常在0. 8 - 0. 89 之间; 口语考试大约在0. 7 - 0. 79 之间。0. 85 的相关系数对口语考试而言可能是个高信度, 而对于阅读测试却是低信度。”这虽是Lado 个人的看法,但从中不难看出, 一份试卷所测试的语言技能不同对测试信度评估的标准也就不同。目前外语界普遍使用的统计分析软件SPSS(Statistics Package for Social Sciences) 能很快完成测试结果相关性的计算过程。
第二节 信度的种类
信度的种类大致有二: 一是试题的信度 Test reliability ; 二是评分员信度 Scorer or rater reliability。试题信度顾名思义, 指试题本身可靠无误, 即同一份试题在不同的时间测试同一群学生,其结果应大体一致。试题信度受很多因素的影响,最主要的因素为试题选样的广泛性和有效性。一般说来, 试题选样越广越有效, 对学生知识和能力的测量就越可靠。正因如此, 一些测试专家倾向于使用客观性试题, 一份客观性试题能容纳很多分离式题目, 不赞成使用主观性试题, 因为它的题目数相当有限。 按照信度的获取方法 ,信度又可以分为重测信度、复本信度、折半信度、评分员信度等四种。
重复测试法是指用同一份试卷对同一批受试群施考两次, 两次之间有一段间隔时间,两次测试结果的相关系数就是该考试的信度(也称再测信度) 。重复测试法实际上是对受试者信度(examinee reliability) 的测
您可能关注的文档
- 人教版《13.1弹力弹簧测力计》ppt+flash.ppt
- 人眼与视觉2、视觉特性3、颜色4、颜色显色第二章视觉与颜色1人眼与.ppt
- 人际关系与沟通(一).ppt
- 人防工程主体检测实施细则-天津义智人防工程质量检测有限公司.doc
- 什么是创新驱动发展-郑州科技港.ppt
- 什么是教研组文化.doc
- 人脸识别-长沙理工大学.ppt
- 什么是整建反应.doc
- 仁者爱人.ppt
- 从价税.ppt
- 2025年成都市玩偶生产荧光涂鸦互动玩偶开发可行性研究报告.docx
- 2025年成都市海绵生产用于体育馆室外运动场地透水改造可行性研究报告.docx
- 2025年天津市体操鞋企业团建运动应用报告.docx
- 2025年上海市溶洞极限运动(速降)场地开发可行性研究报告.docx
- 2025年上海市涵洞工程施工技术应用可行性研究报告.docx
- 2025年上海市体育场馆设施扎带安全防护可行性研究报告.docx
- 2025年上海市牦牛育肥产业园区建设可行性研究报告.docx
- 2025年旅拍宠物陪伴拍摄项目可行性研究报告.docx
- 2025年上海市进口食品节庆主题快闪店可行性研究报告.docx
- 2025年上海市洗选厂尾矿综合利用产业化可行性研究报告.docx
最近下载
- GB15763.1-2009 建筑用安全玻璃 第1部分:防火玻璃 (2).pdf VIP
- DB5101T 217—2025成都市城市绿化养护技术规程.pdf
- 漫画解读--非煤露天矿山重大事故隐患判定标准.pdf
- 伤口、造口、失禁性皮炎理论考试试题与参考答案.docx VIP
- LNG气化站安装工程施工的方案.doc VIP
- 2023年8月26日全国事业单位联考A类《职业能力倾向测验》真题.pdf VIP
- 跨境电子商务英语 课件 柯可 Unit 1 Overview of Cross-Border E-Commerce、 Unit 2 Main Cross-Border E-Commerce Platforms.pptx
- 2024年辅警招聘《公安工作基本知识》培训考试题库 (附答案).docx VIP
- 低氧对肝脏脂质代谢影响研究.docx VIP
- GB T 34986-2017 产品加速试验方法.doc VIP
文档评论(0)