- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《简论计算机自适应语言测试的工作机制 》.pdf
维普资讯 语言教学与研究2003年第 3期 简论计算机 自适应语言测试的工作机制 张 宝 钧 提要 本文分别从题项反应理论(IRT)与计算机 自适应语言测试(CALT)的关系、CALT 的题库建设等方面探讨 了CALT的工作机理及其优缺点,指出在大规模的语言测试 中采用 CALT是大势所趋,我 国应及早开展对 CALT的研究与开发。 关键词 计算机 自适应语言测试 ;题项反应理论;题库 一 引言 计算机 自适应测试 (CAT,Computer-adaptedTest)是网络计算机技术和教育测量理论相 结合的产物,在各种资格考试中已得到了广泛的应用。语言测试领域对计算机 自适应性测试 的开发和效度研究也已经开始,其中最有影响的要数托福考试 (TOEFL)。它于 1998年 7月 就在美国以及少数其他国家进行了机考,2001年在全世界普及。国外其他的机考还包括伯明 翰大学开发的法语、德语 、西班牙语以及英语作为第二语言的分级考试,佐治亚州立大学开发 的英语作为第二语言的听力考试,以及蒙特利尔大学开发的法语计算机 自适应性水平测试 (CAPT)等。目前国内的计算机 自适应考试研究刚刚起步,对这方面的论述及研究较少,本文 试图就计算机 自适应考试的工作机理和相关的问题进行初步的探讨。 二 简要回顾 早在 1968年,Green(1970)就预测说 “测试必将被计算机征服”。20年后,Tung(1986: 13)宣称,“由于心理测量理论的发展和计算机在教育系统中的使用越来越普及,使用高速计算 机对知识和技能进行准确、有效和个人化测量的时代 已经初露曙光”。从 Green的预测到 Tung这二十年间,正是计算机在教育测量领域应用的起步阶段。1975年,第一次专门探讨计 算机 自适应考试的大会在美国海军研究院和美国内务委员会的赞助下召开,之后又分别于 1977年和 1979年在 明尼苏达大学召开了两次 (Weiss1983)。这三次大会 的召开,极大地促进 了计算机 自适应测试技术、机考对考生的影响,促进了计算机 自适应考试的效度等理论和应用 方面的研究,使它的应用范围越来越广,技术也 日臻完善和成熟。 在这一阶段,由于计算机强大的数据处理能力,使得先于其出现的题项反应理论 (IRT,I— ternResponseTheory,又称潜能理论LatentTraitTheory)的实际应用有了物质基础,正是二 者的结合才诞生了真正意义上的计算机 自适应考试,进而为心理测量开辟了一块新天地,并对 * 本文的写作得到了国家基金委的资助。 18 维普资讯 以后相关领域 的测验产生了重大的影响。 三 计算机 自适应测试与题项反应理论 计算机 自适应测试又被称为个性化的考试。与传统的纸笔考试不同的是,它使用计算机 介质,键盘操作,这一点和计算机辅助测试 (Computer-AssistedTest)相同,但在本质上却大相 径庭。 “传统考试中,每个考生,不论其能力高低,都必须做同一套试题,而 自适应考试则可以 根据考生的实际表现挑选 出适合考生能力的试题,这与传统考试形成鲜明的对 比。”(Canale andBaker1984)计算机 自适应测试的题项不是直接和线性的,即难易程度不是事先定好的, 而是根据受试在前一个题项中所表现出来的能力或潜在能力而有针对性地选择出来的。换句 话说,计算机随时都在对试题进行在线调整,以保证挑选 出能最大限度测量 出受试能力的题 项。这就像量体裁衣一样 ,计算机在为受试 “量身定做”考题,并按照这一程序,不断地对受试 的能力做出判断并选择出测量这种能力的最佳题项,直到对受试的潜在能力做出全面的测量 为止 。因此,如果考生在最初 的五个题项上表现欠佳,计算机会 自动挑选更容易的试题 。这很 像跨栏比赛,假如我们的跨栏高度从 10cm依次增加到 100cm,如果赛手比赛中把前五个栏都 碰倒了,就没有必要让他再往前跑,把后面的五个栏也踢倒 。同样,如果有些选手毫不费力地 跨过第五个栏,那么,从他们可以跨过 50
文档评论(0)