- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不同IRT模型在生活取向测验修订版中的适用性比较
不同 IRT 模型在生活取向测验修订版中的适用性比较 邓稳根 1, 戴海琦 2 (1. 赣南师范学院教育科学学院, 江西 赣州 341001; 2. 江西师范大学心理学院, 江西 南昌 330022) 摘要: 为比较拓广等级展开模型、等级反应模型和拓广分部评分模型在生活取向测验修订版上的模型-数据 拟合差异及项目参数估计值和标准误差的差异, 选取 2 个学校的大一新生(3 864 人)进行分析, 采用单项目、 两项目对和三项目组校正 χ 2 / df 检验 3 个模型的模型-数据的拟合, 采用边际极大似然方法估计项目参数值 及其标准误差. 结果发现拓广等级展开模型的模型-数据拟合优于其它 2 个模型, 但该模型的项目参数估计值 及其标准误差显得并不是很合理, 提示需要对该模型开展更深入的研究. 关键词: 拓广等级展开模型; 中图分类号: TP 18 等级反应模型; 拓广分部评分模型; 模型-数据拟合; 边际极大似然方法 文献标识码: A Roberts 等的拓广等级展开模型(GGUM)[4]等. 在上述 3 个模型中, GRM 和 GPCM 与经典测验理论的真分数模 型对项目反应过程所作的假定相类似, 即都假定项目 反应过程是一种优势过程, 而 GGUM 则是建立在项目 反应的理想点过程基础之上. 尽管经典测验理论的真分数模型以及 GRM 和 GPCM 是和项目反应的优势过程相一致, 违背了 LOT-R 的真实项目反应过程, 但一些研究者将它们 应用于因素分析方法编制的人格测验时, 在一些量 表上仍获得较好的模型-数据拟合. 这主要是因为尽 管这些人格量表的项目反应过程是理想点过程, 但 由于采用因素分析方法来筛选项目, 使得测验基本 上都由较为极端的项目组成, 这些项目的反应曲线 只在非常高的特质水平处才发生折叠, 而处于这个 水平处的反应者在样本中所占的比例非常小, 所以 对模型-数据拟合指数产生较小的影响. 根据已有的对 LOT-R 所做的对应分析结果, LOT-R 上的项目, 特别是正性词项目的极端性较低[1], 因而采用 GRM 和 GPCM 进行分析时可能产生较大的 模型-数据不拟合; 而 GGUM 由于是建立在项目反应的 理想点过程基础之上, 与 LOT-R 的真实项目反应过程 相一致, 因而可能更好地拟合 LOT-R 上的项目反应. 本调查将验证 GGUM 相对于 GRM 和 GPCM 更 拟合 LOT-R 的数据, 并考查边际极大似然(MML)方 法在估计 GGUM 的项目位置参数和反应类别阈限 引言 0 虽然有研究者验证了生活取向测验(LOT-R)的 项目反应过程符合理想点过程, 对应分析在量表化 个人和项目方面显得比主成分分析更为合理[1], 但 是对应分析对个体和项目的标定并不是建立在正式 的测量理论基础之上, 因此需要更正式的测量模型 对 LOT-R 上的反应数据进行分析. 目前在人格测量 领域中使用较为广泛的测量模型是经典测验理论的 真分数模型和项目反应理论模型. 经典测验理论(CTT)的真分数模型对反应数据 的分析存在许多局限, 如个体的分数和项目的位置 并不是建立在同一量尺上, 个体和项目的参数估计值 都高度依赖于所选择的样本等. 随着测量实践的发展, 经典测验理论逐渐被新的测量理论—— 项目反应理论 所取代. 项目反应理论(IRT)直接从反应过程出发, 建 立模型对个体在项目上的反应进行分析. 相对于经典 测验理论, 项目反应理论提供了更多优良的特性. 由于目前大多数 IRT 模型是从认知评估领域和态 度测量领域中发展起来的. 因此大多数人格评估研究 者直接使用认知评估领域和态度测量领域中的 IRT 模 型来分析人格测量数据. 人格评估领域使用较多的适 用于多级反应数据的模型有 Samejima 的等级反应模 型 (GRM)[2] 、 Muraki 的分部 评分模型 (GPCM)[3] 和 收稿日期: 2010-09-22 基金项目: 江西省高校人文社会科学研究规划基金 (XL1001)资助项目. 参数时可能产生的一些问题. 2 结果及分析 1 研究方法 2.1 模型-数据拟合 2.1.1 GGUM 的模型-数据拟合结果 表 1 呈现了 GGUM 模型单项目、两项目对和三项目组的校正 χ2/df 值. 表 1 中第 1 行的数值代表校正的χ2/df 值处 于该区间, 如 23 表示校正的χ2/df 大于 2 小于 3, 第 2 行至最后一行的整数表示校正的χ2/df 处于某个区 间的单项目或两项目对或三项目组的个数. 如第 2 行中的 2 表示有 2 个单项目的校正χ2/df 大于 1 小于 2. 1.1
文档评论(0)