不同IRT模型在生活取向测验修订版中的适用性比较.docVIP

下载本文档

20
0
约1.19万字
约 6页
2017-12-18 发布于江西
举报
版权申诉

不同IRT模型在生活取向测验修订版中的适用性比较.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

不同IRT模型在生活取向测验修订版中的适用性比较

不同 IRT 模型在生活取向测验修订版中的适用性比较邓稳根 1, 戴海琦 2 (1. 赣南师范学院教育科学学院, 江西赣州 341001; 2. 江西师范大学心理学院, 江西南昌 330022) 摘要: 为比较拓广等级展开模型、等级反应模型和拓广分部评分模型在生活取向测验修订版上的模型-数据拟合差异及项目参数估计值和标准误差的差异, 选取 2 个学校的大一新生(3 864 人)进行分析, 采用单项目、两项目对和三项目组校正 χ 2 / df 检验 3 个模型的模型-数据的拟合, 采用边际极大似然方法估计项目参数值及其标准误差. 结果发现拓广等级展开模型的模型-数据拟合优于其它 2 个模型, 但该模型的项目参数估计值及其标准误差显得并不是很合理, 提示需要对该模型开展更深入的研究. 关键词: 拓广等级展开模型; 中图分类号: TP 18 等级反应模型; 拓广分部评分模型; 模型-数据拟合; 边际极大似然方法文献标识码: A Roberts 等的拓广等级展开模型(GGUM)[4]等. 在上述 3 个模型中, GRM 和 GPCM 与经典测验理论的真分数模型对项目反应过程所作的假定相类似, 即都假定项目反应过程是一种优势过程, 而 GGUM 则是建立在项目反应的理想点过程基础之上. 尽管经典测验理论的真分数模型以及 GRM 和 GPCM 是和项目反应的优势过程相一致, 违背了 LOT-R 的真实项目反应过程, 但一些研究者将它们应用于因素分析方法编制的人格测验时, 在一些量表上仍获得较好的模型-数据拟合. 这主要是因为尽管这些人格量表的项目反应过程是理想点过程, 但由于采用因素分析方法来筛选项目, 使得测验基本上都由较为极端的项目组成, 这些项目的反应曲线只在非常高的特质水平处才发生折叠, 而处于这个水平处的反应者在样本中所占的比例非常小, 所以对模型-数据拟合指数产生较小的影响. 根据已有的对 LOT-R 所做的对应分析结果, LOT-R 上的项目, 特别是正性词项目的极端性较低[1], 因而采用 GRM 和 GPCM 进行分析时可能产生较大的模型-数据不拟合; 而 GGUM 由于是建立在项目反应的理想点过程基础之上, 与 LOT-R 的真实项目反应过程相一致, 因而可能更好地拟合 LOT-R 上的项目反应. 本调查将验证 GGUM 相对于 GRM 和 GPCM 更拟合 LOT-R 的数据, 并考查边际极大似然(MML)方法在估计 GGUM 的项目位置参数和反应类别阈限引言 0 虽然有研究者验证了生活取向测验(LOT-R)的项目反应过程符合理想点过程, 对应分析在量表化个人和项目方面显得比主成分分析更为合理[1], 但是对应分析对个体和项目的标定并不是建立在正式的测量理论基础之上, 因此需要更正式的测量模型对 LOT-R 上的反应数据进行分析. 目前在人格测量领域中使用较为广泛的测量模型是经典测验理论的真分数模型和项目反应理论模型. 经典测验理论(CTT)的真分数模型对反应数据的分析存在许多局限, 如个体的分数和项目的位置并不是建立在同一量尺上, 个体和项目的参数估计值都高度依赖于所选择的样本等. 随着测量实践的发展, 经典测验理论逐渐被新的测量理论—— 项目反应理论所取代. 项目反应理论(IRT)直接从反应过程出发, 建立模型对个体在项目上的反应进行分析. 相对于经典测验理论, 项目反应理论提供了更多优良的特性. 由于目前大多数 IRT 模型是从认知评估领域和态度测量领域中发展起来的. 因此大多数人格评估研究者直接使用认知评估领域和态度测量领域中的 IRT 模型来分析人格测量数据. 人格评估领域使用较多的适用于多级反应数据的模型有 Samejima 的等级反应模型 (GRM)[2] 、 Muraki 的分部评分模型 (GPCM)[3] 和收稿日期: 2010-09-22 基金项目: 江西省高校人文社会科学研究规划基金 (XL1001)资助项目. 参数时可能产生的一些问题. 2 结果及分析 1 研究方法 2.1 模型-数据拟合 2.1.1 GGUM 的模型-数据拟合结果表 1 呈现了 GGUM 模型单项目、两项目对和三项目组的校正 χ2/df 值. 表 1 中第 1 行的数值代表校正的χ2/df 值处于该区间, 如 23 表示校正的χ2/df 大于 2 小于 3, 第 2 行至最后一行的整数表示校正的χ2/df 处于某个区间的单项目或两项目对或三项目组的个数. 如第 2 行中的 2 表示有 2 个单项目的校正χ2/df 大于 1 小于 2. 1.1