9、列联表分析.pptVIP

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
9、列联表分析

第九章 列联表分析 第九章 列联表分析 第一节 列联表概述 第二节 ?? 分布与 ?? 检验 第三节 列联表的相关性测量 学习目标 1. 解释列联表 做 c2 检验 一致性检验 独立性检验 3. 列联表相关程度(各相关系数的计算) 数据的类型与列联分析 品质数据(定类定序数据) 品质随机变量一般表现为类别: 例如:性别 (男, 女);文化程度(小学、初中、高中、大学等) 各类别可以用符号或数字(1,2,…)来标识; 属于定类或定序尺度: 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对;3.不清楚 对品质数据的描述和分析通常使用列联表; 一般使用???检验。 一、列联表的构造 列联表 由两个(或以上)变量交叉分类的频数分布表 行变量类别数用 r 表示, ri 表示第 i 个类别 列变量类别数用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能组合,所以称为列联表 一个 r 行 c 列的列联表简称为 r ? c 列联表 最简单的2 ? ? 列联表 列联表的构造 (r ? c 列联表的一般表示) 列联表实例(2×4) 二、列联表的分布 观察值的分布 边缘分布 行边缘分布 每行各观察值合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人 列边缘分布 每列各观察值合计数的分布 例如,四个分公司接受调查的人数分别为100人,120人,90人,110人 条件分布与条件频数 变量 X 条件下变量 Y 的分布,或变量 Y 条件下变量 X 的分布 每个具体的观察值称为条件频数 观察值(次数)的分布 (在赞成方案的279人中三分公司有57人) 百分比的分布 条件频数反映了数据的分布,但不适合进行对比 为了进行比较,可以计算相应的百分比,称为百分比分布 行百分比:行的每一个观察频数除以相应的行合计数(fij / ri) 列百分比:列的每一个观察频数除以相应的列合计数( fij / cj ) 总百分比:每一个观察值除以观察值的总个数( fij / n ) 百分比分布 (实例) 期望频数的分布 假定行变量和列变量是独立的 一个实际频数 fij 的期望频数 eij ,是总频数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即行边缘与列边缘相乘除以总个案数(是由两随机变量相互独立的充要条件推出) 期望频数的分布(例子) 期望频数的分布 根据上述公式计算的前例的期望频数 关于 ?? 统计量 关于?? 统计量 用于检验列联表中变量之间是否存在显著性差异,或者用于检验变量之间是否独立 计算公式为 ?? 统计量算例 ?? 检验 品质数据的假设检验 一致性检验 检验列联表中目标变量之间是否存在显著性差异 检验的步骤为 提出假设 H0:P1 = P2 = … = Pj (目标变量的各个比例一致) H1:P1 , P2 , … , Pj 不全相等 (各个比例不一致) 计算检验的统计量 一致性检验(例子) 提出假设 H0:P1 = P2 = P2 = P4 (赞成比例一致) H1:P1 , P2 , P3 , P4不全相等 (赞成比例不一致) 计算检验的统计量 独立性检验 检验列联表中的行变量与列变量之间是否独立 检验的步骤为 提出假设 H0:行变量与列变量相互独立 H1:行变量与列变量不相互独立 计算检验的统计量 独立性检验 (实例) 独立性检验例子 提出假设 H0:地区与原料等级之间独立 H1:地区与原料等级之间不独立 计算检验的统计量 列联表的相关性测量 品质相关 对品质数据(定类和定序数据)之间相关程度的测度 列联表变量的相关属于品质相关 列联表相关测量系数主要有: ? 相关系数 列联相关系数 V 相关系数 ? 相关系数 测度 2?2列联表中数据相关程度的一个量 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 ? 相关系数的原理 一个简化的 2?2 列联表 ? 相关系数的原理(续1) 列联表中每个单元格的期望频数分别为 ? 相关系数的原理(续2) 将??入? 相关系数的计算公式得 列联相关系数 用于测量大于2?2列联表中数据的相关程度 计算公式为 V 相关系数 计算公式为 ?、C、V 的比较 同一个列联表,?、C、V 的结果会不同 不同的列联表,?、C、V 的结果也不同 在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数 列联表的相关性测量 (一个实例) 列联表中的相关测量 (一个实例) 本章小结 解释列联表 计算期望频数 进行 c2 检验 一致性检验 独立性检验 对

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档