统计学(第8版) 何晓群-(09)第9章 分类数据分析.pptxVIP

统计学(第8版) 何晓群-(09)第9章 分类数据分析.pptx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
作者:贾俊平2023/4/18 2023/4/18统 计 学 (教学用-ppt)首届全国教材建设奖全国优秀教材(高等教育类)“十二五”普通高等教育本科国家级规划教材国家统计局优秀统计教材21世纪统计学系列教材 贾俊平2023/4/18?第 9 章 分类数据分析 导 读1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。1985年,泰坦尼克号的沉船遗骸被发现。美国探险家洛维特在船舱里看见了一幅画,102岁高龄的罗丝声称她就是画中的少女。罗丝开始叙述她当年的故事:1912年4月10日,被称为“世界工业史上的奇迹”的泰坦尼克号从英国的南安普敦出发驶往美国纽约。富家少女罗丝与母亲及未婚夫卡尔一道上船,另一边,不羁的少年画家杰克靠在码头上的一场赌博赢到了船票。罗丝不愿嫁给卡尔,打算投海自尽,被杰克抱住。很快,美丽活泼的罗丝与英俊开朗的杰克相爱了。然而悲剧发生了,泰坦尼克号与冰山相撞。杰克把生存的机会让给了爱人罗丝,自己则在海中被冻死。老态龙钟的罗丝把那串价值连城的珠宝沉入海底,让它陪着杰克和这段爱情长眠海底。我们后来看到的电影《泰坦尼克号》就是根据罗丝的回忆拍摄的。据记载,当时船上有1 316名乘客和892名船员,共2 208人,事故发生后幸存718人,约2/3的人在海难中丧生。2 208人中,按性别划分,男性1 738人,女性470人;按年龄划分,成年人2 099人,儿童109人;按所在舱位划分,一等舱325人,二等舱285人,三等舱706人,船员舱892人。在幸存的718人中,按性别划分,男性374人,女性344人;按年龄划分,成年人661人,儿童57人;按所在舱位划分,一等舱203人,二等舱118人,三等舱178人,船员舱219人。以上都是分类数据。数据是枯燥的,但讲述的问题却是鲜活的。死亡与性别是否有关?与年龄是否有关?与所在舱位是否有关?如何解释这些关系?当时人们的价值观念和对待死亡的态度有什么联系?通过本章的学习,可以掌握对定类数据进行分析的方法 泰坦尼克号的死亡记录告诉了我们什么 ?分类数据分类变量的结果表现为类别例如:性别 (男, 女)各类别用符号或数字代码来测度使用分类或顺序尺度你吸烟吗? 1.是;2.否你赞成还是反对这一改革方案?1.赞成;2.反对对分类数据的描述和分析通常使用列联表可使用???检验 分类数据与卡方统计量? 9.2 拟合优度检验【例9.1】1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有共2208人,其中男性1738人,女性470人。海难发生后,幸存者为718人,其中男性374人,女性344人,以的显著性水平检验存活状况与性别是否有关 拟合优度检验——例题分析解:要回答观察频数与期望频数是否一致,检验如下假设: H0:观察频数与期望频数一致 H1:观察频数与期望频数不一致自由度的计算为df=R-1,R为分类变量类型的个数。在本例中,分类变量是性别,有男女两个类别,故R=2,于是自由度df=2-1=1,经查分布表, ??(0.1)(1)=2.706,故拒绝H0,说明存活状况与性别显著相关 9.3 列联分析:独立性检验由两个以上的变量交叉分类的频数分布表行变量的类别用 r 表示, ri 表示第 i 个类别列变量的类别用 c 表示, cj 表示第 j 个类别每种组合的观察频数用 fij 表示表中列出了行变量和列变量的所有可能的组合,所以称为列联表一个 r 行 c 列的列联表称为 r ? c 列联表 列联表列(cj)合计j =1j = 2…i =1f11f12…r1i = 2f21f22…r2:::::合计c1c2…n 9.3 列联分析:独立性检验【例9.2】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如表9-3所示,要求检验各个地区和原料质量之间是否存在依赖关系? (? ?0.05) 独立性检验——例题分析解:H0:地区和原料等级之间是独立的(不存在依赖关系) H1:地区和原料等级之间不独立 (存在依赖关系)?? 0.05(4)=9.488故拒绝H0,接受H1 ,即地区和原料等级之间存在依赖关系,原料的质量受地区的影响 9.3 列联分析:独立性检验 独立性检验——例题分析解:SPSS输出 9.4 列联表中的相关测量品质相关对品质数据(分类和顺序数据)之间相关程度的测度列联表变量的相关属于品质相关列联表相关测量的统计量主要有? 相关系数列联相关系数V 相关系数?测度2?2列联表中数据相关程度对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为? 9.4 列联表中的相关测量?列联表中每个单元格的期望频数分别为因素Y因素 X合计x1x2y1aba

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档