第二课时独立性检验地基本思想及其初步应用.pptVIP

第二课时独立性检验地基本思想及其初步应用.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二课时独立性检验地基本思想及其初步应用

1、通过频率比较法,图形分析法判断两个分类变量是否有关系。(不精准) (1) ︱ad -bc︱ (2) a/a+b≈c/c+d a+b+c+d b+d a+c 总计 c+d d c x2 a+b b a x1 总计 y2 y1   2、利用独立性检验判断两个分类变量是否有关系。 (1)假设无关 (2)求k值 (3)下结论 判断两分类变量是否有关的方法: 小结: 复习回顾: 1.回归直线的方程: 我们又引入相关指数R2来刻画回归的效果: 残差平方和 总体偏差平方和 当R2越接近于1,说明解释变量和预报变量之间的相关性越强,如果同一个问题,采用不同的回归方法分析,我们可以通过选择R2大的来作为回归模型 相关系数 相关系数的性质: (1)|r|≤1. (2)|r|越接近于1,相关程度越强;|r|越接近于0, 相关程度越弱. 如何描述两个变量之间线性相关关系的强弱? 问题:达到怎样程度,x、y线性相关呢? 它们的相关程度怎样呢? 基本步骤 抽取样本,采集数据 作出散点图 确定类型,求回归方程 残差分析 相关指数 判定拟合程度 理论迁移 例 1993年到2002年中国的国内生产总值(GDP)的数据(单位:亿元)如下: 104790.6 2002 74462.6 1997 97314.8 2001 67884.6 1996 89468.1 2000 58478.1 1995 82067.5 1999 46759.4 1994 78345.2 1998 34634.4 1993 GDP 年份 GDP 年份 (1)作GDP和年份的散点图,根据该图猜想它们之间的关系应是什么? (2)建立年份为解释变量GDP为预报变量的回归模型,并计算残差. (3)根据你得到的模型,预报2003年的GDP,看看你的预报与实际的GDP(117251.9亿元)的误差是多少? (4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由. 0 20000 40000 60000 80000 100000 120000 1992 1994 1996 1998 2000 2002 2004 GDP与年份近似地呈线性关系. -993.791 2002 4638.055 1997 -1277.622 2001 5252.024 1996 -1932.353 2000 3037.493 1995 -2140.984 1999 -1489.238 1994 1328.685 1998 -6422.269 1993 残差 年份 残差 年份 2003年GDP预报值为112976.4,预报与实际相差-4275.5 相关指数R2=0.974,说明年份能够解释97.4%的GDP值变化,所建模型能很好地刻画GDP和年份的关系. 练习某运动员训练次数与运动成绩之间的数据关系如下: 编号 1 2 3 4 5 6 7 8 次数 30 33 35 37 39 44 46 50 成绩 30 34 37 39 42 46 48 51 试预测运动员训练47次以及55次的成绩 编号 1 2 3 4 5 6 7 8 次数 30 33 35 37 39 44 46 50 成绩 30 34 37 39 42 46 48 51 第一步:做散点图 编号 1 2 3 4 5 6 7 8 次数 30 33 35 37 39 44 46 50 成绩 30 34 37 39 42 46 48 51 第二步:求回归方程 编号 1 2 3 4 5 6 7 8 次数 30 33 35 37 39 44 46 50 成绩 30 34 37 39 42 46 48 51 残差 第三步:残差图 -1.24 -0.37 0.55 0.46 1.38 0.17 0.09 -1.08 残差图 编号 1 2 3 4 5 6 7 8 次数 30 33 35 37 39 44 46 50 成绩 30 34 37 39 42 46 48 51 残差 -1.24 -0.37 0.55 0.46 1.38 0.17 0.09 -1.08 第四步:计算相关指数 编号 1 2 3 4 5 6 7 8 次数 30 33 35 37 39 44 46 50 成绩 30 34 37 39 42 46 48 51 残差 -1.24 -0.37 0.55 0.46 1.38 0.17 0.09 -1.08 说明了该运动员的成绩的差异有98.55%是由训练次数引起的,说明了两个变量的相关关系非常强. 第五步:作出预报 由上述分析可知,我们可以用回归方程 一般地,建立回归模型的基本步骤为: 1.确定研究对象 2.画散点图 3.由经验确定回归方程的类型 4.按一定规则估计回归方程中的参数 5. 分析残差图 7. 下结论 6.

文档评论(0)

jiayou118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档