第八讲双变量相关与回归剖析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八讲双变量相关与回归剖析

Soft Computing Lab. 管理学院数学与统计教研室 曹治清 中医药统计学与软件应用 第8讲 双变量相关与回归 第8讲 双变量相关与回归—引言 世界上万事万物是相互联系的,相互联系着的事物(变量)间的关系有确定性关系和非确定性关系。确定性关系既变量间的函数关系,是指一个变量的每个可能取值,另外的变量都有完全确定的值与之对应;如路程速度时间的关系为。非确定性关系是指变量在宏观上存在关系,但并未精确到可以用函数关系来表达,也称随机性关系。在医药研究中,常常要分析变量间的非确定性关系,如糖尿病患者的血糖与胰岛素水平、降糖药剂量与疗效的关系等。本章介绍研究变量间的非确定性关系的统计分析方法——相关(correlation)与回归(regression)。 第一节 直线相关 第一节 直线相关 第一节 直线相关——Pearson相关系数 第一节 直线相关——直线相关分析的步骤 第一节 直线相关——直线相关分析的注意事项 第一节 直线相关——直线相关分析的注意事项 第二节 秩相关 秩相关系数 无量纲,且 。 表示变量和之间的相关程度。 的符号表示相关方向, 称为正相关, 称为负相关。若 的值越接近1,则相关性越强;若 的值越接近0,则相关性越弱;当 称为零相关; 称为完全相关。 第二节 秩相关 第二节 秩相关——秩相关假设检验 第二节 秩相关 【例9-2】 调查正常成年人脉象,记录各年龄组弦脉阳性率,资料见表9-2,试讨论年龄与弦脉阳性率之间是否存在秩相关关系? 第二节 秩相关 第三节 直线回归——引言 “回归”一词最早由英国统计学家弗朗西斯·高尔顿爵士(Francis Galton, 1822-1911,达尔文的表兄弟)和他的学生、现代统计学的奠基者之一卡尔·皮尔逊(Karl·Pearson,1856-1936年)在研究父母身高与其子女身高的遗传问题时提出的。他们研究发现身材高的父亲,他们的孩子也高,但这些孩子平均起来并不像他们的父亲那样高。对于比较矮的父亲情形也类似,他们的孩子比较矮,但这些孩子的平均身高要比他们的父亲的平均身高高。高尔顿和皮尔逊把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他们创立的研究计量变量依存关系的方法称为回归分析。 第三节 直线回归——概念 直线回归(linear regression)又称简单线性回归(simple linear regression),是反映两变量间的线性依存关系,它采用最小二乘法原理找出最能描述变量间非确定性关系的一条直线,此直线为回归直线或经验直线,相应的方程为直线回归方程或经验方程。直线回归分析中两个变量的地位不同,其中一个变量是依赖另一个变量而变化的,因此分别称为因变量(dependent variable)和自变量(independent variable),习惯上分别用y来x表示。直线回归分Ⅰ型回归与Ⅱ型回归两种,y依存于x为Ⅰ型回归,y与x相互依存为Ⅱ型回归。 第三节 直线回归——应用条件 线性回归模型成立需要满足4个前提条件,即线性(linearity)、独立(independency)、正态(normal )和等方差性(equal variance),简记为Line。 第三节 直线回归——应用条件 3. 正态是指因变量值服从正态分布 即要求线性模型的随机误差项ε服从正态分布。如果该条件不成立,在正态分布假设下对总体回归系数的假设检验和可信区间估计的结论均无效。可通过专业知识、对变量进行正态性检验或利用残差分析来考察这一条件是否满足。 第三节 直线回归——应用条件 第三节 直线回归——一般步骤 1.绘制散点图,看有无直线趋势,有无异常点 有直线趋势无异常点方可考虑直线回归分析,否则,查找异常点的缘故,剔除过失误差所致的异常点,保留客观存在的异常点进行曲线回归。 2.考察资料是否满足直线回归分析的条件 除线性外,可通过残差分析结果来考察资料是否满足其应用条件。 3.求回归系数b和常数项a 4.写出回归方程, 第三节 直线回归——一般步骤 5.对回归方程和回归系数进行假设检验 6.绘制回归直线 7.残差分析 8.统计预测,有必要时还可进行统计控制 9.回归分析效果评价 第三节 直线回归——直线回归模型 若随机变量y和确定性变量x(其值是可以精确测量或控制的)存在直线依存关系,则可设其回归模型为: 第三节 直线回归——直线回归模型 实际中仅能获取有限的样本数据,用直线方程建立关于的近似表达式: 第三节 直线回归——直线回归方程的建立 第三节 直线回归——直线回归模型 第三节 直线回归——直线回

文档评论(0)

1520520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档