第十一章线性相关与回归.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章线性相关与回归ppt课件

第十一章 线性相关与回归 变量间的关系一般来说,可分为两种: 1.确定性关系:即“函数关系”,如 或 2.非确定性关系: 如(1)污染程度与污染源距离 (2)舒张压与年龄 (3)人的身高与体重 (4)药物剂量与动物死亡率 回归与相关就是研究此类问题的统计方法 第一节 直线回归 一、“回归”的由来 F.Galton K.Pearson 每对夫妇的平均身高(英寸) 成年儿子的身高(英寸) 二、线性回归基本概念 当一个变量X改变时,另一个变量Y也 相应地改变,此时称X为自变量(independent variable), Y为应变量(dependentvariable)。 自变量X:可随机变动亦可人为取值。 因(应)变量Y:被视为依赖于X而变化的 反应变量。在X的数值确定时按某种规律 随机变动。 可见,各散点通常并不会恰好在一条直线上,但反映出两变量的线性趋势。我们可以假定,相对于X各个取值, 相应的Y的总体均数位于一条直线上,与X之间数量上的线性依存关系就称为线性回归。这样我们就可以用某个恰当的线性回归方程(linear regression equation)来描述Y的总体均数依赖于X的数值变化: 以 表示 的一个样本估计值,即X确定时Y的样本均数,样本回归方程的一般表达式可写为: 三、直线回归方程的建立 1.一般表达式: 自变量 当 取某一定值时,因变量 的 平均估计值。 斜率(回归系数):当 每改变一个单位时, 的平均改变量。 2.求 和 (依据最小二乘法(method of least square)原理 ),即 最小。 四、直线回归方程图示: 在自变量X的实测全距范围内任取相距较远且易读的两个X值,代入回归方程式,求出两个 ,两点连一直线即可。 五、线性回归的统计推断 (一)总体回归系数的估计与假设检验 1.总体回归系数的区间估计: 其中 为样本回归系数的标准误,反映样 本回归系数与总体回归系数之间的抽 样误差。 2.回归系数的假设检验 (1)方差分析 SS总 = SS回归 + SS剩余 SS总 SS回归= SS回归表示在Y总的变异中,可以用X与Y的线性关系引起Y变异来解释的部分。 SS剩余= = SS总 - SS回归 SS剩余表示除X对Y的线性影响之外的一切其它随机因素对Y的影响。 这三个平方和的自由度依次分别为: ν总=n-1, ν回归=1, ν剩余=n-2。 具体分析步骤: 建立假设检验 计算检验统计量 查附表12(P274)F界值表并作结论: 2. t 检验 (二)应变量条件均数 的区间估计 亦可用 表示,是总体中当x为某 定值x0的条件下,y 的条件均数 。 当把x0代入回归方程求得其点估计值 (二)个体 值的容许区间估计 所谓个体 值的容许区间是指总体中X 为某定值x0时,个体 值的波动范围。 其标准差为: 六、线性回归方程应用: 1.描述X和Y之间依存变化的数量关系 2.利用回归方程进行预测预报 3.用容易测量的指标估计不易测量的指标。 4.利用回归方程获得精度更高的医学参考值范围 5.利用回归方程进行统计控制 七、线性回归分析中应注意的问题 1.作回归分析一定要有实际意义 2.回归分析之前首先应绘制散点图 异常点:是指偏离既定模型的数据点 (即y空间的异常点)。 高杠杆点:是指远离数据主体的点(即x空间的异常点)。 强影响点是指对统计推断影响特别大 的点。 异常点和高杠杆点都可能是强影响点。 处理办法: (1)剔除 (2)在此点

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档