第十二讲 多重线性回归概念.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Soft Computing Lab. 管理学院数学与统计教研室 曹治清 中医药统计学与软件应用 第10讲 非参数检验 第11讲 多重线性回归—引言 在医药研究中,应变量的变化往往受到多个因素的影响,此时就需要用多重线性回归(Multiple Linear Regression),多重线性回归是直线回归的扩展。例如,人的体重与身高、胸围有关;人的心率与年龄、体重、肺活量有关。因此,采用两个或多个影响因素作为自变量(Xi)来解释应变量(Y)的变化,建立最优组合模型来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。 三、多重线性回归分析的步骤 资料不满足其条件时,常用的处理方法有:修改模型或者采用曲线拟合;变量变换,常用的变量变换有对数变换、平方根变换、倒数变换等。变量变换对自变量或(和)应变量均适宜;如果方差不齐,可采用加权最小二乘法估计偏回归系数。 *管理学院数学与统计教研室 杨胤清 曹治清 成都中医药大学管理学院 数学与统计教研室 czq9771@163.com 概述 多重线性回归的应用以及注意事项 多重线性回归的电脑实验 第一节 多重线性回归 一、多重线性回归模型 Y=β0+β1X1+β2X2+…+βmXm+e 二、多重线性回归的基本条件 多重线性回归模型的应用条件同直线回归,即线性(linearity)、独立性(indepen-dency)、正态性和方差齐性(normal distribution and equal variance)等条件,简记LINE。还要注意个自变量间不能存在多重共线性。 四、多重共线性问题 如果一些自变量之间存在较强的线性关系,称多重共线性。判断多重共线有相关系数、容忍度、方差膨胀因子等指标。 一般来说,相关系数r0.8的变量可能存在共线问题,r0.9的变量存在共线。 容忍度=1-R2,愈小说明共线问题愈严重,如果某个自变量的容忍度0.1,共线问题严重。 方差膨胀因子 = 容忍度的倒数,愈大说明共线问题愈严重。 消除多重共线性的方法有多种,如岭回归、主成分回归等。 五、多重回归的样本含量 只要例数n多于自变量个数m即可,一般要求n为m的5倍以上。 六、多重回归的检验 多元线性回归方程的假设检验:①对整个方程的综合检验,即对回归方程的线性假设检验;②对每一个自变量的检验,即对每个偏回归系数的假设检验。 ⑴ 回归方程的方差分析 剩余标准差 剩余标准差的平方是残差的方差,又称均方误差,记为MSE,其值越小越好 (2) 偏回归系数的假设检验 分别考察每一个自变量 xi 与应变量 Y 是否都有直线回归关系 R2=SS回 /SS总 校正决定系数是衡量方程好坏的常用指标之一 七、决定系数 八、标准化偏回归系数 九、残差分析 (1)分析因素的相对重要性,找出对因变量最大的关键因素。 (2)同时调整多个混杂因素的作用(类似多元协方差分析调整多个混杂因素的作用)。 (3)估计与预测,用较易测量的多个自变量来估计难以测得应变量总体均数μY或预测个体Y值。 (4)多重回归分析是进一步学习logistic回归、判别分析、 主成分分析、 因子分析等多元统计分析方法的基础。 十一、筛选自变量方法 十、多元回归分析的应用 (1)全局择优法:m 个自变量的不同组合共有 2m-1 种,分别建立回归方程进行比较后择优。择优的准则有多种,准则不同,筛选的结果可能不同。如果用最大校正决定系数准则,则挑选校正决定系数R2a最大者来获得“最优子集”的回归方程。SPSS为Enter法。 (2)逐步选择法: 备选自变量较多时,全局择优的计算量非常大, 用逐步回归法选择可减少计算量。常用逐步(Stepwise)、向前(Forward)、向后(Backward)法。向后法考虑了自变量的组合作用,但变量数不能太多。3种逐步回归方法选中的自变量不一定相同。 逐步回归得到只是局部最优,不一定是全局最优回归方程。 将自变量的交互项引入方程进行检验分析。 十二、自变量间交互作用的分析 【例17-1】 大白鼠作受试对象,分析乌头碱不同注射速度x1、常咯啉的不同剂量x2,大鼠体重 x3与应变量延缓心律失常发生的时间Y的关系。 21.9 22.7 16.8 23.2 18.6 14.5

文档评论(0)

1112111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档