- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五节 多重线性回归 有学者认为血清中低密度脂蛋白增高,是引起动脉硬化的一个重要原因。现测量了40名被怀疑患有动脉硬化的就诊患者的载脂蛋白AⅠ、载脂蛋白B、载脂蛋白E、载脂蛋白C、低密度脂蛋白的含量,资料如下表所示,请对此作分析。 表1 40名就诊患者血清中载脂蛋白的测量结果(单位:mg/dl) 表2 27名糖尿病人的血糖及有关变量的测量结果 1.人的体重与身高、胸围有关 2.人的心率与年龄、体重、肺活量有关 3.人的血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史等有关 4.射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径与辐射的温度、照射的时间有关 … 表3 多元回归分析数据格式 多元线性回归:简称为多元回归,分析一个应变量与多个自变量间的线性关系。 一、多元线性回归模型 一般形式为: 多元线性回归模型的应用条件: 1.线性趋势:Y与Xi间具有线性关系 2.独立性:应变量Y的取值相互独立 3.正态性:对任意一组自变量取值,因变量Y服从正态分布 4.方差齐性:对任意一组自变量取值,因变量y的方差相同 后两个条件等价于:残差ε服从均数为0、方差为σ2的正态分布 多元线性回归的分析步骤: 1.根据样本数据求得模型参数的估计值,得到应变量与自变量数量关系的表达式: 多元线性回归方程的建立: 利用最小二乘法原理估计模型的参数: (使残差平方和最小) 表2 27名糖尿病人的血糖及有关变量的测量结果 各变量的离差矩阵 4阶线性方程组 建立多元回归方程 SPSS的结果 方程的求解过程复杂,可借助于SPSS、SAS等统计软件来完成 SPSS:Analyze→Regression→Linear regression →dependent:Y independent:x1-x5 OK 二、多元回归方程的假设检验 回归方程是否成立? 各偏回归系数是否等于0? 方差分析法: (所有回归系数均为0) 方差分析法、t检验法 方差分析法: 各偏回归平方和SS(Xi)及残差的计算 偏回归平方和SS回(Xj),其值越大说明相应的自变量越重要。 m-1个自变量对Y的回归平方和由重新建立的新方程得到,而不是简单的在原方程的基础上把bjXj剔除后计算的。 表2 27名糖尿病人的血糖及有关变量的测量结果 实例计算 t 检验 t 检验 对于同一组资料,不同自变量的t值间可以互相比较,t的绝对值越大,说明该自变量对Y的回归所起的作用越大。 3.标准化回归系数 在回归模型中,各自变量的测量单位不同,若单从各偏回归系数的绝对值大小比较是不准确的。 应对各数据进行标准化后求得的回归方程即标准化回归方程,其相应的回归系数即标准化回归系数。 数据标准化,将原始数据减去相应变量的均数后再除以该变量的标准差 3.标准化回归系数 标准化回归系数和回归系数的关系: SPSS的结果 4.复相关系数 复相关系数:multiple correlation coefficient 衡量因变量Y与回归方程内所有自变量线性组合间相关 关系的密切程度,也即Y与 之间的相关。R其值在0与1 之间 R2称为决定系数表明回归平方和在总平方和中所占的比重。R2越接近于1,说明引入方程的自变量与因变量的相关程度越高,Xi与y的回归效果越好。 R2受自变量个数的影响,由此又提出校正决定系数,既反映模型的拟合优度,又同时考虑了模型中的自变量个数。 第二节 自变量的选择 选择最优回归方程的方法 1.最优回归方程 : 1)对y的作用有统计学意义的自变量,全部选入回归方程。 2)对y的作用没有统计学意义的自变量,一个也不引入回归方程。 方法: 1)最优子集回归法:又称全局择优法,求出所有可能的回归模型(共有2m-1个)选取最优者 2)向后剔除法(backward selection) 3)向前引入法(forward selection) 4)逐步回归法(stepwise regression) 一、全局择优法 (一)校正决定系数(Adjusted determination coefficient) (二) Cp准则的计算公式 应用以上准则如何选择模型? 所有回归方程的R2c和CP统计量的值 全局择优法的局限性 二、逐步选择法 (一)前进法 (二)后退法 (三)逐步回归法 逐步回归法 自变量回归平方和最大的Xi首先进入方程,在Xi进入方程的基础上计算其余m-1个自变量分别进入回归方程时的偏回归平方和,其中最大者记为SSj,对Xj进行检验,若有意义则进入方程,并重新对Xi进行检验。若Xi退化为无意义,则剔除Xi,同时再对Xj进行检验。若Xj依然有意义则继续选择下一个偏回归平方和最大
有哪些信誉好的足球投注网站
文档评论(0)