多元线性回归logistic回归.PPTVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元线性回归logistic回归

概念 多因素分析是同时对观察对象的两个或两个以上的变量进行分析。 常用的统计分析方法有: 多元线性回归、Logistic回归、COX比例风险回归模型、因子分析、主成分分析,等。 (1)因素筛选:(因素分析) 例如影响高血压的诸多因素中: 1)哪些是主要因素? 2)各因素的作用大小? (2)提高回归方程的估计精度 多元回归比只有一个自变量的简单直线回归更能缩小应变量Y对其估计值的离差,在预测和统计控制方面应用的效果更好。 (3)控制混杂因素 由上表得到如下多元线性回归方程: 2、回归方程的假设检验——F检验 对新建立的回归方程进行检验 对新方程的偏回归系数进行检验 1、确定系数(R2): 3、校正确定系数(adjusted R-square,R2a ) 越大越优。 R2a不会随无意义的自变量增加而增大。 是衡量方程优劣的常用指标。 校正确定系数的计算: 四、各自变量的评价 2、标准化偏回归系数(standardized partial regression coefficient) 消除测量单位影响后的偏回归系数——标准化偏回归系数。 意义: bj —— X的偏回归系数 Sj——为自变量的标准差 SY ——为应变量的标准差 五、自变量的筛选 基本思路:尽可能将回归效果显著的自变量选入方程中,作用不显著的自变量排除在外。 (1)全局择优法(all possible subsets selection): (2)逐步选择法 1、全局择优法(最优子集回归) (all possible subsets selection): 有m个自变量就有2m-1个自变量子集。在各子集中选择最优的回归方程。 仅适用于自变量个数不太多的情况。 2、向前筛选法(Forward selection): 事先给定一个入选标准,即?(通常? =0.05),然后根据各因素偏回归平方和从大到小,依次逐个引入回归方程至无显著性自变量可以入选为止,因素一旦入选便始终保留在方程中而不被剔除。 局限性:后续变量的引入可能会使先进入方程的变量变得不重要。 4、逐步法(Stepwise): 给出入选标准(通常 ?1 =0.05)和剔除标准( 通常?2 =0.10),每次选入一个在方程外且最具统计学意义的自变量后,就对原在方程中的自变量做剔除检验,这个过程逐步进行,直到没有有统计意义的自变量可以入选,也没有无统计学意义的自变量保留在方程中为止。 实际工作中,多采用逐步法。 用上述方法对上例资料进行分析。 六、应用多元线性回归分析时需注意的事项 (1)样本量要求:无精确的计算公式。据经验,样本量应是自变量数的5~10倍以上。(20?) (2)做预报时,只能在自变量X的观察值范围内进行; (3)在资料要求上,应变量Y服从正态分布; (4)注意资料的特异点(outlier); (5)观测值重新量化问题 二项分类资料:用X表示分类变量,阴性为0,阳性为1。 有序多项分类资料:用一个X 作为分类变量,以自然数0,1,2,…赋值。如将病情分为轻中重三类时,用X表示病情,赋值方法为: 判断方法: 利用自变量间的相关系数阵。 (r >0.9,共线性可能性大) 处理方法: 最简单、有效的方法是根据专业知识人为去除在专业上比较次要的、或缺失值较多、测量误差较大的共线性因子。 第十六章 Logistic 回归 一、概念 Logistic 回归是一种适用于应变量为分类值多因素概率型曲线模型。 Binary Logistic 适用于应变量为二项分类的资料。 应变量(Y)在一组自变量(X)的作用下所发生的结果赋值规则为: 条件logistic回归 用于配对资料。 条件logistic回归的SPSS实施——利用Cox回归模型 80 40 不发生 2 10 发生 非暴露 暴露 疾病 例:在某项病因调查研究工作中,通过病例—对照研究,得下表资料: 疾病为Y ,发生为1,不发生为0; 暴露情况为X,暴露为1,非暴露为0。 频数需加权。 例16-3 P.286 某北方城市研究喉癌发病的危险因素,用1∶2配对的病例?对照研究方法进行了调查。现选取了6个可能的危险因素并节录25对数据,各因素的赋值说明见表16-6,资料列于表16-7,试做条件logistic逐步回归分析 。 无序多项分类资料: 或 上述以职员作为对比水平(基础水平)。哑变量X1、 X2、 X3分别代表了工人、农民、干部与职员相比的系数。 哑变量代

文档评论(0)

ipad0d + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档