- 1、本文档共30页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Logistic 回归分析 (Logistic Regression Analysis) 问题提出 多重线性回归分析的前提条件 线性;独立;正态;等方差( Y:正态随机变量) Y为分类变量,多重线性回归不适用 研究二分类因变量(如患病与未患病、阳性与阴性等)或多分类因变量与一组自变量(X1,X2,...Xm,)的关系,线性回归分析方法就无能为力。 问题提出 Logistic 回归分析可解决应变量为: 二分类; 无序多分类; 有序多分类; 本次教学主要介绍应变量为二分类的Logistic 回归分析 分类 按设计, Logistic 回归分析分为: 成组:非条件Logistic 回归分析 配对:条件Logistic 回归分析 Logistic回归模型 例: 大肠癌患者临床病理因素对其预后可能产生影响。收集了158例经手术治疗大肠癌患者的性别、年龄、组织学分类、肿瘤大小、Dure’s分期、淋巴管浸润、血管浸润、5年生存状态等资料 目的:预测经手术治疗大肠癌患者5年生存概率。 变量 性别:女=0 ,男=1 年龄:实测值 组织学分类:乳头状腺癌=0,管状腺癌=1 肿瘤大小:6cm及以上=0,6cm以下=1 Dure’s分期:A=1,B=2,C=3,D=4) 淋巴管浸润:无=0,有=1 血管浸润:无=0,有=1 5年生存状态:存活=0,死亡=1 Logistic回归模型 因变量为二分类变量,不满足线性回归分析条件,首先进行数据变换: 这个变换将取值在0-1间的值转换为值域在( )的值。 建立 与X的线性模型: Logistic回归模型 求解 右端在数学上属于Logistic函数,所以称其为Logistic回归模型 。 模型参数 β0 :常数项(截距),表示模型中所有自变量均为0时, 的值; β1 , β2 、... βP:回归系数 ,表示在控制其他自变量时,自变量变化一个单位所引起的 改变量。 模型参数 模型参数 一般地,根据多个自变量的回归模型,在其他变量取值不变的情形下,与变量Xj的二个水平C1与C2(C2C1)相对应的事件的优势比为 : 当XJ的二个水平相差1个单位时, 模型参数 当变量Xj的回归系数Βj 0时, Xj增加1个单位后与增加前相比,事件的优势比ORj 1,表明Xj为危险因素; Βj 0时, Xj增加1个单位后与增加前相比,事件的优势比ORj 1 ,表明Xj 为保护因素; Βj =0 , Xj增加1个单位后与增加前相比,事件的优势比, ORj =1,表明Xj对结果变量不起作用。 Logistic回归的参数估计 Logistic回归模型中的参数β1 , β2 、… βP需要通过样本资料,按照一定方法进行估计,估计量记为b1 , b2 、… bP。 参数估计方法有多种,极大似然估计( MLE)最为常用 Logistic回归的参数估计 极大似然估计基本思想 选择能有最大概率获得当前样本的参数值作为参数的估计值。 假设检验 检验整个模型:检验因变量与自变量之间的关系能否用所建立的回归方程来表示 ; 单个回归系数是否为0:检验单个自变量对因变量的影响是否存在。 最常用的检验方法有 似然比检验 WALD检验 假设检验----似然比检验 似然比检验常用于对整个模型的检验,检验的假设为 H0:所有自变量的总体回归系数均为0 H1:自变量的总体回归系数不全为0 假设检验----似然比检验 假设模型A含有P个自变量,相应的达到极大的对数似然函数值LnL0; 模型B是在模型A的P个自变量基础上新加入一个或几个自变量,自变量个数变为Q,相应的达到极大的对数似然函数值LnL1 ; 比较模型A与模型B的极大似然函数值,构建似然比检验统计量 在H0成立的条件下,如果样本量较大,G近似地服从自由度为Q-P的χ2分布 假设检验----WALD检验 WALD检验常用于对单个回归系数的检验,检验的假设为: H0:βj=0 H1:βj≠0 WALD检验统计量为
文档评论(0)