- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
广义线性模型课件精要
(三)条件Logistic回归分析的基本原理 条件Logistic回归是经典Logistic回归的重要拓展方法之一,它主要用于分层数据(strata data)的影响因素分析,通过分层来控制可能的混杂因素对结局变量的影响。分层变量可以包括一个变量或者几个变量 。 1.概述 2.条件 Logistic模型 logit变换: 令yk为第k层的因变量,yk=1或0;xk1,xk2…xki… xkm为第k层的m个自变量。第k层的模型为: ?k 为第k层的截距,反映了层的效应。?1,?2…. ?m为回归系数,是未知参数。 模型估计方法: 条件最大似然法(the Conditional Maximum Likelihood)。可以估计出回归系数?i , 与?k无关(在实际应用中,我们并不关心?k)。 假定:对于k层,自变量xki的回归系数相同,这表明对于所有的层,自变量对因变量的影响大小是相同的。 最常见的情况是流行病学中的匹配病例对照研究。 SPSS中实现Logistic回归___借助COX回归模型: (1)增加一个虚拟的生存时间变量 (2)令病例的生存时间比对照短 (3)在设置生存状态变量(status)时,令病例组为完全数据,对照组为删失数据 3.应用 以下实例摘自Hosme and Lemeshow(2000). Applied Logistic Regression: Second Edition. John Wiley Sons Inc. 研究目的是考察与婴儿低出生体重有关的可能危险因素(当体重低于2500g时,认为是低出生体重婴儿)。此研究为1:1病例对照研究,包括112例(56例病例,56例对照)。对于每一例分娩低出生体重婴儿母亲,按照母亲的年龄进行匹配,选择一例分娩正常体重婴儿作为对照。 Generalized Linear Models 广义线性模型 何平平 北大医学部流行病与卫生统计学系 Tel广义线性模型的定义 该模型假定: 1. Y1,…Yn是n个服从指数分布族的独立样本 ?i=E(Yi | X1,X2,…,Xk),i=1,…,n; 2. ?i是k个解释变量的线性组合 ?i=?0+?1Xi1+…+ ?kXik 3.存在一个连接函数(Link function)g,使得?i 与?i有下面的关系 ?i =g(?i) 常见分布及其联系函数 指数分布族常见的重要分布如正态分布、二项分布、Poisson分布、指数分布等。对非正态广义线性模型,经典的最小二乘法已不能用于这种模型的拟合,而是采用最大似然估计方法。 分布 联系函数 正态分布 ? =? 普通线性模型 二项分布 或多项分布 ? =log? 对数线性模型 (Poisson分布) (Poisson回归) ? =log{P/(1-P)} Logistic回归模型 ? =log{h(t)/h0(t)} COX回归模型 Logistic回归分析 推荐书籍: Hosmer, David W . (2000). Applied logistic regression . John Wiley, New York. 何平平 北大医学部流行病与卫生统计学系 Tel(一)Logistic回归分析的任务 影响因素分析 logistic回归常用于疾病的危险因素分析,logistic回归分析可以提供一个重要的指标:OR。 (二)经典Logistic回归分析的基本原理 1.变量特点 因变量:二分类变量,若令因变量为y,则常用y=1表示“发病”,y=0表示“不发病”(在病例对照研究中,分别表示病例组和对照组)。 自变量:可以为分类变量,也可以为连续变量。 2.Logistic模型 P=P(y=1|x),为发病概率;1-P=P(y=0|x),为不发病概率。?0为常数项, ?1 , ?2 ….. ?m分别为m个自变量的回归系数。 g(x)是对P的变换,称为logit变换: 可以得到: 模型估计方法: 最大似然法(Maximum Likelihood Method):构造似然函数( Likelihood function )L=? P(y=1|x) P(y=0|x),通过迭代法估计一组参数(?0
文档评论(0)