SAS入门logistic回归.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS入门logistic回归

第一节 逻辑回归模型 Logistic regression model 逻辑回归模型是一非线性模型,可预测某現象发生的概率,当研究中常碰到响应变量的可能取值仅有两个(即二分类变量)或为少数几个项項目时時,无無法使用线性模型,可考虑使用逻辑回归模型 范例: 研究有心血管疾病的因素,研究的对象分为有或沒有 预测下雨概率,研究的对象是会下雨分為有或沒有 研究已婚妇联女选择就业的因素,研究的对为象分就业或不就业 金融机构研究影响个人信用壮況的因素 逻辑回归(Logistic Regression) 如果应变量Yi只能取两个值0和1,则Yi服从二点分布(Bernoulli distribution). 逻辑函数(S型曲线): 逻辑回归模型 逻辑回归模型 设 这里g定义为连系函数(link function),连系函数将线性组合Xiβ与数学期望pi连在一起. 则 即 p是关于η的逻辑函数,且有 0pi 1. Logistic response function E(y)=1/(1+e-5.0+0.65x1+0.4x2) E(y)=1/(1+e-5.0+0.65x1+0.4x2+0.15x1x2) 第二节 Logistic回归的参数估计 Logistic回归模型的参数估计常用最大似然法,最大似然法的基本思想是先建立似然函数或对数似然函数,似然函数或对数似然函数达到极大时参数的取值,即为参数的最大似然估计值。其步骤为对对数似然函数中的待估参数分别求一阶偏导数,令其为0得一方程组,然后求解。由于似然函数的偏导数为非线性函数,参数估计需用非线性方程组的数值法求解。常用的数值法为Newton-Raphson法。不同研究的设计方案不同,其似然函数的构造略有差别,故Logistic回归有非条件Logistic回归与条件Logistic回归两种。 二、模型的参数估计 Logistic回归参数的估计通常采用最大似然法(maximum likelihood,ML)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。 参数β的极大似然估计 费雪信息矩阵(Fisher information matrix) 这里 当 是逻辑连系函数时 注意:需用叠代算法求出β^,即解方程组. 参数估计β^的性质 事实上β^是渐进正态分布的. 第三节 回归模型的评价 1.拟合优度(Goodness of fit) 2.差异函数(deviance function) (注意:0?log(0)=0) 如果模型假定正确, D渐进服从 ; 如有两个嵌套模型H0 和 HA ,则D0 –DA 渐进服从 . 似然比检验(likelihood ratio test) 3.HOSMER-Lemeshow拟合优度指标 4.信息测量指标(Information Measures) 5.LOGISTIC回归模型的预测准确性 (注意:0?log(0)=0) 如果模型假定正确, D渐进服从 ; 如有两个嵌套模型H0 和 HA ,则D0 –DA 渐进服从 . Logistic回归的假设检验 1、拟合优度检验:目的是检验模型估计值与实际观察值的符合程度。SAS程序提供了下列统计量。 A、AIC和SC:对同一份资料,在模型比较中,这两个越小,表明模型越合适。 B、-2LogL:用于检验全部自变量(协变量)的联合作用。如显著,表明全部协变量的联合作用显著;如不显著,表明全部协变量的联合作用不大,可予忽视。 C、Score:用于检验全部协变量联合作用的显著性,但不包截距项。 2、偏回归系数的显著性检验:目的是检验回归模型中自变量的系数是否为零,等价于总体优势比OR是否为零。 H0:B等于零 H1:B不等于零 A、wald检验: B、Score test: C、likelihood ratio test(wald chi-square test): 注意:嵌套模型的检验比显著性检验D更强,即D服从 的要求比较高, D0 –DA 服从 的要求比较低,甚至当D0和DA 都不服从 和 时亦成立. 二项分布(Binomial distribution)的情形 等

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档