第8章 logistic回归模型.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章; 许多社会科学的观察都只分类而不是连续的. 比如,政治学中经常研究的是否选举某候选人. 又如,经济学研究中所涉及的是否销售或购买某种商品、是否签订—个合同等等.这种选择 量度通常分为两类,即“是’与“否”. 在社会学和人口研究中,人们的社会行为与事件的发生如犯罪、逃学、迁移、结婚、离婚、 患病等等都可以按照二分类变量来测量。; 线性回归模型在定量分析中也许是最流行的统计分析方法,然而在许多情况下,线性回归会受到限制.比如,当因变量是一个分类变量,不是一个连续变量时,线性回归就不适用,严重违反假设条件. 分类变量分析通常采用对数线性模型(Log-linear model), 而因变量为二分变量时, 对数线性模型就变成Logistic回归模型.;目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。;用 检验(或u检验)的局限性: 1.只能研究1个危险因素; 2.只能得出定性结论。 ; 第八章 ; 一、两分类因变量与Logistic回归模型;如果假设在反应变量yi* 和自变量xi之间存在一种线性关系,即;通常,假设公式中误差项εi有logistic分布或标准正态分布.由于logistic分布和标准正态分布都是对称的,得到:;当εi为logistic分布时:;定义不发生事件的条件概率为:;上面的式子由于做了对数变换,被称作logit形式, 也称作y的logit,即logit(y).; 第八章 ;最大似然估计(Maximum Likelihood Estimation);一、建立似然函数;似然函数取对数为了求最大的估计参数, 得到回归模型的对数似然函数:;分别对α,?求偏导,令它等于0,可以得到似然方 程组:;由于方程是α和?的非线性函数,求解是通过计算机 迭代计算完成的. 得到α和?的最大似然估计值;二、模型估计的假设条件;三、最大似然估计的性质;四、模型估计的样本规模;根据一些资深研究人员的看法,最大似然估计的大样本性质维持得较好,即使在中等规模样本(比如M=100)的条件下也能够接受。Long (1997)提到,在样本规模小于100时使用最大似然估计风险较大.样本大于500时就显得比较充分了。; 第八章 ;模型估计完成以后,我们需要评价模型如何有效地描述反??金旦及模型匹配配观测数据的程度如果模型的预测值能够与对应的观测值有较高的一致性,就认为这一模型拟和数据.否则,将不能接受这一模型,就需要对模型重新设置。;一、拟和优度;在固定样本规模n情况下,协变类型越多,每个类型(即每个子总体)中的案例数nj就越少在每个协变类型中,预测的事件发生频数表示为nj*,其中是第j种协变类型中事件发生的模型预测概率。 与此类似,我们也可以计算每种协变类型中事件末 发生的频数.;二、皮尔逊;三、偏差;通常采用-2乘以设定模型和饱和模型的最大似然值的对数:;四、Hosmer-Lemeshow拟合优度指标;其中G代表分组数,且G<10 ,ng为第n组中的案例数;yg为第g组事件的观测数量;为第g组的预测事件概率;ng 为事件的预测数,实际上它等于第g组的预测概率之和.;五、信息测量类指标;其他条件不变的情况下,较小的AIC值表示拟合模型较好.AIC指标还常常应用于比较不同样本的模型,或应用于比较非嵌套关系的模型,而这些模型的比较不能采用似然比(L.R.)检验.;六、Logistic回归模型的预测准确性—类R2指标;七、模型卡方统计; 第八章 ;当logistic回归模型能够较好地拟合数据时,便可以对模型的系数进行解释了.类似于线性同归系数,logistic回归系数也可以被解释为对应自变量一个单位的变化所导致的因变量上的变化. ;由于Logistic回归的因变量不是常规的连续变量,而 是logit(即对数发生比,那么对应每个自变量的估计 系数便是对该自变量对logit的作用. 尽管这种解直截 了当,但是其实十分含糊.因为logit或对数发生比 没有较直观的含义.;一、发生比和发生比率;如果发生比odd=0.25,说明事件不发生可能性是发生可能性的4倍,或者说可以期望对应每4次事件不发生有1次事件发生.;假如分别有259名男生和76名女生考入了大学 (同时有291名男生和374名女生落榜);二、按发生比解释系数;因为理解发生比比理解对数发生比更容易,logistic回归模型可以按事件发生比的形式改写为 :;连续自变量的发生比率;在社会科学研究中,人们对一些连续变量中一个 单位值的变化通常不感兴趣.比如,年龄增加1岁 或收入增加1元的作用十分微小,并不重要而一 个离散的变化,如年龄增加5岁或收入增加100元 的变化也许更有意义.;调整发生比率

文档评论(0)

勤能补拙 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档