- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 第3节定性因变量的建模20091215
虚拟被解释变量(因变量为定性变量) 线性概率模型(LPM) Logit模型 (一)线性概率模型 Linear Probability Model (一)线性概率模型 线性概率模型的解释 (一)线性概率模型 线性概率模型的问题 1、异方差 2、常规检验失效 3、函数设定不当 4、易出现无法解释的结果 异方差 函数设定不当 线性概率模型是线性的,而实际是非线性关系 函数设定不当 易出现无法解释的结果 由于函数形式设定不当,预测时很难避免出现得到的Y值大于1或小于0的情况,为结果的解释带来困难。 (二)Logit模型 又称Logistic模型,该模型克服了线性概率模型的取值范围的弱点。 (二)Logit模型 (二)Logit模型 (二)Logit模型 (二)Logit模型 (二)Logit模型 1、模型的解释 2、模型的数据与估计 3、模型的检验 1、模型的解释 1、模型的解释 发生比和发生比率(Odds and Odd Ratio) 发生比率是为了比较发生比而提出的指标 1、模型的解释 自变量为定量变量的解释 1、模型的解释 发生比的相对变化率 1、模型的解释 自变量为定量变量的解释 回归系数的指数表示在其他因素不变情况下,相应自变量增加1个单位,发生比变化的幅度与方向,即发生比率。 价格上升1单位,发生比率为0.9564,即需求超过100的发生比下降,变化率为-4.36% 1、模型的解释 自变量为定量变量的解释 需要了解自变量发生一个离散的变化,如价格下降100元时,发生比的变化。 1、模型的解释 自变量为虚拟变量的解释 1、模型的解释 自变量为虚拟变量的解释 1、模型的解释 自变量为虚拟变量的解释: 回归系数的指数表示在其他因素不变情况下,两种属性在发生比上的差异。 高等级与低等级,发生比率为57.76,即高等级产品需求大于100的发生比为低等级的57.76倍 Tobit模型 适用于截取样本(Censored sample),例如 在正值区间为连续变量,但总体中有相当部分取值为0的情况 2、模型的数据与估计 进入模型的数据分为两类: 微观数据 分组数据 2、模型的数据与估计 微观数据 2、模型的数据与估计 分组数据 2、模型的数据与估计 对于微观数据,最小二乘法是无用武之地的。 2、模型的数据与估计 对于分组数据,为避免异方差,可以使用加权最小二乘 关键在于同一分组有几个数据,可以计算概率 2、模型的数据与估计 对于微观数据,一般采用极大似然估计 (Maximum Likelihood Estimation,MLE) 基本思想 假定一枚硬币,其抛掷后为正面的真实概率有两种可能取值:0.1和0.01,如果做一次试验,结果为正面,则应估计概率为0.1。 2、模型的数据与估计 MLE的基本思想 2、模型的数据与估计 在Y为二分变量的情况下,服从贝努里分布,得到一个观测值的概率为: 2、模型的数据与估计 为便于计算,取对数: 2、模型的数据与估计 2、模型的数据与估计 极大似然估计主要适用于大样本(100以上基本可以) 当大样本情况下,MLE将具有一致性、渐近有效性和渐近正态性等优良性质。 2、模型的数据与估计 分组数据:加权最小二乘法 用根据样本获得的频率来代替概率,获得对数发生比,进行计算。 2、模型的数据与估计 2、模型的数据与估计 2、模型的数据与估计 由此可知,权重取为: 3、模型的检验 模型整体的评价 拟合优度 拟合准确性 模型卡方统计 参数的检验 3、模型的检验 模型整体的评价 (1)拟合优度 Hosmer-Lemeshow指标 AIC SC (1)拟合优度 Hosmer-Lemeshow指标 将预测概率值按升序排列,根据预测概率值的大小将数据分成大致相同规模的10个组,由于有相同预测概率的数据必须放在同一组中,所以各组规模一般不会相同,由于同样的原因,也有可能无法分成10组。 (1)拟合优度 Hosmer-Lemeshow指标 (1)拟合优度 Hosmer-Lemeshow指标 决策规则:如果HL小于临界值,不显著,则表示模型拟合数据 注意:如果分组少于5,则不能使用这一指标。 (1)拟合优度 AIC(Akaike’s information criterion) (1)拟合优度 SAS当中AIC的定义 只能用以比较同一数据的不同模型 (1)拟合优度 SC(Schwarts criterion) AIC和SC都是越小越好的 (2)拟合准确性 类R2指标(Analogous R2) * * *
文档评论(0)