第四章_定性变量的建模_.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章_定性变量的建模_

第四章 定性变量的建模 背景 定类与定序变量统称为定性变量 在经济领域,许多重要因素都需要使用定性数据加以刻画: 经济体制(改革前-改革后)、所有制形式(国有-集体-外资等等)、区域(东-中-西)、性别(男-女)、信用等级 自变量采用定性数据,在量化与解释上要十分注意,因变量如果采用定性数据,会给模型的估计与解释带来更大的困难。 背景 本章的研究对象是定性变量 无论是定类还是定序,处理方法是一致的 但,当定序变量的水平很多时,可以当定量变量处理 例:大学排名 背景 定性变量的水平可以是自然的,也可以是人为规定的 自然的:性别 人为规定: 规定水平:相貌对工资的影响 合并水平(计量等级的退化): 地区差异对人均收入的影响 大学排名对最初工资的影响 背景 有时,自变量的影响有如下模式:在某个区间内的变动,不会显著影响因变量,但区间外与区间内的不同则会有显著影响。此时直接用原始变量效果不好,则可将变量转换为水平较少的定性变量进行建模 定量变量的系数不显著,有时将其退化为定性变量就会显著。 背景 定性变量有些来自于不得已 有些来自于主动 主要内容 一、定性变量作为自变量的建模方法 虚拟变量法 二、定性变量作为因变量的建模方法 一、定性变量作为自变量的建模 (一)二值变量的建模 1、二值变量的量化方法 2、回归系数的含义 3、多个虚拟变量的建模与解释 4、含虚拟变量模型的其他变化 5、Chow检验 (二)多值变量的建模 (一)二值变量的建模 所谓二值变量,是指变量只有两种可能取值,是某种属性或者不是 二值变量可以是自然的,也可以是人为规定的 人为规定:所有制:国有企业-非国有企业 1、二值变量的量化方法 可以有三种量化方法 1) 1、二值变量的量化方法 2) 1、二值变量的量化方法 3) 1、二值变量的量化方法 使用虚拟变量(dummy variable)的基本原则 0,1只是代号 用0,1代入,会有较好的经济含义 二值变量,只需设置一个虚拟变量,否则会出现完全共线性问题(有截距项) 2、回归系数的含义 较正式的表述: 2、回归系数的含义 虚拟变量回归系数的基本含义: 不同属性模型之间的截距移动 2、回归系数的含义 虚拟变量回归系数可以解释为:在其他因素水平相同的情况下,不同属性的平均差异 以前数据为例,虚拟变量回归系数为67, 意味着在资本水平相同的情况下,三资企业的平均利润要高于国有及国有控股企业67亿元。 在解释时,一定要注意谁是基组(取0) 2、回归系数的含义 类似模型都蕴含有一个假定: 斜率是一致的,即无论对于哪一组(按虚拟变量属性划分),其它变量对因变量的影响都是一样的 3、多个虚拟变量的建模与解释 如果在自变量有两个以上虚拟变量,则可以有三类建模方法 3、多个虚拟变量的建模与解释 3、多个虚拟变量的建模与解释 第一种模型可以变化为四组方程: 3、多个虚拟变量的建模与解释 所以,虚拟变量回归系数的含义: 3、多个虚拟变量的建模与解释 第二种模型也可以变化为四组方程: 3、多个虚拟变量的建模与解释 所以,虚拟变量回归系数的含义(平均意义上): 4、含虚拟变量模型的其他变化 考虑交互影响的模型 显然,资本水平不同,利润会有不同,三资企业和国有企业的差异也不会都是67亿元 4、含虚拟变量模型的其他变化 在交互模型中,虚拟变量前的回归系数只表示在资本为0情况下,三资企业与国有企业的利润差距 4、含虚拟变量模型的其他变化 交互模型中虚拟变量前回归系数的经济含义不好,可以采用如下方法解决: 4、含虚拟变量模型的其他变化 4、含虚拟变量模型的其他变化 交互项的引入实际意味着非虚拟变量的斜率是不一致的。 4、含虚拟变量模型的其他变化 判断是否需要交互项,可通过相应系数的t检验来进行; 要注意到:是否需要交互项等价于检验斜率是否相等; 5、Chow检验 简言之,所以需要虚拟变量,是因为在虚拟变量不同水平下,自变量对因变量的影响程度有差别,这种差别表现在截距和斜率上。 判断系数是否相同的方法是使用Chow statistics进行检验。 5、Chow检验 邹至庄统计量( Chow statistics ) 检验对象: 两个变量相同、样本不同的模型的回归系数是否相同。 5、Chow检验 检验统计量: 5、Chow检验 判断规则 如果样本F值大于临界值,则可拒绝原假设,认为各回归系数(包括截距项)中至少有一个系数不同。如果不能,则两组样本可以合并,统一建模。 如果允许截距不同,仅需要判断斜率是否相同,办法是: 在模型中设置交互项,检验所有交互项的联合显著性,如果不能拒绝原假

文档评论(0)

zhuliyan1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档