计量经济学讲义第七讲共十讲.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计量经济学讲义第七讲共十讲

浙江工商大学金融学院姚耀军讲义系列 PAGE PAGE 1 第七讲 虚拟变量 一、含有虚拟变量的模型 假设居民家庭的教育费用支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。如果家庭中有适龄子女(6~21岁),教育费用支出就多。现在考虑模型: (1) 其中,y表示教育支出,x表示收入,而D的取值是 在这里,D就是一个虚拟变量,也被称为哑变量,它反映了定性因素的变化。模型(1)的等价形式由如下两个子模型组成: 无适龄子女家庭其教育费用支出函数(Di= 0): 有适龄子女家庭其教育费用支出函数(Di= 1): 如果保持家庭收入一样,有适龄子女的家庭教育费用将比无适龄子女的家庭费用高。因此,虚拟变量D的显著性意味着子女的年龄结构对家庭教育费用有显著影响。 定性因素也可能影响斜率参数,例如随着收入水平的提高,家庭教育支出的边际消费倾向也可能会发生变化。为了反映定性因素对斜率参数的影响,可以设定模型: (2) 模型(2)的等价形式由如下两个子模型组成: 无适龄子女家庭其教育费用支出函数(Di= 0): 有适龄子女家庭其教育费用支出函数(Di= 1): 事实上,我们还可以设定更一般的模型,以涵盖定性因素不仅影响截距也影响斜率参数的情况: 当然,我们可以利用t检验或者F检验分别判断、单个或者联合显著性,进而确定哪一种模型设定合理。 二、虚拟变量的设置原则 假设公司职员的年薪与工龄和学历有关。学历分成三种类型:大专以下、本科、研究生。为了反映“学历”这个定性因素的影响,我们设置两个虚拟变量: 如果把模型设定为: 其中y是年薪,x是工龄。模型等价于: 大专以下(D1=D2=0) 本科(D1=1,D2=0) 研究生(D1=0,D2=1) 大专以下本科研究生 大专以下 本科 研究生 工龄 年薪 a0 a1-a0 在上例中,样本按学历分为三类。在考察学历对年薪的影响时,我们以具有大专以下学历的人为参考组。 练习:针对上例,如果以具有本科学历的人为参考组,并且假定工龄对年薪的边际影响不受学历影响,试建立模型。 针对上例,现在我们来回答四个问题,以加深对含虚拟变量模型的理解。 问题一:为何不直观地设定虚拟变量 D = 并且模型为:? 回答:当采取上述模型设定时,各子模型总体回归函数如下图所示: 大专以下 大专以下 本科 研究生 工龄 年薪 a0 a0 该图表明,当采取如此模型设定时一个假定被隐含:研究生与本科生之间、本科生与大专生之间的年薪差异程度是相同的,在数值上都等于。显然,这是非常强的假定。 问题二:为何不设置三个虚拟变量? 并设定模型为: 回答:如果采取这样的设定,那么对于每一个职员,必有: 应该注意,截距项还对应一个解释变量,取值恒为1。因此,模型存在完全共线性。此即虚拟变量设置陷阱。 笔记: 在实践中,虚拟变量设置陷阱往往不会成为真正的陷阱。这是因为,当模型存在完全共线性时,计量软件会提示你,它无法进行估计! 问题三:可不可以设定三个虚拟变量呢 回答:可以。设定模型为: 应该注意到,该模型没有截距!当采取上述模型设定时,各子模型总体回归函数如下图所示: 大专以下本科 大专以下 本科 研究生 工龄 年薪 a0-a2 a1-a0 a2 应该注意到,当采取上述模型设定时,参考组并不确定。a0、a1、a2分别是各子模型的截距,而不是各截距的差异。 笔记: 尽管教科书经常告诫我们,如果样本数根据一种因素分为m种类型,那么我们只需要设置m-1个虚拟变量,以防虚拟变量设置的陷阱。然而在谈到虚拟变量陷阱时,我们不能离开模型设定方式泛泛而谈。 问题四:对于含虚拟变量的模型,在应用中,何时选择带有截距的模型何时选择不带有截距的模型? 回答:通常带有截距的模型应用更为广泛,这一方面是因为诸如R2、DW等统计指标的应用要求模型带有截距;另一方面是因为,我们通常关注变量在各个子样本中影响的差异,而在带有截距的模型中,与虚拟变量相对应的系数往往直接就是差异的数值。 笔记: 我们首先考察带有截距的虚拟变量模型的一个应用。股票市场或许存在一种“日历效应”,即,一周内某些天的平均收益远高于其他几天平均收益。现在建立一个模型: 在这里,rt是股票日收益率,是周二虚拟变量,即周二时其值为1,其余为零,其他虚拟变量取值以此类推。利用第一讲相关知识,我们不难知道,将是周一的平均收益率。利用本讲前面的相关知识,是周二平均收益率与周一平均收益率之差,其余参数估计以此类推。通过检验假设各虚拟变量是否显著,我们从统计上可判断,一周内其他时间其平均收益率是否与周一平均收益率有显著差异(通过检验,我们

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档