111面板数据、工具变量选择和HAUSMAN检验的若干问题.docVIP

下载本文档

1
0
约9.03千字
约 6页
2017-12-18 发布于江西
举报
版权申诉

111面板数据、工具变量选择和HAUSMAN检验的若干问题.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

111面板数据、工具变量选择和HAUSMAN检验的若干问题

面板数据、工具变量选择和HAUSMAN检验的若干问题* 第一节关于面板数据PANEL DATA 1、面板数据回归为什么好一般而言，面板数据模型的误差项由两部分组成，一部分是与个体观察单位有关的，它概括了所有影响被解释变量，但不随时间变化的因素，因此，面板数据模型也常常被成为非观测效应模型；另外一部分概括了因截面因时间而变化的不可观测因素，通常被成为特异性误差或特异扰动项（事实上这第二部分误差还可分成两部分，一部分是不因截面变化但随时间变化的非观测因素对应的误差项Vt，这一部分一般大家的处理办法是通过在模型中引入时间虚拟变量来加以剥离和控制，另一部分才是因截面因时间而变化的不可观测因素。不过一般计量经济学的面板数据分析中都主要讨论两部分，在更高级一点的统计学或计量经济学中会讨论误差分量模型，它一般讨论三部分误差）。非观测效应模型一般根据对时不变非观测效应的不同假设可分为固定效应模型和随机效应模型。传统上，大家都习惯这样分类：如果把非观测效应看做是各个截面或个体特有的可估计参数，并且不随时间而变化，则模型为固定效应模型；如果把非观测效应看作随机变量，并且符合一个特定的分布，则模型为随机效应模型。不过，上述定义不是十分严谨，而且一个非常容易让人产生误解的地方是似乎固定效应模型中的非观测效应是随时间不变的，是固定的，而随机效应模型中的非观测效应则不是固定的，而是随时间变化的。一个逻辑上比较一致和严谨，并且越来越为大家所接受的假设是（参见Wooldridge的教材和Mundlak1978年的论文），不论固定效应还是随机效应都是随机的，都是概括了那些没有观测到的，不随时间而变化的，但影响被解释变量的因素（尤其当截面个体比较大的时候，这种假设是比较合理的）。非观测效应究竟应假设为固定效应还是随机效应，关键看这部分不随时间变化的非观测效应对应的因素是否与模型中控制的观测到的解释变量相关，如果这个效应与可观测的解释变量不相关，则这个效应成为随机效应。这也正是HAUSMAN设定检验所需要检验的假说。非观测效应模型因为对非观测效应假设的不同，因为使用面板数据信息的不同，可以用不同方法来估计并且得到不同的估计量，一般有四个：（1）组内估计量（WITHIN ESTIMATOR）（FE或FD: First Difference）（2）组间估计量（BETWEEN ESTIMATOR）（3）混合OLS估计量（POOLED OLS ESTIMATOR）（4）随机效应估计量（RE，GLS或FGLS估计量）这四个估计量因为假设和使用信息的不同而不同，各有优劣势，相互之间也有密切关系。3和4分别是1和2的加权平均；4在特定的假设分别可以转化成1和3；如果HAUSMAN检验表明4和1没有区别的时候意味着1和2没有区别。 RE假设未观察因素与解释变量是正交的，只不过在未观察因素里有两个部分，一是与个体单位有关的，二是完全随机的，RE在做估计的时候，是用这两个部分的方差计算出一个指数λ，来做quasi-demean，也就是说在去平均的时候是用原值的y或x减去λ乘以y或x的均值，然后用GLS估计。极端地，当λ为0时，非观测效应是一个常数，并且所有个体都一样，就等价于Pooled OLS，当λ为1时，说明完全随机的部分可以忽略，所有未观察因素都是与单位有关的，于是就等价于FE。但FE不需要假定未观察因素与解释变量是正交的，在做FE时，固定效应都被差分掉了，所以也可得到consistent的结果。 PANEL数据的好处之一是，如果未观察到的是固定效应，那么在做DEMEAN时，未观察因素就被差分掉了。这样就可以减少由于未观察的因素可能与解释变量相关而导致的内生性问题。 2、那么PANEL的FE或RE分析就避免了内生性问题吗？只能说好一些，如果内生的问题只是由于与单位有关的并不随时间变化的遗漏变量与解释变量有关造成的，这时，数据的差分就解决了问题，但是，别忘记还有一部分误差，如果这部分误差里包含的因素也可能影响解释变量，那么，差分只能解决前面讲的问题，由随机项里包括的因素与解释变量之间的关系导致的内生性问题还可能存在。 3、怎么办？找IV解决。类似于在OLS基础上找IV，但对PANEL的工具应该具有PANEL结构，除非你基础的估计没有使用PANEL的方法，比如说对数据用了pooled OLS方法，但能够用pooled OLS方法分析PANEL DATA的条件是很严格的。第二节关于工具变量选择 IV应该尽量是外生的（如历史/自然/气候/地理之类），它应该在理论上对被解释变量（以下称Y）没有直接影响，但应该通过影响被工具的变量（以下称X）而间接影响被解释变量Y。如果上述理论逻辑通的话，将内生变量X作为解释变量，IV和其他变量（X2）作为解释变