- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第14章-受限被解释变量讲解
? 陈强,《高级计量经济学及Stata应用》课件,第二版,2014年,高等教育出版社。
第14章 受限被解释变量
被解释变量的取值范围有时受限制,称为“受限被解释变量”(Limited Dependent Variable)。
14.1 断 尾 回 归
对线性模型,假设只有满足的数据才能观测到。
例:为所有企业的销售收入,而统计局只收集规模以上企业数据,比如。被解释变量在100,000处存在“左边断尾”。
断尾随机变量的概率分布
随机变量y断尾后,其概率密度随之变化。
记y的概率密度为,在c处左边断尾后的条件密度函数为
由于概率密度曲线下面积为1,故断尾变量的密度函数乘以因子。
图14.1 断尾的效果
断尾分布的期望也发生变化。以左边断尾为例。
对于最简单情形,,可证明(参见附录)
对于任意实数c,定义“反米尔斯比率”(Inverse Mill’s Ratio,简记IMR)为
则。
图14.2 反米尔斯比率
对于正态分布,定义,则。故
对于模型,,则,故
如果用OLS估计,则遗漏了非线性项,与相关,导致OLS不一致。
参见图14.3。总体回归线为,而样本回归线为。
图14.3 断尾回归示意图
使用MLE可得到一致估计。断尾前的概率密度:
样本被观测到的概率:
断尾后的条件密度:
14.2 零断尾泊松回归与负二项回归
计数数据有时仅包括正整数,不包括取值为0的观测值,称为“零断尾”(zero-truncated)。
例:在商场发放问卷调查,研究消费者每周去商场的次数。
例:在公交车上发放问卷调查,研究乘车者每周坐公交的次数。
如果不对似然函数进行调整,将得不到一致估计。
记为y的概率函数,而为cdf。如果存在零断尾,则断尾后的概率函数为
如果y服从泊松分布,则
进行MLE估计,得到“零断尾泊松回归”(zero-truncated Poisson regression)。如果y服从负二项分布(NB1或NB2),可进行“零断尾负二项回归”(zero-truncated negative binomial regression)。
14.3 随机前沿模型(选读)
14.4 偶然断尾与样本选择
被解释变量的断尾有时与另一变量有关,称为“偶然断尾”(incidental truncation)或“样本选择”(sample selection)。
称为选择变量。
例 在美国的亚裔移民给人的整体印象是聪明能干。但在美国的亚裔并非亚洲人口的代表性样本。通常只有受过高等教育或具有吃苦冒险精神的亚裔才会“自我选择”(self selection)移民。
决定移民与否的变量便对被解释变量产生了断尾作用,故“样本选择”将导致“选择性偏差”(selection bias)。
例 妇女劳动力供给模型:
劳动时间方程
工资方程
表示offered wage,表示reservation wage。
如果,则选择不工作,无法观测到劳动时间(hours),造成劳动时间方程的偶然断尾与样本选择问题。
考虑二维正态随机向量,记期望为,标准差为,相关系数为,联合密度函数为。
假设个体进入样本的“选择机制”(selection mechanism)为“选择变量z大于某常数c”。
比如,在妇女劳动力供给例子中,,而。
断尾后的联合分布:
偶然断尾y的条件期望:
为反米尔斯比率(IMR)函数。
如果(y与z相互独立),则z的选择过程并不对y产生影响。
如果(即y与z正相关),则“”偶然断尾的结果是把y的整个分布推向右边(因为),从而使得条件期望大于无条件期望。
在“”条件下,偶然断尾y的条件期望为
假设回归模型为。
是否可观测取决于选择变量(取值为0或1)
决定二值变量的方程为
为不可观测的潜变量。
假设服从正态分布,则为Probit模型,故。
可观测样本的条件期望:
其中,,并将Probit扰动项的标准差标准化为1。
OLS估计,将遗漏非线性项。
如与相关,则OLS不一致,除非“”(即y与z不相关)。
解释变量的边际效应:
右边第一项为直接影响,第二项是通过改变个体进入样本可能性而产生的间接影响(即选择性偏差
文档评论(0)