倾向值匹配法(PSM)素材.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
方法四:核匹配法 (kernel matching) 核匹配是构造一个虚拟对象来匹配处理组,构造的原则是对现有的控制变量做权重平均,权重的取值与处理组、控制组PS值差距呈反向相关关系。 方法四:核匹配法 (kernel matching) 命令 set seed 10101 attk re78 treat $x,comsup boot reps($breps) dots logit 方法四:核匹配法 (kernel matching) 倾向值匹配法(PSM) Q:为什么要使用PSM? A:解决样本选择偏误带来的内生性问题 例:上北大有助于提高收入吗? 样本选择偏误:考上北大的孩子本身就很出色(聪明、有毅力、能力强…) 解决方法:样本配对 配对方法 同行业(一维配对) 同行业、规模相当(二维配对) 同行业、规模相当、股权结构相当、……(多维配对)??? PSM:把多个维度的信息浓缩成一个(降维:多维到一维) 配对过程中的两个核心问题(1) Q1:哪个样本更好一些? A1:Sample2较好:比较容易满足共同支撑假设(common support assumption) 配对过程中的两个核心问题(2) Q2:stu c1,c2,c3三人中,谁是stu PK的最佳配对对象? A2:stu c3是最佳配对对象,比较容易满足平行假设(balancing assumption) ATT(Average Treatment Effect on the Treated) 平均处理效应的衡量 运用得分进行样本匹配并比较,估计出ATT值。 ATT=E[Y(1)-Y(0) |T=1] Y(1):Stu PK 上北大后的年薪 Y(0): Stu PK 假如不上北大的年薪 可观测数据 不可观测数据,采用配对者的收入来代替 ATT=12W-9W=3W 实例介绍 实例介绍 研究问题:培训对工资的效应 基本思想:分析接受培训行为与不接受培训行为在工资表现上的差异。但是,现实可以观测到的是处理组接受培训的事实,而如果处理组没有接受培训会怎么样是不可观测的,这种状态称为反事实。匹配法就是为了解决这种不可观测的事实的方法。 实例介绍 分组:在倾向值匹配法中,根据处理指示变量将样本分为两个组。处理组,在本例中就是在NSW(国家支持工作示范项目)实施后接受培训的组;控制组,在本例中就是在NSW实施后不接受培训的组。 研究目的:通过对处理组和对照组的匹配,在其他条件完全相同的情况下,通过接受培训的组(处理组)与不接受培训的组(控制组)在工资表现上的差异来判断接受培训的行为与工资之间的因果关系。 变量定义 变量 定义 treat 接受培训(处理组)表示1,没有接受培训(控制组)表示0 age 年龄 educ 受教育年数 black 种族虚拟变量,黑人时,black=1 hsip 民族虚拟变量,西班牙人时,hsip=1 marr 婚姻状况虚拟变量,已婚,marr=1 re74 1974年实际工资 re75 1975年实际工资 变量定义 re78 1978年实际工资 u74 当在1974年失业,u74=1 agesq age*age educsq educ*educ re74sq re74*re74 re75sq re75*re75 u74blcak u74*blcak 倾向打分 OLS回归结果 工资的变化到底是来自个体的异质性 性还是培训? 倾向打分 1.设定宏变量 (1)设定宏变量breps表示重复抽样200次 命令:global breps 200 (2)设定宏变量x,表示age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black 命令:global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black 倾向打分 2.通过logit模型进行倾向打分 命令:pscore treat $x,pscore(mypscore) blockid(myblock) comsup numblo(5) level(0.05) logit 注:$表示引用宏变量 pscore结果 倾向值分布 倾向值分布 block中样本的分布 block中的描述性统计 运用得分进行样本匹配并比较 方法一:最邻近方法 (nearest neighbor matching) 含义:最邻近匹配法是最常用的一种匹配方法,它把控制组中找到的与处理组个体倾向得分差异最小的个体,作为自己的比较对象 。 优点:按处理个体找控制个体,所有处理个体都会配对成功,处理组的信息得以充分使用。 缺点:由于

文档评论(0)

w3388825 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档