SPSSAU_计量经济研究_倾向得分匹配.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

SPSSAU-在线SPSS分析软件

SPSS分析SPSS教程PSM平行假设检验倾向得分匹配PropensityScoreMatchingSPSSAU

网页在线SPSS

倾向得分匹配PSM分析

Contents

1背景2

2理论3

3操作4

4SPSSAU输出结果5

5文字分析6

6剖析7

7疑难解惑8

倾向得分匹配(PSM),是一种将研究数据处理成‘随机对照实验数据’的方法,目的在于减少数

据偏差和混杂因素的干扰。PSM一般在计量研究,医学领域等有着广泛的使用。

比如:当前想研究‘读研究生’对于收入的帮助,当前有收集1000个研究数据,有的已经读

过研究生,有的没有读过研究生。一种简单的做法是直接对比‘读过’和‘没有读过’这两类群体的

收入差异。但这种做法似乎‘不妥’,因为父母学历,父母是否做教育工作等因素都会干扰到研究。

因此,PSM正是为了减少这种干扰。PSM可实现找到类似的两类人,他们的基本特征(比如父

母学历,父母是否做教育工作等)都基本一样,但惟一的区别在于‘是否读过’研究生。这样可减

少干扰因素差异带来的数据偏差和混杂干扰。

PSM一般用于计量研究里面,比如说某项‘政策’带来的效应研究。(比如是否开展‘禁塑令’,

‘是否垃圾分类’,‘是否提供失业培训’,‘是否减免中小企业税收’等政策)。

除此之外,PSM在医学领域使用也较为广泛,比如临床研究做实验时对照组数据的寻找。

比如想研究吸烟和心脏病之间的关系,是否吸烟两类群体个体匹配。‘为探讨某暴露或干预因素

和结局之间的关系,因此需要与对照组进行比较,实验和对照组研究时会有因素的干扰,PSM的

目的正是在于控制或减少非处理因素的干扰,突显处理因素效应情况’。研究因素是‘是否吸烟’,

其它因素都叫做非处理因素(比如年龄,身高,体重等等),PSM可以减少这些非处理因素的干扰。

SPSSAU-在线SPSS分析软件

倾向得分匹配PSM案例

Contents

1背景2

2理论3

3操作4

4SPSSAU输出结果5

5文字分析6

6剖析7

7疑难解惑8

1背景

当前有一项‘读研对于收入影响’的研究,共收集1000个研究对象(样本)。其中有的研究对

象‘读研究生’,有的研究对象‘没有读研究生’,希望研究是否读过研究生,对于年收入的影响情

况。数据最简单的处理是直接对比‘是否读研’两类群体的年收入差异。但这种做法有问题,因为

之前研究显示,父母学历,父母是否从事教育相关职业,都会对‘是否读研’,以及‘年收入’有着

干扰,即父母学历,父母是否从事教育相关职业这些因素为干扰因素,即使是都读研的两个人,

父母的背景差异也会干扰到年收入情况。

正是基于此原因,因而使用PSM进行数据匹配,以期望父母背景尽可能一致的两个人前提

下,分析是否读研时的年收入差异。

本次研究数据类似如下:‘父亲是否从事教育’和‘母亲是否从事教育’时,数字1表示从事教

育相关行业,数字0表示没有从事教育相关行业。‘父亲学历’和‘母亲学历’上,数字1表示‘本科’,

数字2表示‘硕士及以上’。是否读研上,数字1表示‘读过研究生’,数字0表示‘没有读研究生’。

SPSSAU-在线SPSS分析软件

2理论

接下来阐述下PSM的算法原理,想要进行PSM,其算法步骤共分为3步如下:

✓第1步:进行Logit模型构建(得到Pscore)。

将研究因素比如‘是否读研’作为因变量,将其它因素(干扰因素,即不关注的因素但可能会有

干扰的因素,比如父母学历,父母是否从事教育相关职业等)作为自变量X进行二元logit模型构

建,并且得到预测值即PScore值,PScore值代表了干扰

文档评论(0)

147****4623 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档