缺失数据填补.pptxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

MissingDatainEpidemiologicalStudies;目录

CONTENT;;缺失数据是常见问题;

处理方法很关键

不同的方法会产生有偏的和/或低效的估计

两种情形:协变量缺失;结局和/或主要暴露的缺失

根本消除缺失的办法是在设计阶段做好防范工作,否则就要如实汇报处理方法的局限性和结果是否可靠

;常用方法:完整数据分析法(忽略含缺失值的数据)

若数据缺失率较小,则结果偏倚较小,效率降低较少

然而,该方法在大多数情况下是有偏的而且是低效的

;缺失数据的影响;缺失数据的类型;完全随机缺失(MCAR);随机缺失(MAR);非随机缺失(MNAR);Method;CompleteCase;Completecase---MCAR;CompleteCase---MAR;Completecase---MAR(multiplicative);Notes

如果缺失与另外一个协变量有关(吸烟),我们可以用四格表对协变量分层

只有在协变量与暴露和结局无关时才可以抵消f和g

对连续结局变量:即使缺失是乘法模型,完整数据分析法仍然会产生有偏的估计;若缺失不是乘法模型,那么很有可能是这种缺失机制:

即缺失依赖于结局,暴露,协变量,效应修饰因子。。。

;Simpleexample(n=1000)

肺癌发病风险与二氧化硅暴露

结局:肺癌(lungcan)

暴露:二氧化硅

混杂因素:吸烟史(smk)

;Completecase(n=838)

肺癌发病风险与二氧化硅暴露

结局:肺癌(lungcan)

暴露:二氧化硅

混杂因素:吸烟史(smk)

;Indicatormethod

创建一个指标变量

M=1表缺失部分协变量X

M=0表无缺失数据;缺失指标法

最终OR是三层的加权和,其中

X=0/1无偏估计

X=2有偏估计;;缺失指标法:简单例子;;换用完整数据法(n=804);缺失指标法---更复杂的模型;逆概率加权法(InverseProbabilityWeighting,IPW);基本步骤:

1:拟合

;填补法

概念:使用来源于已有数据的值替换缺失值

随机选择

概率原则(期望值基于完整数据);;;单次填补方法的分类

Unconditionalmean

Conditionalmean

Unconditionaldraw

Conditionaldraw

;

多重填补

填补为M个完整数据集

产生M个β的估计值β1…βM

最终的β估计值是β1…βM的均值

;多重填补的假设检验

无效假设H0:β=0

检验统计量:t值;多重填补的“M”:填补次数

M应该选择多大?

大多数情况下,不宜太大(拇指法则)

;极大似然估计

如果假设成立,极大似然估计将会是无偏且最高效的;总结

所有的处理方法都要基于一定的假设条件而且都存在一定程度的偏倚

有偏处理方法

完全数据法(除非数据缺失是MCAR)

缺失指标法

;THANKYOU

文档评论(0)

@@@ + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档