张楠 : 利用Monte Carlo方法研究匹配条件变化对于条件逻辑回 ….ppt

张楠 : 利用Monte Carlo方法研究匹配条件变化对于条件逻辑回 ….ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 利用Monte Carlo方法研究匹配条件变化对于条件逻辑回归结果的影响 河北医科大学第四医院信息中心 日本新潟大学医学部医疗信息研究室 张楠 背 景 条件逻辑回归分析模型(Conditional logistic regression model)是利用对照数据(Matched case-control data set)基于逻辑回归模型(Logistic regression model)进行统计分析的一种方法。 条件逻辑回归模型在医学相关研究中得到广泛应用,经常被用于回顾研究和前瞻研究。 数据匹配标准(1) 1 对照数据中的作为数据匹配的变量分布或者比例应当与病人组被用于匹配的变量分布应当近似。 2 被选为数据匹配的变量应当为独立变量,不会受到其他变量的影响。例如:年龄,性别。 数据匹配标准(2) 数据对照1 年龄 性别 癌症患者 60 男 正常人 60 男 数据对照2 年龄 性别 癌症患者 60 男 正常人 58 男 在数据匹配过程中,正常人的数据通过随机方法取得。 常见的数据匹配方法 1 在每一对数据中,病人组的匹配变量数值与对照组匹配变量数值网全相同。 2 在每一对数据中,病人组的匹配变量数值与对照组匹配变量数值存在一定程度的浮动( ± 1~±5)。 3 将匹配变量分组化,然后按照分组进行数据匹配。 研究目的及条件逻辑回归模型 我们设计了模拟程序用来发现当对照数据匹配标准发生变化时,条件逻辑回归模型的分析结果是如何变化的。分析的模型基于如下模型: 采用Monte Carlo方法的必要性 Time=1 因素 Odds Ratio 95% Confidence limits P value 吸烟 0.778 0.489-1.239 0.291 饮酒 4.535 2.684-7.622 0.001 饮茶 0.730 1.095-2.743 0.019 Time=2 因素 Odds Ratio 95% Confidence limits P value 吸烟 0.866 0.527-1.421 0.568 饮酒 4.566 2.714-7.684 0.001 饮茶 0.257 1.464-3.820 0.001 Time=3 因素 Odds Ratio 95% Confidence limits P value 吸烟 1.167 0.743-1.830 0.503 饮酒 3.510 2.169-5.680 0.001 饮茶 0.413 0.954-2.447 0.078 方法 1 利用模拟程序生成符合事先指定分布及比例的随机数,并根据匹配标准自动生成匹配数据。为了观察不同数据量下匹配标准变化的情况,我们模拟了4组不同数量的模拟数据。通过比较条件逻辑回归模型的系数以及P值等统计值观察匹配标准变化时对分析结果的影响。 2 我们将程序应用于真实的临床数据分析上,以观察对于匹配标准对于实际应用上的影响。 本次研究的数据模拟以及条件逻辑回归分析在R下完成。 模拟数据参数 变量 模拟病理组 模拟对照组 年龄(标准偏差) 60.00±5.00 50.00±5.00 性别(男/女) 70%/30% 50%/50% 男性吸烟与否(吸/不吸) 70%/30% 40%/60% 女性吸烟与否(吸/不吸) 3%/97% 1%/99% 男性饮酒与否(饮/不饮) 50%/50% 30%/70% 女性饮酒与否(饮/不饮) 1%/99% 1%/99% 合计 n* 10n* n*=(150,250,350,450) 模拟程序结果-回归参数变化趋势 吸烟变量回归参数变化趋势 饮酒变量回归参数变化趋势 模拟程序结果-P值变化趋势 吸烟变量P值变化趋势 饮酒变量P值变化趋势 随机数据匹配率 模拟数据量 匹配对数 匹配率 150 98 65.3% 250 172 68.8% 350 244 69.7% 450 316 70.2% 数据匹配过程均由程序根据指定的匹配标准随机选择数据自动完成。 真实数据的分布特点 变量 病例组 对照组 年龄(标准偏差) 60.67±9.18 51.03±9.74 性别(男/女) 420/148 1064/639 吸烟与否(吸/不吸) 292/276 654/1049 饮酒与否(饮/不饮) 211/357

文档评论(0)

aiwendang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档