基于Bayes和组合赋权法的乳腺癌病的判别分析数学建模.docVIP

基于Bayes和组合赋权法的乳腺癌病的判别分析数学建模.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Bayes和组合赋权法的乳腺癌病的判别分析数学建模

第八届数学建模竞赛 论文题目:基于Bayes和组合赋权法的乳腺癌病的判别分析(B) 摘 要: 本文主要基于Bayes判别分析和组合赋权赋权法,通过对影响患乳腺癌病的指标进行分析研究来评估一个人患乳腺癌风险高低。 问题一:首先,对数据进行预先分析,找出单个指标与患乳腺癌病之间的影响关系;然后基于事先的分析,我们通过组合赋权法,确定各个指标对于患乳腺癌病影响的大小即是权重大小,分析出重要指标;最后通过Bayes判别分析,把患病与不患病的人分为两类,综合考虑各个指标的综合影响,建立评估模型。 问题二:基于问题一的数学模型,我们首先计算出患乳腺癌的概率与不患乳腺癌的概率,再用回代法求出模型的误判率,给出患病风险的评估。 问题三:分别计算加上变量11前后变量10的权重与变量10,11患乳腺癌风险权重之和是否有变化,再求出变量之间的的相关系数,分析各变量之间的影响关系;最后通过聚类分析优化指标。 问题四:基于我们所建立的评估模型,重点分析一些有关饮食的指标对于患乳腺癌病的影响,从而给出我们的预防建议。 关键词: Bayes判别 变异系数赋权 Critic赋权 回代法、相关系数 参赛编号 (由组委会填写) 1、问题的重述 乳腺是由皮肤、纤维组织、乳腺腺体和脂肪组成的,乳腺癌是发生在乳腺腺上皮组织的恶性肿瘤。乳腺癌中99%发生在女性,男性仅占1%。目前乳腺癌已成为威胁女性身心健康的常见肿瘤。全球乳腺癌发病率自20世纪70年代末开始一直呈上升趋势。美国8名妇女一生中就会有1人患乳腺癌。中国不是乳腺癌的高发国家,但不宜乐观,近年我国乳腺癌发病率的增长速度高出高发国家1~2个百分点。据国家癌症中心和卫生部疾病预防控制局2012年公布的2009年乳腺癌发病数据显示:全国肿瘤登记地区乳腺癌发病率位居女性恶性肿瘤的第1位,女性乳腺癌发病率(粗率)全国合计为42.55/10万,城市为51.91/10万,农村为23.12/10万。 附件给出了美国关于乳腺癌的一项调查数据,调查样本为年龄在25-50岁之间的3145名女性,调查信息包括年龄、贫困指标、家族史、饮食习惯等可能与乳腺癌相关的各项指标,共11列,具体如下: 变量 备注 1 Breast cancer 1=yes, 0=no 2 Age/25 年龄/25 3 Poverty index ratio 当年家庭总收入/贫困线基准收入 4 Body mass index/100 身高体重指数为体重与身高的平方之比 5 Alcohol 是否饮酒:1=yes, 0=no 6 Family history 乳腺癌家族史:1=yes, 0=no 7 Age at menarche 初潮年龄:不超过12者为1,其余为0 8 Menopausal status 绝经状态:1=pre-, 2=peri-, 3=post-menopausal 9 Race 种族:1=白人,2=其他 10 Saturated fat/100 摄入饱和脂肪量/100 11 Calories/5000 摄入卡路里量/5000 其中,第10和11列变量是饮食习惯变量,是被调查者回忆出调查时刻前24小时的进食情况,再推算而得。 请结合附件数据(见文件dataset.xls),分析变量2至10与乳腺癌的关系,给出数学模型。 基于你的数学模型,对女性患乳腺癌风险进行评估。 有文献指出,加入变量11时,会使得变量10对患乳腺癌风险影响的显著性发生变化。请围绕这一现象展开探讨,分析各变量之间的影响关系。 结合你的研究结果,给出一篇关于饮食健康与乳腺癌预防的建议报告。 ,确定各个指标对于患乳腺癌病影响的大小即是权重大小,分析出重要指标。最后通过Bayes理论,综合考虑各个指标的综合影响,给出整体影响的数学模型。 对于问题二:基于问题一的数学模型,我们计算出患乳腺癌的概率与不患乳腺癌的概率,若患病概率大于不患病概率则患乳腺癌风险较大,反之,亦然。 最后用回代法求出模型的误判率。再分析出一些重要指标。 问题三:分别计算加上变量变量变量分析各变量之间的影响关系,可对指标进行进行进一步优化。 问题四:基于我们所建立的评估模型,重点分析一些指标对于患乳腺癌病的影响,从而给出我们的预防建议。 3、模型假设 1)在该组数据中除了列出来的因素之外的内在或环境因素均视为所有人都处于同等水平。 2)各个变量不能存在多重共线性。 3)每个变量在各类中的取值存在显著差异。 4)在实际生活中,改组调查数据是动态的受到多种其他因素所影响,这里忽略 。 5)这些数据的微小波动,认定数据是恒定的。 6)认定被调查人给出的数据是真实的。 7)认定这些数据具有时效性,且在有效范围之内。 4、 符号说明

文档评论(0)

2017meng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档