癌症基因标签.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2010年全国研究生数学建模比赛A题 确立肿瘤的重要基因信息 ——提取基因图谱信息方法的研究 癌症起源于正常组织在物理或化学致癌物的引诱下,基 因组发生的突变,即基因在结构上发生碱基对的组成或摆列 序次的改变,因此改变了基因本来的正常散布(即所包括基 因的种类和各种基因以该基因转录的mRNA的多少来权衡的 表达水平)。所以商议基因散布的改变与癌症发生之间的关 系拥有深远的意义。 DNA微阵列(DNAmicroarray),也叫基因芯片,是近来 数年发展起来的一种能快速、高效检测DNA片段序列、基因 表达水平的新技术。它将数量从几百个到上百万个不等的称 之为探针的核苷酸序列固定在小的(约1cm2)玻璃或硅片等 固体基片或膜上,该固定有探针的基片就称之为DNA微阵 列。依据核苷酸分子在形成双链时按照碱基互补原则,便可 以检测出样本中与探针阵列中互补的核苷酸片段,进而获取 样本中关于基因表达的信息,这就是基因表达谱,所以基因 表达谱能够用一个矩阵或一个向量来表示,矩阵或向量元素 的数值大小即该基因的表达水平(见附件)。 随着大规模基因表达谱(Geneexpressionprofile,或 称为基因表达散布图)技术的发展,人类各种组织的正常的 基因表达已经获取,各种病人的基因表达散布图都有了参照 的基准,所以基因表达数据的解析与建模已经成为生物信息 学研究领域中的重要课题。若是能够在分子水平上利用基因 表达散布图正确地进行肿瘤亚型的鉴别,对诊断和治疗肿瘤 拥有重要意义。因为每一种肿瘤都有其基因的特点表达谱 (见附图)。从DNA芯片所丈量的数不胜数个基因中,找出 决定样本类其余一组基因“标签”,即“信息基因”(informative genes)是正确鉴别肿瘤种类、给出靠谱诊断和简化实验分 析的重点所在,同时也为抗癌药物的研制供给了捷径。 平时因为基因数量很大,在判断肿瘤基因标签的过程 中,需要剔除掉大批“没关基因”,进而大大减小需要找寻的致癌基因范围。事实上,在基因表达谱中,一些基因的表达水平在全部样本中都特别凑近。比方,很多基因在急性白血 病亚型(ALL,AML)两个种类中的散布无论其均值仍是方差均无显然差别,能够以为这些基因与样本种类没关,没有对样本种类的鉴别供给实用信息,反而增添信息基因找寻的计算 复杂度。所以,一定对这些“没关基因”进行剔除。1999年 Science》发布了Golub等针对上述急性白血病亚型鉴别与信息基因采用问题的研究结果[1]。Golub等以“信噪比” (Signaltonoiseratio)指标作为权衡基因对样安分类贡献大 小的量度,采纳加权投票的方法进行亚型的鉴别,仅依据72个 样本就从7129个基因中选出了50个可能与亚型分类相关的信息基因。Golub的工作大大减小了决定急性白血病亚型 差别的基因范围,给出了亚型识其余基因依据,富饶创立性。 Guyon等则利用支持向量机的方法再从中选出了8个可能 的信息基因[2]。 但信噪比必然不是权衡基因对样安分类贡献大小的唯一标准,肿瘤是致癌基因、抑癌基因、促癌基因和蛋白质经过多种方式作用的结果,在确立某种肿瘤的基因标签时,应 该想法充分利用其余有价值的信息。有专家以为[3]在基因分类研究中忽略基因低水平表达、差别不大的表达的偏向应该 被纠正,与临床问题相关的主要生理学信息(见问题4)应该交融到基因分类研究中。 面对提取基因图谱信息这样前沿性课题,命题人依据自己科学研究的经历和思虑,猜想以下几点是解决前沿性课题的有价值的工作。这类猜想是科学研究中的重要环节,自然猜想不会总是可行的,更不必然总是正确的。但不探究就不能够前进,若是能够经过数学建模,获取的部分结果能够旁证你们的猜想或为新探究供给若干依据,就很有价值。我们的目的可是给研究生以启示,激励研究生培育这样的创立性发现的能力。所以研究生完整能够独立设计自己的技术路线,只要能够有效提取附件的基因图谱信息就行。 1)因为基因表示之间存在着很强的相关性,所以关于某种特定的肿瘤,忧如会有大批的基因都与该肿瘤种类鉴别相关,但一般以为与一种肿瘤直接相关的突变基因数 目极少。关于给定的数据(见附件),怎样从上述见解出发,选择最好的分类要素? 2)相关于基因数量,样本经常很小,若是直接用于分类会造成小样本的学习问题,怎样减少用于分类识其余基 因特点是分类问题的核心,事实上只有当这类特点较少时,分类的收效才更好些。关于给定的结肠癌数据怎样从分类的角度确立相应的基因“标签”? 3)基因表达谱中不行防备地含有噪声(见1999年Golub在《Science》发布的文章),有的噪声强度甚至较大, 对含有噪声的基因表达谱提守信息时会产生误差。经过建立噪声模型,解析给定数据中的噪声能否对确立基因标签产生有益的影响? 4)在肿瘤研究领域平时会

文档评论(0)

158****3214 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档