基于深度学习的癌症亚型鉴定方法的研究.docxVIP

基于深度学习的癌症亚型鉴定方法的研究.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于深度学习的癌症亚型鉴定方法的研究   摘要:海量的生物医学数据为癌症的机制发现和治疗提供了机遇,越来越多的工作集中于癌症亚型的鉴定。基于深度学习的方法能够提取生物医学数据的深层特征,提高亚型鉴定的准确性。该文主要分析了多种基于深度学习的癌症亚型鉴定方法,对研究更加灵活地亚型分析方法具有借鉴意义。   关键词:深度学习;癌症亚型;CNN;DBN;DBM   中图分类号:TP301 文献标识码:A 文章编号:1009--0172-02   1引言   随着生物医学技术的快速发展,有超过100种癌症被发现,在世界范围内癌症被认为是发病和死亡的主要原因之一。据世界卫生组织统计,全世界在XX年有1400万新生癌症病例,在XX年有880万人死于癌症。准确的癌症预后和治疗变得特别重要,而亚型鉴定则是个性化预后治疗癌症的关键。癌症亚型是根据单种癌细胞的一些特征所得到的特定种类的癌症。癌细胞的特征既有细胞水平的形态特征,也有分子水平的表达特征。   现有的癌症亚型鉴定通过统计学方法对病理图像,基因表达和临床信息等数据进行分析,从而完成单种癌症亚型的鉴定任务。这些鉴定方法对单种数据或者多种类型数据进行建模。例如,基于基因表达特征的支持向量机方法,基于整合多种分子数据的矩阵分解方法,以及基于分子和临床数据的多元比例风险回归方法。但是这些方法已经不能解决大量积累的生物分子数据所带来的挑战。此外,积累的医学图像数据集对准确快速地处理大规模图像数据带来了新的问题。深度学习的出现能够解决上述问题。   深度学习现在已经广泛应用在计算机视觉、自然语言处理和生物信息学等领域。深度学习在癌症亚型鉴定方面根据数据特点选择合适的网络结构,还可以结合不同的预处理方法构造功能特异的架构。现在使用的网络主要有全连接深度神经网络,卷积神经网络,深度信念网络和深度波尔兹曼机。本文对基于以上四个深度学习网络的癌症亚型鉴定方法进行了分析。   2癌症亚型鉴定方法   深度神经网络   深度神经网络广义上是多种深度学习网络的统称,狭义上是指全连接的多层神经网络结构。与简单的人工神经网络相比,DNN的多个隐层用来提取深层抽象特征。DNN的输入层、中间隐层和输出层可以使用全连接方式构建网络。   Yuan等人使用基于全连接的DNN方法,对多种癌症进行分类。该方法主要有三个步骤:过滤集合基因,减少稀疏性和建立全连接DNN分类器。集合基因的过滤是基于突变频率来确定有判别性的基因子集。该步骤的特点是使用全部癌症数据来反映基因之间的关联性,以及不需要突变数据分布的先验条件。减少稀疏性作为一种和集合基因过滤并列的预处理方法,将基因数据转为非零的索引值来降低稀疏性。然后将过滤的基因和非零索引相级连作为DNN的输入,从而完成对DNN分类器的训练。这种基于全连接的DNN分类器有着比支持向量机、K-近邻和朴素贝叶斯更好地分类能力。   卷积神经网络   卷积神经网络是一种用于满足最小化数据预处理要求的多层感知器,常常作为图像分类器。CNN一般有输入层,转化层和输出层,但其中转化层常由卷积层,池化层,全连接层和归一化层组成。CNN还需要选择合适的超参数,一般包括滤波器个数,滤波器的滑动步长和滤波器的形状等参数。在训练模型时,卷积神经网络使用反向传播算法。   Hou等人提出基于图像块的CNN方法,对全切片组织图像进行细胞水平的癌症分类。这个分类方法由图像块水平的模型和决策融合模型组成。图像块水平的模型是一种基于期望最大的方法,并与CNN相结合来输出图像块的预测。该模型先假设有二值隐变量来表示图像块是否有判别性,并初始化所有图像块为有判别性,接着训练CNN用于输出每个图像块的类别概率,然后选择具有较高概率的块作为有判别性的块,使用得到的判别性块作为输入直到EM迭代收敛结束。在图像块选择完成后,判别性块的直方图作为决策融合模型的输入。决策融合模型可以作为一种基于计数的两级多实例学习方法,具有比标准多实例学习假设更一般的假设。该模型使用多类逻辑回归方法或者支持向量机来预测图像的癌症类别。在非癌症的小尺寸图集上,这个基于图像块的CNN方法比基于图像的CNN方法有更好的结果。   Ertosun等人使用两级CNN完成对两种癌症的分类和分级任务。两级CNN先完成对癌症的分类任务,再完成对癌症的分级任务。该CNN架构导致网络层数变多,从而难以选择最优的CNN架构。一般的解决方法是每个CNN独立地训练,并通过评估多种类型的CNN结构,进而选择合适的CNN架构。   深度信念网络   深度信念网络本质是堆叠的受限玻尔兹曼机,即每个RBM的隐层输出作为下一个RBM的可视输入。学习DBN的过程主要有以下两个阶段。在预训练阶段,DBN循环所有层的RBM,逐层学习RBM的权重变量。在微调阶段,DBN用预处理阶段的权重来初始化

文档评论(0)

manyu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档