基于SVM算法的癌症基因数据分类研究-控制工程专业论文.docxVIP

基于SVM算法的癌症基因数据分类研究-控制工程专业论文.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM算法的癌症基因数据分类研究-控制工程专业论文

苏州大学学位论文使用授权声明 本人完全了解苏州大学关于收集、保存和使用学位论文的规定, 即:学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸 质论文的内容相一致。苏州大学有权向国家图书馆、中国社科院文献 信息情报中心、中国科学技术信息研究所(含万方数据电子出版社〉、 中国学术期刊(光盘版〉电子杂志社送交本学位论文的复印件和电子 文档F 允许论文被查阅和借阅,可以采用影印、缩印或其他复制手段 保存和汇编学位论文,可以将学位论文的全部或部分内容编入有关数 据库进行检索。 涉密论文口 本学位论文属 在一一一年一一月解密后适用本规定。 非涉密论文 d 导师签名:乡彷u7 论文作者签名:在多。饥 日期 J.)IJ ft 0J11 I18 日期zρIJ芬ρJ4116 基于 SVM 算法的癌症基因数据分类研究 基于 SVM 算法的癌症基因数据分类???究 中文摘要 癌症是对人类生命构成严重威胁的主要疾病之一,而癌症的早诊断是提高癌症患 者成活率的关键。随着 DNA 微列阵技术的飞速发展,海量的癌症基因表达数据得以 积累。在分子生物学的基础上,如何根据这些庞大的基因表达数据进行癌症的早期诊 断已成为后基因组时代的研究热点,但是癌症基因表达数据一般都具有高维数、样本 数量少、非线性等特征,这就给基因数据的分类带来了很多困难。 针对以上基因表达数据的普遍特征,本文运用一种基于支持向量机的分类方法对 癌症数据样本进行分类。SVM是在统计学理论的基础上发展起来的新一代机器学习 方法,它采用结构风险化原则,代替了经验最小化原则,成功应用核函数将非线性问 题转化为线性问题,在解决有限样本、非线性及高维模式识别问题中表现出了许多特 有的优势。 尽管SVM有效的解决了欠学习和过学习的问题,但是基因表达数据样本数少、 维数高的特性对数据分类准确度的影响难以避免。如果直接对原始数据进行分类,工 作量大且得不到比较满意的结果。因此,数据降维就成为癌症基因数据分类的关键性 问题。本文首先运用数据降维方法,对原始基因表达数据进行降维,得到较低维度的 数据之后,再对其进行SVM分类。通过多种降维方法的比较以及SVM参数的合理设 置,可以取得较高的癌症诊断精度。文章中使用的数据降维方法有稀疏主成分分析, 广义判别分析和拉普拉斯特征值映射法等。 本文的研究重点是如何利用降维方法优化数据,通过选择两组网络公开的数据集 进行相关实验,可得对于Prostate Tumor数据,GDA的降维效果最佳,而对于Leukemia 数据,MDS的降维效果最佳。实验结果表明:寻求最优的降维方法以及合理的调整 SVM参数,可以有效的优化基因数据,提高SVM的分类性能,取得较高的分类精度。 关键字:DNA微列阵;基因表达数据;降维;SVM;数据分类 作 者:黄燕红 指导教师:翁桂荣 A Study of Cancer Gene Data Classification Based on SVM Algorithm A Study of Cancer Gene Data Classification Based on SVM Algorithm Abstract Cancer is one of the main diseases posing serious threats to human. The early diagnosis of cancer is key to improve the survival rate of patients. With the rapid development of DNA microarray technology, vast amounts of cancer gene expression data have been collected. On the basis of molecular biology, making use of the huge gene expression data for early cancer diagnosis has become a hot topic in the post genome era. However, gene expression data always has the characters of small sample size, high dimension and nonlinear. To solve the problems above-mentioned, this paper introduced a classification method based on SVM (support vector machine), which can b

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档