Negativetrainingsamplesarealsoimportantformining.pptVIP

Negativetrainingsamplesarealsoimportantformining.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Negativetrainingsamplesarealsoimportantformining

Negative training samples are also important for mining microRNAs from genome-scale data BY Leyi Wei 背景介绍 microRNA 和 microRNA precursor (1)microRNA是一类长度大约为22nt的非编码RNA,与参与调控细胞过程,近期研究发现与疾病也有很大关联,发掘microRNA意义重大。 (2)microRNA precursor(pre-miRNA) 俗称为前体microRNA。 简单来说microRNA与pre-miRNA的关系就是: pre-miRNA包含着microRNA。 当然不仅仅是简单的包含,这只是个前提。Pre-miRNA的序列是能形成典型的发卡环(hairpin)结构。 The pathway of microRNA in mammals 预测microRNA的方法 Comparative methods 基于同源信息 ,序列保守性信息等等,只 能预测保守的microRNA Non -- comparative methods 其中很多方法都是基于机器学习算法, 能够预测非保守的microRNA 影响机器学习的因素 1. 分类器 和 特征 在目前的大多数方法都集中于对分类器很特征的开发 而性能提高的却不是很多。 训练集 很少的方法会去研究训练集的选取,特别是反例的选取。 在机器学习方法中训练集一般是由:正例(real pre-miRNA)和反例 (pseudo pre-miRNA)所组成。 正例 是由实验验证过的real pre-miRNA 组成的 反例 则是由pseudo pre-miRNA组成的,这是一类和正例具有非常相似特征的序列,也具有典型的发卡环。由于与real pre-miRNA的极其相似,所以被应用于作为反例集。 训练集如何影响分类器性能呢? 正反例的相似性高往往能得到高的性能 现有的少量方法也有致力于反例的提取,我们发现多数的方法都是用简单的过滤在CDS上选取与正例相似的,但是用这些反例组成的训练集真的能得到高的分类器性能吗? (实验设计)用我们的测试集做测试: ROC- analysis 实验总结 在对正例进行预测时,现有的方法都表现出差不多的性能,与我们的方法相当。 而在预测反例时,现有方法性能表现不一,都比较差。导致了分类器的性能较差。这说明现有方法在预测反例集是不够有效的 基于我们负集训练的效果 Triplet-SVM classifier 基于我们负集训练的效果 Mirident-classifier (Table) Mirident-classifier (Figure) Our ensemble classifier based on this negative set Our ensemble classifier performance 实验设计: 由于用的是联合分类器,我们与其单一分类器做了比较,看是否有提高性能。 Feature set performance 实验设计: 由于我们主体的特征集都是用别人的,加上自己提出的三个特征,看是否这三个特征会提高分类器性能 mirnaDetect 基于我们的之前的分类器系统,还结合使用了有哪些信誉好的足球投注网站算法,我们开发出了能在基因组中挖掘pre-miRNA的程序 mirnaDetect 算法流程: 投稿经验 作为一个菜鸟,一篇文章都还没有发成功,但是很愿意很大家投稿时的感受哈~ 主要针对投国外期刊(SCI): (1)投哪? 怎么投? 一开始, 听老师的。一般作为菜鸟肯定不知道哪些期刊好, 哪些坏,听老师的,过来人有经验。一般的原则就是从高往低的投。幸运的话,高水平的期刊往往能返回一些你的文章的命门,建议先投会议(会议往往拒了你,也会给你点意见的)。 当然到了你自己对这领域有所了解,就可以自主选择期刊了。 (2)文章格式。 选择完 期刊了,注意有些期刊还会要求你文章的格式问题,如果是会议的话都会有模板,一般他们的网站上都有。 (3)有些会要求要写cover letter . 需要的话找我要模板。 (4) 终于投

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8010045112000002

1亿VIP精品文档

相关文档