用支持向量机预测线虫基因选择性剪切位点.pdfVIP

用支持向量机预测线虫基因选择性剪切位点.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用支持向量机预测线虫基因选择性剪切位点.pdf

用支持向量机预测线虫基因选择性剪切位点1 杨乌日吐,李前忠,杨科利,林昊 内蒙古大学理工学院物理系,呼和浩特 (010021) E-mail:qzli@ 摘 要:基因的选择性剪切使得在 DNA 上一段相同的序列翻译成两个或两个以上不同的蛋 白质序列。在选择性剪切中,供体位点分为选择性供体位点和组成性供体位点,受体位点为 选择性受体位点和组成性受体位点。基于 EBI 中的线虫基因选择性剪切位点数据库,选取 不同位点的单碱基和三联体频数作为参数,利用位置权重矩阵和离散增量算法结合支持向量 机,对选择性剪切供体(受体)位点进行预测。对选择性供体位点和选择性受体位点的预测成 功率分别为 63.78%和 72.63% ,特异性分别为68.02%和 83.96%。 关键词:选择性剪切;供体位点;受体位点;支持向量机 中图分类号:Q 61 文献标识码:A 1. 引 言 随着大规模测序工作的进行,DNA 序列数据库中的数据量越来越多。如何从这些已知 的序列中利用生物信息学方法确定翻译起始点、转录启起始点和外显子/ 内含子剪切位点等 功能位点是一个尚待解决的问题。由于真核生物基因组中存在大量的内含子,外显子/ 内含 子剪切位点的识别是一个十分困难的问题[1] 。尽管目前发展了不少剪切位点预测软件,且预 测率也在不断提高[2],但这些预测软件都很少预测选择性剪切位点。从而对其进行预测。早 在1978年Gilbert Walter就提出了选择性剪切这一概念[3] 。选择性剪切的出现解释了一个RNA 序列编码多个蛋白质的问题[4-5] 。早期的研究认为只有5%的高等真核生物基因存在选择性剪 切[6] [5] ,在以后的研究中发现40-60%人类基因存在选择性剪切 ,最近对人类第21和22号染色 [7] 体的研究指出高达79-88%的基因存在选择性剪切 。 目前选择性剪切位点的辨认主要依据四点:1.由表达序列标签或信使RNA提供得到的转 录作为直接依据[5] [8] ;2.基于微阵列分析得到选择性剪切位点 ;3.用比较基因组学方法预测物 种间保守的选择性外显子[9-10] 。4.运用支持向量级和神经网络等算法进行理论预测[11-12] 。选 择性剪切的机制非常复杂,完全了解其剪切机制是一个非常困难的工程。过去从以下四点对 选择性剪切进行了生物信息学分析:第一,按细胞和组织的不同分析了选择性剪切模式,对 各种模式进行了系统的统计研究[13] 。第二,比较了含选择性剪切的基因和不含选择性剪切 [14] [9-12] 的基因的差别 。第三,对各种选择性剪切形式进行了统计分析 。第四,用理论方法预 测选择性供体位点、组成性供体位点、选择性受体位点和组成性受体位点[11-12] 。 以前的选择性剪切位点的研究都把选择性剪切位点按选择性剪切形式的不同进行分类 研究[11-12] 。但是一个选择性剪切事件常常包括多个选择性剪切形式,或不同剪切模式产生的 两个选择性剪切事件在相邻很近的位置出现[15-16],不同选择性剪切形式产生的选择性剪切位 点之间存在着区别于组成性剪切位点的保守性底等共性[11][17] 。 线虫作为一种模式生物,除了具有生命周期短、繁殖容易和基因组小而紧凑等特点外, 50% 以上的人类基因序列都与线虫基因明显匹配[18] ,在定位克隆测序的84个人类疾病基因 中,53个与线虫的基因高度保守[19] 。拥有这些优点的线虫基因组全序列是研究多细胞动物 选择性剪切机制的最好的数据[20] 。因此,本文以线虫基因组为研究对象,构建选择性供体(受 体)位点与非选择性供体(受体)位点数据集,利用位点保守性

您可能关注的文档

文档评论(0)

尐丶丑 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档