- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质分类测中的新方法研究
I I I II IIIIIII
㈩III IIJ III
Y1
746615
摘要
摘 要
蛋白质结构与功能预测是蛋白质组学中一个发展已久且极具挑战性的研究
热点,已成为后基因组时代生命科学中的重大研究课题之一。随着现代生物科
学与技术的迅速发展,大量蛋白质序列数据不断涌现,深入研究这些序列数据
进而达到对蛋白质化学和生物意义的深入理解,是现代生物信息学研究的主要
任务。尽管蛋白质的结构和功能可以通过实验方法来确定,但采用实验方法具
有耗时和费用昂贵等不足。因此,发展仅仅基于蛋白质氨基酸序列就能自动可
靠地对蛋白质结构与功能进行预测的方法具有十分重要的理论意义和实用价
值。基于蛋白质结构与功能的研究现状,本文创新性地提出将支持向量机与小
波变换有机结合,构建了一小波支持向量机新模型,用于蛋白质结构与功能的
分类预测,取得的主要成果如下:
1.将小波支持向量机模型用于G蛋白质偶联受体家族的预测。预测模型主
要包括三个步骤:首先利用氨基酸物理化学性质将蛋白质氨基酸序列转换为数
字信号,再利用离散小波变换对氨基酸序列进行分解,提取G蛋白质偶联受体
家族的特征向量,同时对小波基和分解层次优化选择,最后将所获得的特征向
量输入到支持向量机进行分类预测。预测分为三个层次进行:首先分类识别G
蛋白偶联受体三个家族,再进一步确认A家族类视紫红质受体蛋白的三个亚家
族,最后确认G蛋白偶联受体的亚亚家族。小波支持向量机对G蛋白偶联受体
三个层次的蛋白质家族预测准确率分别为99.72%、97.64%和99.20%,与文献结
果相比,本方法具有预测简单、直观和预测准确率高等优点。
2.将所构建的小波支持向量机模型用于酶家族和氧化还原酶亚家族的分类
识别。酶蛋白分为六类家族,其中氧化还原酶含有16类亚家族,为了解决多类
分类难题,本文分别采用一对一和一对多的分类策略对酶家族数据集C1200和
C2640进行Jackknife检验,预测准确率分别为91.90%和99.17%,明显优于文献
报道方法。同时,本文还对小波分解尺度、小波函数、支持向量机核函数以及
氨基酸物理化学性质等参数进行了探讨和优化。结果表明,离散小波能有效地
解析氨基酸序列信号,并有效地从小波分解系数中提取出酶蛋白的结构特征,
从而获得了极高的预测准确率。
3.将小波支持向量机模型与多类氨基酸物理化学性质相融合,利用小波变
摘要
换多分辨原理对氨基酸序列进行特征提取,进而将筛选的特征向量输入到支持
向量机中用来识别蛋白质二级结构。采用文献常用的蛋白质数据集对模型进行
jackknife检验,结果令人满意。同时,还深入研究了低同源性蛋白质序列对预测
1
准确率的影响,即分别采用W1
23%。上述结果表明,本方法有效地克服了低同源性对理论预测方法的影响,满
足生物信息学对蛋白质结构预测的要求。
以上基于小波支持向量机模型的各类蛋白质分类预测技术都已编写了较完
整的自动运行程序,可共享使用。本文获得了国家自然科学基金和江西省自然
科学基金的资助。
关键词:离散小波变换;支持向量机;蛋白质家族;氨基酸物理化学性质;
分类预测 .
11
Abstract
Abstract
Withthe of is an
approachpost—genomeera,proteomicsbecomingim
文档评论(0)