- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因组注释
基因组注释
基基因因组组注注释释
图1 基因组重叠连续群测试序列注释结果
基因组注释(Genome annotation) 是利用生物信息学方法和工具,对基因组所有
基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。基因组注
释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因
组序列中所有基因的确切位置。从基因组序列预测新基因,现阶段主要是3 种方法的
结合: (1) 分析mRNA 和EST 数据以直接得到结果; (2) 通过相似性比对从已知基因
和蛋白质序列得到间接证据[1 ] ; (3) 基于各种统计模型和算法从头预测。对预测出的
基因进行高通量功能注释可以借助于以下方法,利用已知功能基因的注释信息为新基
因注释: (1) 序列数据库相似性有哪些信誉好的足球投注网站; (2) 序列模体(Motif) 有哪些信誉好的足球投注网站; (3) 直系同源序列聚
类分析(Cluster of orthologousgroup ,COG) [2 ] 。随着微生物全基因组序列测定速率
的加快,开发有 Web 接口的高效、综合基因组注释系统十分要。近年来,国际上已有
一些这样的工具,如基于 Java 的微生物基因组数据库接口。尽管 JMGD 提供了一个
很好的图形化接口程序,却并不具有基因组自动注释功能。德国国家环境和健康研究
中心开发的蛋白质摘录、描述和分析工具(Protein extrac2tion , description , and
analysis tool ,PEDANT) 是大型基因组分析系统,整合了大量基因组功能信息和结构
信息。PEDANT 注释功能强大[3 ] ,适用范围广,但没有便于操作的图形界面,而且需要
较强的硬件系统支持。目前,微生物基因组全序列测定通常由中小实验室独立完成,有
必要开发和集成基于 PCPLinux 系统并以免费数据库管理系统、免费软件和公共数据
库资源为主的基因组信息注释系统。
1 系统和方法
111 开发环境
本系统基于 PC 微机,操作系统为 Linux。测试系统为 PIII 550 双CPU 微机,内
存1GB ,运行 RedHat 710 Linux 系统。数据库管理系统使用 MySQL ,Web 服务器程
序使用 Apache ,应用程序接口用 Perl 脚本语言编写。本系统也可在单 CPU 微机上
运行,内存不小于512MB。所有系统软件和应用软件均可以从 Internet 网上免费获得。
112 测试数据
本系统用蓝细菌( Synechococcus sp. ) PCC7002 基因组初步拼接所得最大重
叠连续群(Contig) 作测试数据,共303247bp 。
113 MGAP 的基因组注释系统
基因组注释系统是 MGAP 的核心,整合了许多常用的基因识别和蛋白质功能预
测软件,包括 GeneMarks、IPRsearch、BLASTPGP 和FASTA3 等,以及多个数据库,
如非冗余蛋白质序列数据库(Non redundant , NR) 、已知三维空间结构的蛋白质序列
数据库(PDBSeq) 、国际蛋白质资源信息系统( InterPro) [6 ] 和直系同源蛋白质家族
数据库(Cluster of orthologousgroups ,COG) 等,编写了相应的模块进行自动操作,并
把每一步注释结果导入数据库中。MGAP 整合的一般模块,可以被其他任何一种微生
物基因组直接使用。不同实验室可根据实际研究需要,增加相应模块或数据,如蓝细菌
Anabaena sp. strain PCC 7120 的蛋白质序列库等。
基因识别是 MGAP 的第一步,本系统采用微生物基因组基因识别最为权威的
Gene2Marks 软件进行基因预测,通过 http :PPopal
.PGeneMarkPgenemarks. cgi 网站提交重叠连续群测试序列
(303247bp) ,使用 GeneMarks 缺省参数,预测得到279 个基因。
然后用 MGAP 的数据加载模块(Loaddata) 将预测结果导入 ORF 表中。
114 MGAP 的用户接口
用户接口用于展示注释结果,提供易于操作和分析平台。本系统用户接口基于
Web 设计开发,用户可通过浏览器访问基因组注释系统,包括基因组环状图展示、基因
和 ORF 在染色体上分布图,并对注释信息进行检索。基因组环状基因分布图构建基于
如下信息:预测所得基因的起始位置、长度,编码基因的正负
您可能关注的文档
最近下载
- 2025年山东省青岛市黄岛区高三下学期3月联考数学试卷.docx VIP
- 2025年非高危行业生产经营单位主要负责人及安全管理人员安全生产知识和管理能力试题及答案.docx VIP
- 横河UR SR系列智能有纸记录仪.pdf
- 远程控制台.原理及操作.ppt VIP
- 京瓷 TASKalfa 3501i 4501i 5501i 复印机中文维修手册.pdf VIP
- 适应人工智能的中小学教学模式创新探索教学研究课题报告.docx
- 高中运动学.doc VIP
- 糖尿病患者的护理PPT课件.pptx VIP
- 直齿轮和斜齿轮承载能力计算 第31部分:微点蚀承载能力算例.pdf VIP
- 《2024年中国体外诊断(IVD)行业深度研究报告》.pdf VIP
文档评论(0)