Genbank,EMBLE,DDBJ.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Genbank,EMBLE,DDBJ

一 前言 Genbank核酸序列数据库是由美国国立生物技术信息中心(NCBI)建立和维护的。它包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它的数据直接来源于测序工作者提交的序列。EMBL数据提交方式主要有三种,即通过Webin、Sequin或 Data Submission Form三种方式提交数据,目前EMBL数据库已停止接受email格式的提交方式。日本DNA数据库DDBJ(DNA Data Bank of Japan),于1984年建立,是世界三大DNA 数据库之一。 二 本论 2 Genbank简介 Genbank核酸序列数据库是由美国国立生物技术信息中心(NCBI)建立和维护的。它包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它的数据直接来源于测序工作者提交的序列;由测序中心提交的大量EST序列和其它测序数据;以及与其它数据机构协作交换数据而来。 2.1GenBank的序列提交 提交序列有两种方式,一个是在线的页面提交序列bankit,另一个是通过NCBI的Sequin软件提交序列。Sequin也是一种很好的利用了NCBI数据模型ASN.1编辑工具。 BankIt 用于一条或者少数条提交的基于WWW的提交工具软件,适合于独立测序工作者提交少量序列,而不适合大量序列的提交,也不适合提交很长的序列,EST序列和GSS序列也不应用于BankIt提交。BankIt是一系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。并且在提交前用 VecScreen 去除载体。 进入GenBank /genbank/ 点击BankIt 2、在BankIt使用的时候先进行注册,点击右上角的Sign in to NCBI,在如果使第一次使用点击Register for an account, 如果已经创建用户名则输入用户名、密码登录。 3、登录账号后点击New Submission 4、填写姓名、住址、电话、邮箱等基本信息, 点击Continue 5、得到序列的存取号,填写发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。 5. 6、Sequencing Technology 测序技术 如果你提交超过500个序列或者如果序列利用新一代测序技术产生此信息是必需的。 选择你获取这些序列的方法 7、Nucleotide界面: 选择序列合适公布 选择是否在此提交ONLY16S核糖体RNA的数据,然后选择Molecule Type分子类型、Topology拓扑结构、Genomic completeness基因组的完整性;填写上提交序列的数目,最后是可以直接提交所有的序列或者是提交已经准备的FASTA文件。 8、Set/Batch 9、Submission Category提交分类 说明你的序列是原始的或第三方的注释提交 10、Source Modifiers来源修饰符 Organelle/Location细胞器/定位 11、PCR Primers (Optional) PCR引物(可选) 12、Features (Overview) 特点(概述) 功能的添加可以通过添加列表上传或直接输入添加,可选其中一种方式。 13、Review Submission评论提交,检查完之后进行提交。 输入rice,单击search,得到下图 如果使批量下载则点击多个结果前的方框即可,如果下载一个只需要选择一个条目,选择完了之后就点击右上角的Send to,然后选择合适的格式即可。 2.3 Genbank返回结果含义 完整的GenBank数据库包括序列文件,索引文件以及其它有关文件。索引文件是根据数据库中作者、参考文献等子段建立的,用于数据库查询。 LOCUS 代码:所有的开始于LOCUS行,图中 LOCUS名称为序列代码NR_073583 ,序列代码开始于一个英文字母,总长度不能超过10个字符,第二个字符以后可以是数字或字母,所有字符均要大写。序列长度DNA或RNA。最后的是数据公开日期12-JAN-2013。 DEFINITION行(也称为“DEF”行)总结记录的生物意义。 ACCESSION检索号:是数据库中检索一个记录的主要关键词GenBank记录都只有一个ACCESSION行,而且一般只有一个检索号,称为主检索号码,图中为NR_073583。 VERSION 版本:检索号为NR_073583,gi号为441

文档评论(0)

kakaxi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档