- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Genbank,EMBLE,DDBJ
一 前言
Genbank核酸序列数据库是由美国国立生物技术信息中心(NCBI)建立和维护的。它包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它的数据直接来源于测序工作者提交的序列。EMBL数据提交方式主要有三种,即通过Webin、Sequin或 Data Submission Form三种方式提交数据,目前EMBL数据库已停止接受email格式的提交方式。日本DNA数据库DDBJ(DNA Data Bank of Japan),于1984年建立,是世界三大DNA 数据库之一。
二 本论
2 Genbank简介
Genbank核酸序列数据库是由美国国立生物技术信息中心(NCBI)建立和维护的。它包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它的数据直接来源于测序工作者提交的序列;由测序中心提交的大量EST序列和其它测序数据;以及与其它数据机构协作交换数据而来。
2.1GenBank的序列提交
提交序列有两种方式,一个是在线的页面提交序列bankit,另一个是通过NCBI的Sequin软件提交序列。Sequin也是一种很好的利用了NCBI数据模型ASN.1编辑工具。
BankIt 用于一条或者少数条提交的基于WWW的提交工具软件,适合于独立测序工作者提交少量序列,而不适合大量序列的提交,也不适合提交很长的序列,EST序列和GSS序列也不应用于BankIt提交。BankIt是一系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。并且在提交前用 VecScreen 去除载体。
进入GenBank /genbank/ 点击BankIt
2、在BankIt使用的时候先进行注册,点击右上角的Sign in to NCBI,在如果使第一次使用点击Register for an account, 如果已经创建用户名则输入用户名、密码登录。
3、登录账号后点击New Submission
4、填写姓名、住址、电话、邮箱等基本信息,
点击Continue
5、得到序列的存取号,填写发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。
5.
6、Sequencing Technology 测序技术
如果你提交超过500个序列或者如果序列利用新一代测序技术产生此信息是必需的。
选择你获取这些序列的方法
7、Nucleotide界面:
选择序列合适公布
选择是否在此提交ONLY16S核糖体RNA的数据,然后选择Molecule Type分子类型、Topology拓扑结构、Genomic completeness基因组的完整性;填写上提交序列的数目,最后是可以直接提交所有的序列或者是提交已经准备的FASTA文件。
8、Set/Batch
9、Submission Category提交分类
说明你的序列是原始的或第三方的注释提交
10、Source Modifiers来源修饰符
Organelle/Location细胞器/定位
11、PCR Primers (Optional) PCR引物(可选)
12、Features (Overview) 特点(概述)
功能的添加可以通过添加列表上传或直接输入添加,可选其中一种方式。
13、Review Submission评论提交,检查完之后进行提交。
输入rice,单击search,得到下图
如果使批量下载则点击多个结果前的方框即可,如果下载一个只需要选择一个条目,选择完了之后就点击右上角的Send to,然后选择合适的格式即可。
2.3 Genbank返回结果含义
完整的GenBank数据库包括序列文件,索引文件以及其它有关文件。索引文件是根据数据库中作者、参考文献等子段建立的,用于数据库查询。
LOCUS 代码:所有的开始于LOCUS行,图中 LOCUS名称为序列代码NR_073583 ,序列代码开始于一个英文字母,总长度不能超过10个字符,第二个字符以后可以是数字或字母,所有字符均要大写。序列长度DNA或RNA。最后的是数据公开日期12-JAN-2013。
DEFINITION行(也称为“DEF”行)总结记录的生物意义。
ACCESSION检索号:是数据库中检索一个记录的主要关键词GenBank记录都只有一个ACCESSION行,而且一般只有一个检索号,称为主检索号码,图中为NR_073583。
VERSION 版本:检索号为NR_073583,gi号为441
您可能关注的文档
最近下载
- 2017-2018学年上学期学校工作计划(含中小学部)与2017-2018学年上学期学生会工作总结合集.doc
- 松下面包机SD-PT1000使用说明书.pptx
- 中国古典小说巅峰-四大名著鉴赏超星尔雅满分答案...pdf
- 第38届中国化学奥林匹克(初赛)试题及参考答案.pdf VIP
- 四年级数学 三位数乘两位数笔算练习题100道.doc VIP
- 产业园区招商说辞、招商话术模板(通用).docx VIP
- 苏教版科学三年级上册全册同步练习(含答案).pdf
- 全国传染病信息报告管理工作技术指南附有答案.docx
- 内控合规知识考试题及答案.doc
- 第1章 有理数-有理数加减乘除乘方混合运算专项训练(学生版).pdf VIP
文档评论(0)