- 1、本文档共115页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章生物信息学资源与数据挖掘工具
一、国外重要生物信息中心 NCBI 美国国家生物技术信息中心(National Center for Biotechnology Information) 前身是NIH所属的一个研究所的计算生物学研究室,1988年独立为NCBI,形式上属于国家医学图书馆(National Library of Medicine/NLM) 管理着许多著名数据库,如GenBank、Medline、dbSNP、COG、OMIM等 提供Entrez、BLAST等服务 EBI 欧洲生物信息学研究所(European Bioinformatics Institute) 1994年建于英国剑桥,前身是德国海德堡的欧洲分子生物学实验室的信息服务部门 EBI接收了原来EMBL数据库的管理和维护 是欧洲分子生物学网(EMBnet)的一个特别节点 http://www.ebi.ac.uk/ (主页) http://www2.ebi.ac.uk/ (工具) http://www3.ebi.ac.uk/ (服务) NIG 日本国立遗传学研究所(National Institute of Genetics) 创立于1949年7月1日,属文部省管辖 信息服务始于1984年 维护管理着DDBJ 1987年1月发行DDBJ第一版 http://www.nig.ac.jp 其他重要中心 二、数据库目录 NAR数据库专辑 从1994年开始,《核酸研究》杂志(Neucleic Acids Research)每年第一期是生物数据库专辑 每个专辑大约介绍100多种库 从2000年起,该杂志的出版社(牛津大学出版社)设立了一个数据库目录网页 其他数据库列表 NIH全球数据库列表 /molbio/db.html CBI的生物数据库镜像列表 /help/dwut.html 三、常用序列格式 FASTA序列格式 也叫Pearson格式 简单 使用最多 例子(单序列) 多序列FASTA FASTA序列格式中的核苷酸表示法 FASTA序列格式中的氨基酸表示法 PHYLIP序列格式 例子 四、核酸数据库 国际核苷酸序列数据库联盟 International Nucleotide Sequence Database Collaboration (INSDC)包括 GenBank [美] /Genbank EMBL [欧] http://www.ebi.ac.uk/embl/ DDBJ [日] http://www.ddbj.nig.ac.jp/ 每天这三个数据库作数据同步操作 在任何一个数据库操作(查找、投递数据等)是等效的 GenBank主页 GenBank结构 GenBank包括三个子数据库 CoreNucleotide dbEST dbGSS 其中CoreNucleotide还分为更小的BLAST数据库 nr htgs wgs env_nt GenBank查询(1) 已知收录号(accession number)的情况 GenBank查询 查看详细结果 DNA GenBank查询:Protein GenBank序列格式 GenBank查询 利用Entrez browser来查询各种数据(集成有哪些信誉好的足球投注网站工具) Entrez 是美国国家生物技术信息中心所提供的在线资源检索器。该资源将GenBank序列与其原始文献出处链接在一起。 Entrez 是由NCBI主持的一个数据库检索系统。 向GenBank投递序列 GenBank提供多种工具投递序列,如 BankIt (网上投递) 适于少量的、注释简单的序列投递 Sequin (本地投递;软件) 适于大量的、复杂的序列投递 可投递变异、种系发生、群体数据集 图形界面操作 选项多、功能强 可向GenBank, EMBL, DDBJ中的任一数据库投递 Sequin EMBL主页 DDBJ主页 BioSino 是中国自主开发的核酸序列公共数据库 发表我国学者提供的核酸序列,并接受注册登记 有CDNAP和DDIB两个产品 / /DIDWeb/index.html DNA结构数据库 CUTG (Codon Usage Tabulated from GenBank, 密码子使用频度表) [日] EPD (Eukaryotic Promotor Database, 真核生物启动子数据库) [欧] TRANSFAC (真核生物基因表达调控因子的数据库) [德] RepBase (重复序列), MicroSatellite (微卫星), COMPEL (复合元件), MPDB (分子探针), dbSTS, dbEST, NDB (晶体), VectorDB (载体), EID (外显内含子), ASDB (剪接), … RNA序列和核糖体数
文档评论(0)