生物信息学大实验实验指导要点.doc

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学大实验实验指导 适用专业:生物信息学 生物与制药大类 编写:解增言 生物信息学院 2014年4月 目录 实验1 基因组序列组装(软件CAP3的使用) 3 实验2 基因组序列组装(软件velvet的使用) 7 实验3 原核生物基因识别(软件Glimmer的使用) 9 实验4 真核生物基因识别(软件GlimmerM的使用) 17 实验5 HAP3基因家族的多序列比对分析(软件ClustalX与ClustalW的使用) 25 实验6 HAP3基因家族的分子进化分析(软件PHYLIP和MEGA的使用) 28 实验7 HAP3基因家族的分子进化分析(软件MrBayes的使用) 33 实验8 HAP3蛋白的结构分析(软件RasMol的使用) 42 实验1 基因组序列组装(软件CAP3的使用) 一、实验目的 1. 了解基因组测序原理和主要策略; 2. 掌握CAP3序列组装软件的使用方法。 二、实验原理 基因组测序常用的两种策略是克隆法(clone-based strategy)和全基因组鸟枪法(whole genome shotgun method)。克隆法先将基因组DNA打成大的片段,连到载体上,构建DNA文库;再对每一个大片段(克隆)打碎测序。序列组装时先组装成克隆,再组装成染色体。克隆测序法的好处在于序列组装时可以利用已经定位的大片段克隆, 所以序列组装起来较容易, 但是需要前期建立基因组物理图谱, 耗资大, 测序周期长。 全基因组鸟枪法测序无需构建各类复杂的物理图谱和遗传图谱,采用最经济有效的实验设计方案,直接将整个基因组打成不同大小的DNA片段构建Shotgun文库,再用传统Sanger测序法或Solexa等新一代测序技术对文库进行随机测序。最后运用生物信息学方法将测序片段拼接成全基因组序列。该方法具有高通量、低成本优势。 序列组装时,先把把单条序列(read)组装成叠连群(contig)、再把叠连群组装成“支架”(scaffold),最后组装成染色体。 本实验将练习在Linux环境下用CAP3软件组装流感病毒基因组。 1.CAP3序列组装程序简介 Huang Xiaoqiu. 和 Madan,A. 开发的一套用于序列拼接的软件,此软件适用于小的数据集或 EST 拼接,它有如下特征: 1. 应用正反向信息更正拼接错误、连接contigs。 2. 在序列拼接中应用 reads 的质量信息。 3. 自动截去 reads5`端、3`端的低质量区。 4. 产生 Consed 程序可读的ace 格式拼接结果文件。 5. CAP3 能用于Staden软件包的中的GAP4 软件。 2.下载 此软件可以免费下载,下载地址:http:///download.html。填写基本信息表格,即可下载。CAP3 详细参考文档可见:http:///sas.html。 3.安装 (1)上传cap3 的压缩包到本地linux/unix 运算服务器; (2)解压缩: ?????? bash-2.05b$ tar xvf cap3.tar ?????? CAP3/ ?????? CAP3/README ?????? CAP3/cap3 ?????? CAP3/doc ?????? CAP3/aceform ?????? CAP3/formcon (3)查看解压缩后的文件: ?????? bash-2.05b$ ls –l ?????? total 240 ?????? -rwxr-xr-x??? 1 soft? bgi?????? 25844 Sep 2?? 2002 formcon* ?????? -rwxr-xr-x??? 1 soft? bgi????? 169836 Sep 2?? 2002 cap3* ?????? -rw-r-----??? 1 soft? bgi???????? 513 Aug 22? 2002 README ?????? -rw-------??? 1 soft? bgi?????? 18448 Aug 22? 2002 aceform ?????? -rw-r-----??? 1 soft? bgi?????? 18922 Jun 21? 2002 doc 4. 使用 程序运行命令行: cap3? dna-file in fasta format [options] cap3.out 5.输入: 输入序列是普通的FASTA格式,如果序列文件名为“xyz”,则质量文件应命名为“xyz.qual”,约束文件应命名为“xyz.con”。在命令行中只需输入序列文件,程序会自动在相应的目录中寻找相应的质量文件和约束文件。 “xyz”格式如下: Sequence1 ACGTGCGCGATCGCCTGCTAGGCG

文档评论(0)

挺进公司 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档