生物信息学在高通量测序数据分析中的应用.pptVIP

生物信息学在高通量测序数据分析中的应用.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
常用生物信息学分析平台与资源 常用编程分析平台: Perl / BioPerl Python / BioPython R / Bioconductor JAVA / BioJava 常用网上资源: NCBI SRA – Sequence Read Archive UCSC Genome Browser SEQanswers – WiKi Forum for NGS 第三十页,共六十六页,2022年,8月28日 常用基因组拼接软件 Velvet Ray ABySS SOAPdenovo SSAKE SHARCGS MIRA Edena 第三十一页,共六十六页,2022年,8月28日 基因组比对软件 BLAST BLAT MAQ SOAP Bowtie BWA SSAHA ELAND 第三十二页,共六十六页,2022年,8月28日 SNP 分析软件 SAMTools SOAPsnp NGS-Backbone MAQ SeqMan NGen CLCBio Genomics 第三十三页,共六十六页,2022年,8月28日 生物信息学在基因组分析方面的应用 基因组de novo测序 对未知基因组序列的物种 取样: 动物:血液、肌肉 植物:叶片(黄化叶,组培植株) 估算基因组复杂度(大小、重复序列比例、杂合度) 测序技术: Illunima paired-end为主 Sanger、454、SOLiD为辅, PacBio目前也开始用于基因组测序补洞 文库构建 尽量随机打断 第三十四页,共六十六页,2022年,8月28日 WGS (whole genome shortgun) Coverage depth(覆盖深度or测序深度): 每个碱基被测序的平均次数,是用来衡量测序数据量的首要参数。 测序总数据量/基因组大小 Coverage ratio(覆盖率): 被测序到的碱基占全基因组大小的比率。覆盖比率随覆盖深度升高而提高,亦受测序bias的影响,如illumina测序会受到GC bias的影响,而导致测序不均匀。 理论上(完全随机打断)测序深度达到20x即可覆盖整个基因组。实际工作中一般需要50x以上(100 bp读长)。 Reads长度越长越好。 第三十五页,共六十六页,2022年,8月28日 De novo assembly Paired-end reads Contig Mate-end reads or long reads Scaffold Genetic map, FISH….. Chromosome 第三十六页,共六十六页,2022年,8月28日 基因组注释 蛋白编码基因注释 重复序列注释 非编码RNA注释,主要是miRNA 基因组注释流程 第三十七页,共六十六页,2022年,8月28日 全基因组成功测序案例 互叶梅基因组(国际互叶梅基因组测序项目,2013) The Amborella Genome and the Evolution of Flowering Plants 完全使用NGS测序组装 最原始的被子植物互叶梅Amborella已被确定是所有其他存活被子植物的单一姊妹物种,是其他被子植物比较的关键参照物。 Amborella植物测序基因组解决了“达尔文难解之谜”——为什么几百万年前花在地球上突然激增的问题。基因组序列为地球生命史上重大事件提供了理论参考:开花植物的起源。 第三十八页,共六十六页,2022年,8月28日 全基因组测序不成功案例 麻风树基因组(日本,2011) Sanger结合NGS 组装完成度低 只进行了基本的基因组注释。发现许多与脂质合成及抗病相关的基因。推测这些都是麻风树不断适应干燥环境获得的性质。 第三十九页,共六十六页,2022年,8月28日 重测序 (Resequencing) 对已有参考基因组物种的不同基因型或不同个体的全基因组或部分区段进行测序,以获得个体之间的基因组和功能差异。 用途: 了解物种的起源和演化历程 理解疾病的成因 理解动植物性状的分子机制 全基因组关联分析 (Genome-wild association study, GWAS) 第四十页,共六十六页,2022年,8月28日 SNP检测,注释和统计 Indel 检测,注释和统计 SV检测,注释和统计 CNV 检测,注释和统计 变异检测 第四十一页,共六十六页,2022年,8月28日 SNP calling 考虑测序错误 等位基因的SNP (考虑个体测序深度) A C SNV vs SNP SNV (sin

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档