[生物学]生物信息学5.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[生物学]生物信息学5

生物信息学 第五章 分子系统发育分析 毛理凯 本课目录 总括 多序列比对 构建系统树 系统发生软件 一、总括 系统发生学(phylogenetics) 亦称系统学,种系发生学,种系发生系统学(phylogenetic systematics) 在希腊文中 phylon = tribe, race(种系) genesis = birth 研究生物群体(如:物种,种群)之间的进化关系 相关概念 phylogenetic taxonomy(系统发生分类学) 是系统学的一个分支 根据进化相关度对生物群体分类 phylogeny (=phylogenesis系统发生) 生物群体的产生和进化 分子系统学(molecular phylogenetics) 将核酸,氨基酸序列作为进化特征 系统发生树(phylogenetic tree) 也叫系统树,进化树(evolutionary tree),生命树(tree of life) 对物种之间的进化关系的一种描述,这些物种被认为有共同祖先 有根树和无根树 无根树和有根树的关系(1) 从一棵有根树总可以产生一棵无根树 而从无根树产生有根树需要额外的数据 无根树和有根树的关系(2) 一棵无根树可以产生多棵有根树 Willi Hennig (1913-1976) 德国生物学家,被认为是系统发生学和分类学(cladistics; 也叫cladogram)的奠基人 据已知资料来看,他的观点并不是最早被阐述 属达尔文学派;类似的观点另一学派的Lamarck和Rosa也有阐述 可以认为是系统发生学的集大成者 历史上的系统树 可能是最早的系统树 C. Darwin,1837 特征选取的变迁 经典系统发生学 主要是比较大的物理或表型特征 如生物体的大小,颜色,牙齿个数,行为特征 缺点: 不易量化(连续), 难以选取合适特征 现代系统发生学 分子水平: 核酸或氨基酸序列 优点: 易量化(离散),易获取,适于自动化,更本质 例子: (现代人起源) 通过对线粒体DNA的研究,认为所有现代人都是一个非洲女性的后代(“夏娃”) 系统发生学研究方法 目的 在树空间中寻找正确的系统树 分析步骤 多(重)序列比对(multiple sequence alignment, MSA) 构建系统树 评价结果 三种构建系统树中使用的有哪些信誉好的足球投注网站算法 穷尽法 有哪些信誉好的足球投注网站整个空间(所有可能的树),然后根据评价标准选择一棵最优的树 分支约束方法 根据一定的约束条件将有哪些信誉好的足球投注网站空间限制在一定范围内 启发式或经验性方法(heuristic) 根据目前的有哪些信誉好的足球投注网站情况指导下一步的有哪些信誉好的足球投注网站方向 根据先验知识或一定的指导性规则压缩有哪些信誉好的足球投注网站空间 两类数据: 距离和离散特征 距离 描述序列之间的差别 (遗传距离) 一般用距离矩阵(distance matrix)表示 距离往往由序列比对产生(如错配的比例) 离散特征 二态特征 (如: DNA序列上的某个位点是否剪切位点) 多态特征 (如: 某一位点可能的碱基有A,T,G,C) 两大类构建系统树的算法 基于距离的构建方法 (distance-matrix methods) 邻近归并法 (或称邻接法,neighbor-joining) 非加权组平均法 (UPGMA) Fitch-Margoliash法 最小进化方法 基于离散特征的构建方法 最大简约法 (MP) 进化简约法 (EP) 最大似然法 (ML) 相容性方法 注意: 系统树的限制 有人认为生物的系统关系不一定是树状的 系统树不一定代表进化历史 有很多干扰分析的因素 噪音(noisy) 水平基因转移(horizontal gene transfer;网状) 杂交,重组等 (网状) 用不同基因或蛋白产生的树往往不同 已经灭绝的物种只能作为叶节点 二、多序列比对 例子 多物种核糖体Rplp0蛋白比对 多序列比对方法 动态规划(dynamic programming) 慢,耗内存 改进: 使用“sum of pairs”目标函数 渐进法(progressive method;或称分级法hierarchical,建树法tree) 迭代法(iterative method) 基序法(motif finding;或称轮廓分析法profile analysis) 来自计算科学的算法 HMM, GA, SA 星形比对,树形比对 动态规划法 是两两比对所用动态规划方法的直接扩展 步骤 用两两比对的方法比对所有的序列对 建立n维矩阵(n为序列个数) 产生多序列比对 优点 理论上适用于任意多个序列 保证能得到较好结果 缺点 耗费大量时间,内存 实际上很少用于多于3个序列的比对 逐对加和法(sum of pairs, SP) 步骤 进行所有两两比对,并给每个比对打分 将所有的得分相加 找到最优多序列比对,

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档