序列相似性比对.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
序列相似性比对 Alignment--比对(联配) 找到序列间的相似部分。 序列相似 功能相似 根据比对序列的数目,可以分为双序列比对(两条序列间比对)和多序列比对。 根据比对算法可以分为局部比对(local alignment) 和全局比对(global alignment) 典型的比对结果 相同 (identity)/ 相似 (similarity) 替换 (substitution) 插入/缺失(insertion/deletion)—gap 比对的基本概念 全局比对与局部比对 比对评分(打分矩阵,Gap 罚分) 比对结果的显著性评价(E-value) Similarity/Identity 全局比对与局部比对 全局比对(global alignment) 两条序列的全长都参加比对。(认为两条序列长度相同,不同的部分以空位补齐) 算法:Needleman-Wunsch 算法 只产生一个比对结果 例:序列atcgccctcagtc 与 atcgctcagtc 全局比对的问题 全局比对的目的是给出两条序列整体上的相似度。 当两条序列差异较大时(进化年代久远),采用全局比对,为了保证全局最优,会引入较多的替换或是gap(插入、缺失),比对结果生物学意义不大。 另外全局比对的速度慢,不适用于对大规模的数据库进行比对。 当两条序列可以肯定具有整体相似性(来自较近物种),可以采用全局比对算法。 程序:emboss 软件包中的 needle http://www.ebi.ac.uk/emboss/align/ 局部比对 两条序列可能只在局部区域具有相似序列,而在整体水平上不具有相 似性。例如两个蛋白有一个共同的功能结构域(domain),除了这个 区域外,两条序列相似性很差。 局部比对寻找两个序列中任意位置的相似序列,而不要求序列整体 水平相似,更符合实际应用需求。 可以产生多个比对结果,每个都为两个序列间的相似序列,每段相似序列称为一个HSP(high scoring pair),算法:Smith-Waterman 算法 打分矩阵--比对的基础 如果两条序列相似,那么应该存在一系列连续或邻近的匹配良好的区域,比如下图中的‘gaag’区域。 两点匹配时给予正分,错配/缺失时进行罚分。比对得分具有加和性,即可以用各个独立位点匹配得分的总和来表示序列相似程度。比对过程即寻找使比对得分最高的路径。 打分矩阵(scoring matrix)也称替换矩阵(substitution matrix) 核酸的打分矩阵比较简单(例如下图) 蛋白的打分矩阵 蛋白情况比核酸复杂,由于存在相似氨基酸的情况,所以其打分矩阵更复杂。 有两种打分矩阵, PAM 与Blosum矩阵。最早是在七十年代由Dayhoff与Henikoff分别收集蛋白质家族进行比对,总结出了氨基酸之间的替换概率矩阵。 相似氨基酸之间的替换,对蛋白功能影响小,因此替换概率高。 根据替换概率矩阵总结出了打分矩阵,在比对结果中,在相似氨基酸之间给出的得分低于相同氨基酸的得分,但高于错配情况。 蛋白的打分矩阵 Blosum 系列矩阵是从蛋白结构域数据库BLOCKS中选择不同相似程度的蛋白进行比对总结出来的,比如Blosum62是通过选择similarity =62%的蛋白,分析两两比对结果,总结出氨基酸间的替代概率。系列数字越小,代表蛋白间差异越大。 PAM 矩阵最初是从氨基酸组成差异1%的蛋白比对中总结而来(PAM1矩阵),而后通过矩阵自乘外延得到。如PAM250是由PAM1矩阵经过250次自乘得到。 如果要寻找进化距离较远的相似序列,可以选择较低相似级别的矩阵。一般用默认的Blosum62矩阵即可。 Gap 罚分 目前常用的相似性比对工具 从数据库中有哪些信誉好的足球投注网站相似序列的工具多是局部比对程序,最常用的如blast与fasta. Blast: (basic local alignment search tool) 多个网站都提供服务,如NCBI,EBI Fasta (Fast-A) 在EBI 网站提供 http://www.ebi.ac.uk 提交序列进行比对 可以提交序列:核酸、蛋白序列 第一步选择程序:blastn, blastp, blastx, tblastn, tblastx 第二步选择数据库:核酸、蛋白、基因组等 blastn 举例—输入界面 提交后需按Format按钮,等待结果返回 比对结果(图形) 比对结果 比对结果评价指标-Bit score 比对得分 (Bit Score) 预先定义打分矩阵 比如相同为+1,错配-3 Gap 对比对结果影响大,因此罚分更大。罚分分为两类:

文档评论(0)

wxc6688 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档