- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学2016-9-序列比对要点
人RBP4蛋白和小鼠RBP4蛋白为直系同源蛋白,且序列相似性比较高,适合进行全局序列比对 * ALN格式为CLUSTAL的原始输出格式。每组序列比对行的最后一行给出序列的匹配程度,型号“*”表示对齐的该序列中所有的氨基酸残基或核酸均相同,冒号“:”表示该序列有保守的替换,点号“.”表示该序列具有半保守的替换。 * Liaoning University Bioinformatics Liaoning University Bioinformatics 生物信息学 Life Science School Hongsheng Liu Prof. 第三章:序列比对 序列比对的基本概念 打分矩阵 序列比对算法 序列比对软件使用方法介绍 序列比对软件使用方法介绍 一致性:一致性指两个序列相同的程度。 保守性:某一氨基酸残基或序列的改变(突变)保持了原始氨基酸残基的物理化学特征,那么这个突变就是保守的。 相似性:相似性表示序列之间相关联的程度。与一致性比较相似性进一步考虑了发生保守突变的氨基酸的数目,即考虑了相似氨基酸的数目。 同源性:如果两个序列是来源于一个共同的祖先,那么他们是同源的。 内容回顾 匹配:竖线(|) 相似:双点(:) 较弱的相似:单点(.) 空位:短横线(-) 不相似的替换:空白 序列比对结果的表示方法 两序列进行比对,通常使一个得分矩阵(scoring matix)来计算比对的分值,以得到一个评价优劣的标准。 核酸的得分矩阵:等价矩阵、BLAST矩阵…… 蛋白质的得分矩阵:等价矩阵、PAM矩阵、BLUSOM矩阵 存在空位(Gap)是要进行空位罚分(Gap penalty) 序列比对常用软件使用方法 点阵法: http://myhits.isb-sib.ch/cgi-bin/dotlet 动态规划算法: 全局序列比对:Needleman-Wunsch算法 http://www.ebi.ac.uk/Tools/psa/emboss_needle/ 局部序列比对:Smith-Waterman算法 http://www.ebi.ac.uk/Tools/psa/emboss_water/ 双序列比对常用软件 全局比对:对序列从头到尾进行比较。试图使尽可能多的字符在同一序列中匹配。全局比对适用于相似度较高而长度相近的序列。 例子1:使用Needleman-Wunsch算法对人RBP4蛋白和小鼠RBP4蛋白进行全局比对 首先在UNIPROT数据库( /)中下载人RBP4蛋白(P02753)和小鼠RBP4蛋白(Q00724)的氨基酸序列 然后打开Needleman-Wunsch算法程序(Needle)的在线服务器网址 把人RBP4序列和小鼠RBP4序列分别粘贴到两个文本框中 如果需要可以调整比对的参数,如:得分矩阵,空位罚分等 然后提交 具体步骤: 粘贴序列 粘贴序列 修改参数 提交 人RBP4蛋白和小鼠RBP4全局序列比对结果 一致性 相似性 空位 得分 序列比对结果 局部比对:寻找序列中相似度最高的区域,也就是匹配密度最高的部分。局部比对适用于某些部位相似度较高,而其他部位差异较大的序列。 例子2:使用Smith-Waterman算法对人RBP4蛋白和人lipocalin1蛋白进行局部比对 首先在UNIPROT数据库中下载人RBP4蛋白(P02753)和人lipocalin1蛋白(P31025)的氨基酸序列 然后打开Smith-Waterman算法程序(Water)的在线服务器网址 把人RBP4序列和人lipocalin1蛋白序列分别粘贴到两个文本框中 如果需要可以调整比对的参数,如:得分矩阵,空位罚分等 然后提交 具体步骤: 人RBP4蛋白和人lipocalin1蛋白局部比对结果 比对不是从第一个氨基酸开始的,也不是到最后一个氨基酸结束,而是找出了相似性最高的一部分(局部比对) 全局比对结果 多序列比对,实际上是一组蛋白质之间的一系列的双序列比对。 与双序列比对相比,多序列比对更能发现进化保守关系信息。 在双序列比对中出现的相同的氨基酸残基,虽然在两条序列上是保守的,但这种保守可能只是偶然的。 而如果某一位点在多序列比对的都出现了相同的氨基酸残基,则说明该残基是进化保守的可能性更大。 多序列比对 序列分别为鸡、小鼠、人、猪和牛的RBP4蛋白 使用了Clustal Omega软件 通过多序列比对可以发现RBP4蛋白中的大部分氨基酸残基在多个哺乳动物中都保守。 序列分别为人的载脂蛋白D,人视黄醇结合蛋白4,孕激素相关子宫内膜蛋白,补体8(γ肽), lipocalin1,人气味结合蛋白2A, α-1微球蛋白,嗜中性明胶酶相关蛋白,前列腺素D2合成酶 通过多序列比对可以发现
文档评论(0)