- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[研究生体育心理学的理论与方法
生物序列的同源性 相似性和同源性关系 序列的相似性和序列的同源性有一定的关系,一般来说序列间的相似性越高的话,它们是同源序列的可能性就更高,所以经常可以通过序列的相似性来推测序列是否同源。 正因为存在这样的关系,很多时候对序列的相似性和同源性就没有做很明显的区分,造成经常等价混用两个名词。所以有出现A序列和B序列的同源性为80%一说。 序列相似性的概念 序列比对(aligment)是序列分析的基础,其他一切都建立在序列排比的基础上。 ACGCTAGCGCTAGCTGCTAGCTAG ACGCTAGCGCTAGCTGCTAGCTAG ACGCTAGCGCAAGCTGCTAGCTAG ______________ __________________ 序列相似性的概念 序列排比是推导蛋白质二级结构的基础 是初步蛋白质功能推断的基础 可用于蛋白质三级结构的推导 可用于推导进化树和解释种间亲缘关系 用于分析分子水平的选择压力探测序列之间的相互作用 探测启动子单元等 MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG -------------PRNGTIKIYENPARTFTRPYSAKNITIYKEND 序列比较是如何进行的? 要分析两个序列是否相似,必须首先作比对分析(alignment)。 如何作排比分析? 最基本的条件是对序列的相似性做定量分析,然后将序列进行排比,在排比中要用到 gaps, insertions, substitutions。 对gaps和insertions打分可用较简单的扣分方案,而substitutions的打分则比较复杂,必须先构建出一个计算机的算法矩阵(Matrix),再根据此方案对序列中氨基酸残基之间的差异或相似进行打分。 序列比较是如何进行的? 要对两个序列进行排比,必须首先打出其相似性的定量分值,于是需要一个打分矩阵。 打分矩阵(Scoring Matrices): 给不同的氨基酸配对定义的一系列相似性分值。而一个突变打分方案(mutation data matrix)则是根据排比时序列中点突变的情况设计出的打分方案。对氨基酸配对相似性的尺度衡量,例如苯丙氨酸和异亮氨酸相似性的定量标准,可以以多种方式来定义。 序列比较是如何进行的? 打分矩阵(Scoring Matrices) 对氨基酸配对相似性的尺度衡量,例如苯丙氨酸和异亮氨酸相似性的定量标准,可以以多种方式来定义。因此,设计一个打分矩阵,首先必须确定用什么算法模型。在序列排比分析中,打分矩阵只是某个算法模型的量化表现,比对的结果只在该算法模型所划定的范围内有意义。 生物信息学发展的3个主要阶段 PAM系列矩阵 1. Margaret Dayhoff, 1978; 2. Accepted point mutation (PAM): 可接受的点突变,氨基酸的改变不显著影响蛋白质的功能; 3. 进化模型: 中性进化,Kimura,1968; 使用数据 1. 34个蛋白质超家族; 2. 72个蛋白质组; 3. 1572个突变; 4. 序列相似性 85% 统计氨基酸的替代 1. 对于同一个group内的蛋白质序列,统计氨基酸可能出现的频率,以及替换的个数; 2. 注意:不考虑空位; 对20种氨基酸做相同统计 PAM1矩阵的构建 1. 两个蛋白质序列的~1%氨基酸发生变化的时间; 2. 定义进化时间以氨基酸的变异比例为准,而不是时间;因为各个蛋白质家族进化的速度并不相等; 3. PAM2 = PAM1*PAM1 PAM3 = (PAM1)3 PAM250= (PAM1)250 PAM2矩阵 1. 基本假设:每个氨基酸的突变的概率独立于前次突变。因此,PAM2=PAM1*PAM1 PAM250矩阵 1. PAM250: 250%的期望的突变; 2. 蛋白质序列仍然有15-30%左右的相似性,例如: F-F: 32% A-A: 13% PAM矩阵的问题及改进 1. PAM系列矩阵存在的问题: A. 氨基酸的打分矩阵,不关心核酸; B. 进化模型的构建需要系统发育树的分析,因此,成为一个循环论证的问题:序列比对-矩阵构建-打分,进行新的序列比对; C. 数据集很小; 2. 打分矩阵的改进 BLOSUM系列矩阵 2. BLOSUM矩阵 1. BLOCK: 蛋白质家族保守的一段氨基酸,无gap,一般几个-上百个氨基酸; 2. Prosite家族:至少有一个BLOCK存在于该家族的所有蛋白质序列中; 3. 分析500个Prosite家族; 4. BLOSUM62: 序列的平均相似性为62%的BLOCK构建的打分矩
文档评论(0)