- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
隐马尔科夫模型在多序列比对中的应用
隐马尔科夫模型在多序列比对中的应用摘要:序列比对是生物信息学研究中的一个重要的方法, 是生物信息学的基础。随着测序技术及生物信息学的高速发展,目前已经获得了大量的生物序列和数据结构,传统研究生物序列的方法已经无法再满足人们的需求,而隐马尔科夫模型(HMM)也渐渐在生物序列分析中脱颖而出。隐马尔科夫模型是一个双重随机过程,具有一定状态数的隐马尔科夫链和显示随机函数集,该模型用于生物序列分析是生物信息学(Bioinformatics) 研究的新领域。本文主要介绍了HMM在多序列比对中的应用。关键词:隐马尔科夫模型(HMM);生物信息学;多序列比对1 生物序列比对的意义及概念序列比对是生物信息学中最基本、最重要的操作,通过序列比对可以发现生物序列中的功能、结构和进化的信息。序列比对的根本任务是:通过比较生物分子序列,发现它们的相似性,找出序列之间共同的区域,同时辨别序列之间的差异。研究序列相似性的目的之一是,通过相似序列的序列得到相似的结构或相似的功能。序列比对的理论基础是进化学说。许多生物学的事实表明:不同的核酸或蛋白质序列可能源于同一原始序列,经过序列内残基的取代、残基或序列片段的缺失、以及序列重组等遗传变异过程分别演化而来。在残基-残基比对中,可以明显看到序列中某些残基比其他位置上的残基更保守,这些信息揭示了这些保守位点上的残基对序列的结构和功能是至关重要的。因此,序列比对可用于蛋白质的功能域识别、二级结构预测、基因识别以及分子系统发育分析等方面的研究。序列比对根据同时进行比对的数目分为双序列比对(Pair-Wise Sequence Alignment)和多重序列比对(Multiple Sequence Alignment)。双序列比对是将两个序列的各个字符按照对应等同或者置换的关系进行对比排列,其结果是找出两个序列共有的排列顺序,这是学列相似程度的一种定性描述。与序列两两比对不一样,多重序列比对研究的是多个序列的相似性。序列的多重比对可用来有哪些信誉好的足球投注网站基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。2 隐马尔科夫模型隐马尔科夫模型(Hidden Markov Models, HMM)是一种概率论模型,这种方法已经成功地应用于多个领域,如语音识别、光学字符识别等。HMM在生物信息学领域中也有着重要的应用,如基因识别、序列分析、进化发育分析及蛋白质结构预测研究等。隐马尔科夫模型可以用五个元素来描述:(1)N,模型的隐状态数目。虽然这些状态是隐含的,但在许多实际应用中,模型的状态通常有具体的物理意义;(2)M,每个状态的不同观测值的数目;(3)A , 状态转移概率矩阵。描述了HMM模型中各个状态之间的转移概率。其中A_{IJ}= P(A_{T+1} =S_{J} | Q_{T}=S_{I}),1≤I,J≤N. 表示在T时刻、状态为SI的条件下,在T+1时刻状态是SJ的概率;(4)B ,观测概率矩阵。其中BJ(K) = P[VK(T) | QT = SJ]; 1≤J≤N,1≤K≤M.表示在T时刻、状态是SJ条件下,观察符号为VK(T)的概率;(5)π 初始状态概率矩阵 π={π_{J}| π_{J}= P[Q_{1} = S_{J}];1≤J≤N.表示在初始T=1时刻状态为SJ的概率。一般的,可以用λ=(A,B,π)来简洁的表示一个隐马尔科夫模型。给定了N,M,A,B,π后,隐马尔科夫模型可以产生一个观测序列 O=O1O2O3…OT。表示DNA序列的HMM如图1所示(方框表示各种状态,方框之间的连线表示状态转换):图1 DNA序列的HMM3 基于隐马尔科夫模型的多重序列比对算法迭代比对是另一类有效的多重序列比对策略。它基于一个能产生比对的算法,并通过一系列的迭代方式改进多重序列比对,直到比对结果不再改善为止。这类算法根据改善比对的策略可以分为确定型和随机迭代比对方法。最简单的迭代比对类型是确定性。随机迭代方法包括Prrp,隐马尔科夫模型,模拟退火,遗传算法以及其他方法。某些方法可能是渐进方法和迭代方法的混合。隐马尔科夫模型是最近几年在机器学习领域都得到成功应用的关于序列分析的重要统计模型。隐马尔科夫模型最早用于语音识别,在80年代末90年代初开始用于生物信息学,目前已经用于DNA模型构建,多重序列比对,蛋白质二级结构预测,基因预测等方向。生物的基因组可以认为是某祖先基因经过若干代的进化而来的,这个祖先基因经过插入、删除和匹配而不断进化,最终衍变为一个基因家族。因此,隐马尔科夫模型之所以在生物序列分析中得到普遍应用是因为它正好模拟了生物基因的突变、插入、缺失、匹配过程。3.1基于隐马尔科夫模型的多重序列比对具体实现过程解决多重序列比对问题,就是通过对序列碱基的匹配、插入和删除操作,获得一个在某个评价模型下比分最优的结果集
您可能关注的文档
最近下载
- 天津大学测控电路试卷.doc VIP
- 西 藏图考 清 黄沛翘(国立中央图书馆典藏).pdf
- 商标使用许可备案提前终止协议书8篇.docx VIP
- 2025年成都百万职工技能大赛(快递员)备赛试题库(含答案).docx
- 材料概论-第二章课件.pptx VIP
- 工业机器人编程与操作(FANUC)配套课件.ppt
- 第一单元 快乐的课堂 1~5 数的认识和加减法(单元测试基础卷)数学青岛版一年级上册(A3).pdf
- 2025广西公需答案01.pdf
- (高清版)DBJ50∕T-396-2021 山地城市地下工程防渗堵漏技术标准.pdf VIP
- Q TZW 22-2016_烧烤工具 企业标准.pdf VIP
文档评论(0)