生物信息学 第三章 结构数据库.docVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 结构数据库 本章将集中介绍生物信息学中生物分子结构的有关内容,并将研究重点放在三维结构实际存在的氨基酸序列上,力图使读者了解结构数据库记录的内容及如何合理应用各类通用软件程序处理这类记录。本章不涉及结构生物学家们建立三维分子结构的计算程序,也不讨论相似蛋白质构象的精细结构。在本章参考书目后列出了一些优秀的讨论蛋白质构象的有关专著和蛋白质结构决定方法。 用图象直观表示蛋白质和核酸结构在生物化学教科书和研究论文中屡屡出现。这些图象是美丽迷人的反而使我们忽视了图象背后所反映的实验细节#0;#0;#0;实验中应用的生物物理方法,X射线晶体衍射学家和核磁共振波谱分析学家们努力工作的成效.在结构数据库中记录的数据是实用化的实验数据。 三维分子结构数据的一些概念 首先做一个关于如何记录生物高聚物的三维数据的思想实验。考虑一下如何在纸上记录如肌球素这类蛋白质的三维球棒模型的所有细节和尺度关系。一条开始的途径是从由三维模型主干描绘出的氨基酸序列入手。从N’端开始,我们通过将每个残基的化学结构与20种普通氨基酸化学结构(其结构的图解可以从教科书中找到)比较,以识别每个氨基酸侧链。 #0;棒结构中每个原子“球”的x,y,z坐标距离数据。 x,y,z)坐标信息。最简单的方法是在生物高聚物的二维草图上,每个原子的右侧,标出(x,y,z)三元坐标值。 坐标、序列、化学图像 典型的三维结构记录中与使用的文件格式无关的最明显的数据是坐标数据,它表征了分子中原子的空间位置,用沿着每个坐标轴到某特定原点的距离(x,y,z)表示。每个原子的坐标数据归属于结构记录中的标注信息列表:空间中的每一点代表了记录中的元素、残基和分子。对于生物多聚体,这标注信息来源于序列。每个序列固含的是重要的化学数据。我们能够直接从序列中推断出完整的包含所有原子和化学键的生物高聚物分子化学联接,能够恰如早先所描述的仅从序列信息出发描绘出草图。我们把这分子“草图”称作三维结构的化学图像。序列是生物高聚物分子完整化学图谱的固有表示。 原子、化学键和完整性 分子图像可视化软件完成了精细的“点联接”过程,而绘制出如我们在生物分子结构教科书中所见到的完美的蛋白质结构图像,例如图3.1所示的胰岛素3INS结构(Isaacs,Agarwal,1978)。显然,原子间联接依靠化学键。在目前的应用中,三维分子结构数据库记录使用了两种不同的键数据信息优化存储方法。 1.5埃。应用这些来源于化学键的规则,意味着空间中两个1.5埃距离的碳原子总形成单键。有了这些化学准则,我们可完全简化化学键信息存储。倘若结构本身未违背任何化学规则,则能够被完整记录而不带任何附加键信息。 Brookhaven蛋白质数据库(Bernstein等,1977)的PDB格式皆以化学准则方法为基础。一般而言,这些记录没有生物高聚物的完整键信息。无需“残基词典”,而仅用可能成键原子对的键长与键类型匹配表即可解译用“化学准则方法”编码的数据。 PDB数据文件读入软件包必须能基于这类规则重构化学键。对于程序员,如何解释PDB文件中的键信息尚未形成明确统一的规则,而导致了各类软件绘制化学键连接时的不一致,尤其应用了不同的算法和距离容差,这类情况更为严重。虽然PDB文件组织方案在记录数据存储方面的要求最低,但比较连键信息和化学图像描述已在记录中详细说明的情况,则对存储信息进行恰当解释所需算法也相应更复杂。这将迫使程序开发者做更多的工作。基于事件的编程中,考虑连键规则中的种种例外情况,更需要复杂的逻辑说明。 PDB衍生而来的分子建模数据库(MMDB)的数据库记录中得到应用。MMDB运用标准的“残基词典”,其中记录了氨基酸、核酸残基这样以聚合体形式存在,具有末端多样性的分子中所有原子、化学键信息。在结构科学家解决分子结构而使用的专用软件中,这类数据词典是很普遍的。读入MMDB数据的软件能利用词典所提供的键信息将原子连为一体,而无须力图满足化学准则的要求。最终,用软件获得准确的三维坐标数据。这种方法使软件开发简单化,因为连键规则中的例外情况在数据库文件中已被记录,而无须附加逻辑控制代码即可将之读入。 在结构数据库中,完整的记录是不多见的。大多数由X射线衍射获得的结构缺少氢原子坐标,因为氢原子的空间位置不能用实验手段决定。但一些建模软件可用于估计氢原子位置,并用其重建结构记录。在结构数据库中识别由模型构造的分子是容易的。它们常常有过于复杂的坐标数据和所有用实验手段无法确认的氢原子可能表达形式。 PDB:Brookhaven国家实验室蛋白质数据库 概述 计算机在生物学中的运用起源于生物物理方法的应用,如X射线结晶衍射。于是最初的“生物信息学”数据库被用于存储复杂的三维数据不足为怪。现代的蛋白质数据库以收集的蛋白质三维结构公共数据为核心,附带核

文档评论(0)

wpxuang12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档