并行数据库研究方向.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
并行数据库   并行数据库系统(Parallel Database System)是新一代高性能的数据 库系统,是在 MPP 和集群并行计算环境的基础上建立的数据库系统。   并行数据库技术起源于 20 世纪 70 年代的数据库机(Database Machine) 研究,,研究的内容主要集中在关系代数操作的并行化和实现关系操作 专用硬件设计上,希望通过硬件实现关系数据库操作的某些功能,该研究 以失败而告终。80 年代后期,并行数据库技术的研究方向逐步转到了通用 并行机方面,研究的重点是并行数据库的物理组织、操作算法、优化和调 度策络。从 90 年代至今,随着处理器、存储、网络等相关基础技术的发展, 并行数据库技术的研究上升到一个新的水平,研究的重点也转移到数据操 作的时间并行性和空间并行性上。   并行数据库系统的目标是高性能(High Performance)和高可用性 (High Availability),通过多个处理节点并行执行数据库任务,提高整 个数据库系统的性能和可用性。   性能指标关注的是并行数据库系统的处理能力,具体的表现可以统一 总结为数据库系统处理事务的响应时间。并行数据库系统的高性能可以从 两个方面理解,一个是速度提升(SpeedUp),一个是范围提升 (ScaleUp)。速度提升是指,通过并行处理,可以使用更少的时间完成两 样多的数据库事务。范围提升是指,通过并行处理,在相同的处理时间内, 可以完成更多的数据库事务。并行数据库系统基于多处理节点的物理结构, 将数据库管理技术与并行处理技术有机结合,来实现系统的高性能。   可用性指标关注的是并行数据库系统的健壮性,也就是当并行处理节 点中的一个节点或多个节点部分失效或完全失效时,整个系统对外持续响 应的能力。高可用性可以同时在硬件和软件两个方面提供保障。在硬件方 面,通过冗余的处理节点、存储设备、网络链路等硬件措施,可以保证当 系统中某节点部分或完全失效时,其它的硬件设备可以接手其处理,对外 提供持续服务。在软件方面,通过状态监控与跟踪、互相备份、日志等技 术手段,可以保证当前系统中某节点部分或完全失效时,由它所进行的处 理或由它所掌控的资源可以无损失或基本无损失地转移到其它节点,并由 其它节点继续对外提供服务。   为了实现和保证高性能和高可用性,可扩充性也成为并行数据库系统 的一个重要指标。可扩充性是指,并行数据库系统通过增加处理节点或者 硬件资源(处理器、内存等),使其可以平滑地或线性地扩展其整体处理 能力的特性。   随着对并行计算技术研究的深入和 SMP、MPP 等处理机技术的发展,并 行数据库的研究也进入了一个新的领域,集群已经成为了并行数据库系统 中最受关注的热点。目前,并行数据库领域主要还有下列问题需要进一步 地研究和解决。   ( 1)并行体系结构及其应用,这是并行数据库系统的基础问题。为了 达到并行处理的目的,参与并行处理的各个处理节点之间是否要共享资源、 共享哪些资源、需要多大程度的共享,这些就需要研究并行处理的体系结 构及有关实现技术。   (2)并行数据库的物理设计,主要是在并行处理的环境下,数据分布 的算法的研究、数据库设计工具与管理工具的研究。   (3)处理节点间通讯机制的研究。为了实现并行数据库的高性能,并 行处理节点要最大程度地协同处理数据库事务,因此,节点间必不可少地 存在通讯问题,如何支持大量节点之间消息和数据的高效通讯,也成为了 并行数据库系统中一个重要的研究课题。   (4)并行操作算法,为提高并行处理的效率,需要在数据分布算法研 究的基础上,深入研究联接、聚集、统计、排序等具体的数据操作在多节 点上的并行操作算法。   (5)并行操作的优化和同步,为获得高性能,如何将一个数据库处理 事务合理地分解成相对独立的并行操作步骤、如何将这些步骤以最优的方 式在多个处理节点间进行分配、如何在多个处理节点的同一个步骤和不同 步骤之间进行消息和数据的同步,这些问题都值得深入研究。   (6)并行数据库中数据的加载和再组织技术,为了保证高性能和高可 用性,并行数据库系统中的处理节点可能需要进行扩充(或者调整),这 就需要考虑如何对原有数据进行卸载、加载,以及如何合理地在各个节点 是重新组织数据。

文档评论(0)

156****5991 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档