- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式数据库的查询优化研究.pdf
分布式数据库的查询优化研究
王欣
中国矿业大学,江苏徐州(221116 )
E-mail :qiuxinbaby@163.com
摘 要:本文首先介绍了分布式数据库的机制和特点,并介绍了分布式查询的步骤。然后探
讨了分布式查询优化的目标,指出在分布式数据库系统中进行查询优化的最终目标就是尽量
使总代价最小和使查询响应时间最短。接着,文中介绍了一系列的分布式数据库系统查询的
优化方法和策略以及各自的使用特点。
关键词:分布式数据库;查询;优化
1. 引言
随着科学技术的进步和生产生活的各行各业中业务量的不断加大,数据库的结构日趋复
杂,因此,与之相关的各种数据库管理系统必须要不断完善自身的性能才能更有效地解决数
据的存储和处理问题,才能更好地满足日益增大的信息查询要求。如果能合理选择有效的优
化策略和方法则可以很好解决以上问题。[12]
分布式数据库(Distributed Database, DDB)是物理上分散在计算机网络各结点上, 而逻辑
上属于同一个系统的数据集合, 其具有数据独立性、集中与自制相结合的控制机制、事务管
理的分布性等特点。同时分布式数据库系统还要适当增加数据冗余来提高系统的可靠性、可
用性和改善系统性能。这样, 由于数据的物理分布和冗余, 使得分布式数据库系统查询处理和
集中式数据库系统相比, 增加了许多新的内容和复杂性, 因此分布式查询处理的优化显得特
别的重要。[10]分布式数据库技术是分布性与集中性的统一。分布性表现在数据在网络中是
跨结点物理存储的,集中性表现在用户逻辑上所见到的是一个简单的、同构的数据库。[11]
2. 分布式查询处理步骤
与管理单个数据库系统的需要逻辑上和物理上达到双重集中的集中式数据库管理系统
所不同的是,分布式数据库管理系统需要管理多个数据库系统。所以,对分布式数据库的查
询不能像集中式数据库那样仅仅涉及一个站点而必须涉及多个服务器(全局查询)。在查询
过程中,必须要对全局查询进行分解,即将一个涉及多个数据服务器的全局查询转换成为多
个金仅涉及一个数据服务器的子查询。注意这里的全局查询和子查询均是由全局查询表示
的。查询分解完成后,再进行查询转换处理。分布式的数据库系统的查询处理通常分为查询
分解,数据本地化,全局优化和局部优化四个部分。
(1) 查询转换:将查询问题转换成为一个定义在全局关系上的关系代数表达式,然后进
行规范化、分析、删除冗余和重写。
(2 ) 数据本地化:将在全局关系上的关系代数式转换到相应段上的关系表达式,产生查
询树。
(3 ) 全局优化:使用各种优化算法和策略可以对查询树进行全局优化。不同的算法和策
略能够造成不同的优化结果,因此,算法的选取和策略的应用非常重要。
(4 ) 局部优化:分解完成后要进行组装,局部优化是指在组装场地进行的本地优化。
3. 分布式查询优化的目标
在分布式查询优化中通常使用总代价,即处理分布式数据库中不同站点之间的查询操作
- 1 -
以及站点间通信的所有时间的总和,进行资源耗费情况的衡量。另一种常用的衡量标准是查
询时的响应时间。而在分布式数据库系统中进行查询优化的最终目标就是尽量使总代价最小
和使查询响应时间最短。
(1) 总代价:在分布式数据库系统中,除了包括在集中式数据库中的CPU 代价和 I/O 代
价(合称为局部处理代价)之外,由于数据分布在不同的结点上,在数据查询处理
中还需要考虑到站点间传输数据的通信代价,因此,总代价=CPU 代价+I/O 代价+
通信代价。
(2 ) 响应时间:指从接收查询到完成查询的时间间隔。在分布式数据库系统中,响应时
间既与通讯时间有关,又与局部处理时间有关。
在许多低效的通信网络中,通信代价常常
文档评论(0)