多数据源数据仓库实体化视图维护与下查.pdf

多数据源数据仓库实体化视图维护与下查.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2005 2005年5月 重庆大学学报(自然科学版) May of Science V01.28No.5 Joumal 第28卷第5期 ChongqingUniversity(NaturalEdition) 文章编号:1000—582X(2005)05一0080一06 多数据源数据仓库实体化视图维护与下查+ 陈金玉,王启星 (重庆大学1.自动化学院;2.计算机学院,重庆400030) 摘要:研究了多源单视图下数据仓库实体化视图联机维护与下查一致性问题,并提出普适性强一 致收敛维护算法M—Glide。算法引入动作列表来控制数据仓库收到的信息顺序,采用版本控制、补偿思 想和应答机制来协调源数据库与数据仓库问的数据更新,从而保证了数据仓库视图维护与下查的一致 性,并通过一个示例说明了该算法在实际中的具体运用。 关键词:算法M—Glide;数据仓库;实体化视图;补偿技术;OLAP查询 中图分类号:’rP311 文献标识码:A 在数据仓库联机维护技术中,实体化视图(Materi— A alized views)的联机维护是一个关键技术。是指在数 据仓库为用户提供服务的同时,当数据库中的原始数 据发生改变时,实时地将这种变化反映到数据仓库中, 使相应的实体化视图得到及时的刷新。同时,由于数 据仓库中存储的只是部分原始数据拷贝和实体化视图 集合,它并不能完全满足用户的所有查询。对于某些 OLAP查询(如下钻等),数据仓库必须通过访问源数 据库才能给出最终的查询结果,如何保证这类查询的 一致性,也是一个值得研究的课题。 图1数据仓库结构模型 以Stanford提出的二层数据仓库体系结构为例, 存在的一些不足。对于多源实体化视图的维护方面, 如图1所示。每个源对应的监视器(Monitor)负责收 集源的变化并通知数据仓库,数据仓库接到通知后,向 思想是当发给数据源的查询还没有返回结果就又收到 数据源发出数据查询要求。数据源上的集成器(Inte- 了新的更新消息时,就记录下这些更新事务,并在以后 grator)用来接收、转化和集成来自源的数据,在必要时 增加信息如时间戳等,并应答数据仓库进行集成存储。 发送一个补偿查询来消除上面的不一致性。为避免算 可以看出,从源上的数据变化到数据仓库视图数据的 修改,要经过通知、查询及应答几个步骤,一旦中间发 生信息延迟,使数据仓库收到源变化顺序与各源之间 AL中记载的操作序列与集成器接收的消息的顺序一 的操作顺序不一致,就会导致数据的不一致。 致。但是,以上2个算法都有一个假定,即算法建立在 对于单源单视图维护方面,文献[2—5]等进行了源表存在关键属性,而在实际的数据库环境上,有些表 充分的研究,其中文献[5]采用版本控制、补偿思想和 可能没有设定关键字。当以这些表作为数据仓库源表 应答机制来协调数据源与数据仓库问的数据更新,提 时,显然以上的2种维护算法都存在不足,同时这2个 算法也没有考虑数据下钻问题。如何找到更为一般性 出了完全一致收敛算法Glide.算法保证了仓库视图 +收稿日期:2004—12一08 基金项目:

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档