- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
11111111111111111111111111111 XML索引文档有效的结构化连接 摘 要 基于路径表达式、元素之间结构关系及编码模式获取XML文档结构 基于标识索引提出了有效的结构化连接算法(B+,B+sp,B+psp) 引入兄弟指针(避免不参与连接的元素的操作)改善连接性能 基于R-Tree的结构化连接算法 1 引言 XML是有序树,具有复杂的结构,对数据库研究是挑战 树结点对应XML文档元素或属性 基于值(元素名、属性和文本串)的选择和结构(父子、祖先和后代关系)的选择两种查询 Section[title=“Overview”]//figure[caption=“R-tree”] 传统的B+Tree索引模式容易扩展支持基于值的查询,路径表达式支持结构查询 引言 以前提出的结构化连接算法的缺点 假设祖先和后代关系在序列连接之前给出 通过I/O操作访问祖先和后代元素 连接性能低下 算法改进 假设连接序列索引存在 序列元素属于同一文档标识且标识索引易于维持 通过编码模式索引能解析元素之间的关系 连接之前过滤掉无用的结构信息 引言 本文主要贡献 提出基于B+Tree的有效的结构化连接算法(B+,B+sp,B+psp) 有效的引入兄弟指针改善算法性能 实验证明B+psp算法最好 本文组织 1节 引言 2节 回顾相关工作(XML文档、编码模式、算法) 3节 提出基于B+Tree的有效的结构化连接算法 4节 讨论了基于R-Tree的结构化连接 5节 实验 6节 性能分析 7节 结论和未来工作 2 背景及前人工作 编码模式 XML文档树中结点指派三个编码:前序、后序和层次 v是u的祖先结点: 且 v是u的父结点: 持久编码模式 每个结点指派一个间距(interval): v是u的祖先结点: 即 v、u是兄弟结点且u是前驱结点: XML文档结构图(持久编码模式) [2,9],[601,709],[1201,1399],[2001,2099],…用于更新操作 持久编码模式特点和作用 编码模式作用 对于不同的结点u、v,满足; u的间距或在v的间距之前或在v的间距之后 u的间距或包含v的间距或被v包含 u、v间距不能部分相交 结构化连接 结构化连接:满足祖先(A)-后代(D)关系 Section[title=“Overview”]//figure[caption=“R-tree”] 祖先-后代模式 确定满足祖先-后代关系 对于任意 满足: (i) (ii) 若是父子结点,需满足: 结构化连接是优化XML查询的核心 (merge join, sort-merge join算法) 已有算法 Stack-Tree-Desc算法 引入stack机制 Stack-Tree-Desc算法示例 3 基于B+Tree的结构化连接 基于 组合的索引B+Tree 结构化连接中索引的应用 (a) 祖先被跳过 执行stack-tree-desc算法 (1) a1,a2,a3入栈并同d1连接; (2)a3,a2出栈;(3)通过a13检查元素a4;(4)a14入栈,a1,a14同d2连接 (b) 后代被跳过 执行stack-tree-desc算法 (1) a1入栈并同d1连接; (2) a1出栈;(3)通过d13检查元素d2 ;(4)a2入栈,同d14连接 基于B+Tree的连接算法 核心思想 祖先入栈 11、15步骤使用B+Tree跳过祖先和后代 14步骤栈一定为空,否则发生错误 嵌套包含森林(C-forest) 结构 同一标识下的元素连接结构 每个元素对应C-forest结构中一个结点 通过父结点、第一个孩子、右兄弟指针连接其他元素结点 结 构 图 C-forest 结构 np为n的父结点,满足: np是n的祖先,即 没有其他祖先结点na ,使得np是na的祖先 nc为n的第一个孩子结点,满足: nc是n的子结点 不存在其他子结点位于nc之前 ( : n1位于n2之前) ns为n的右兄弟结点,满足: n与ns有同一父结点 在n与ns之间不存在具有同一父结点的结点 ( :n2位于n1 ,n3之间) C-forest性质 每个(start,end)间距包含子树的所有间距 C-forest的Start编码遵循前序遍历 兄弟结点start(end)编码是增序 B+Tree中嵌入C-f
您可能关注的文档
最近下载
- 2024新人教版语文四年级上册《第二单元》大单元整体教学设计[2022课标].pdf
- 37-装配式地面部品施工.pptx VIP
- 人教(PEP)版三年级上册英语Unit 1《Making friends》全单元教学课件(24新教材).pptx
- 2025年06月英语六级真题及答案(共三套).pdf VIP
- 素问:阴阳应象大论.ppt VIP
- 反渗透系统培训讲解.ppt
- 第九章 静电场及其应用 测试卷.docx VIP
- 游戏毕业设计答辩.pptx VIP
- 2025届湖北省襄阳市高三下学期5月适应性考试(三)生物试卷含答案.pdf VIP
- 2025-2026人教鄂教版(2024)科学一年级上册教学计划.docx VIP
文档评论(0)