基于语义子图的本体匹配方法.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语义子图的本体匹配方法 汪鹏 (东南大学计算机学院,南京,210096) 摘要:提出一种基于语义子图的通用本体匹配方法.语义子图是对本体元素语义的精确描述, 从语义子图中获得的匹配线索具有较高可信度,因此可减少本体匹配不确定性的负面影响.首 先抽取元素的语义子图,并在语义子图上构建元素的语义描述文档,通过语义描述文档相似度 实现本体文本匹配;然后,以文本相似度为输入,通过强奈件相似度传播算法实现本体结构匹 配,该算法适用于本体三元组形式,可解决本体缺乏充足文本信息情况下的匹配问题;最后, 通过相似度合并、自动阈值选择、匹配抽取和调试等处理得到本体匹配结果.实验表明该本体 匹配方法是有效的,其匹配质量优于目前大多数同类系统。 关键词:本体匹配:语义子图;语义描述文本;相似度传播:语义Web 1.引言 在现有很多本体匹配方法中【I21,无论是基于文本相似的方法、基于结构相似的方法、 基于实例的方法,还是利用背景知识库的方法都具有各自的优点和适用范围,单独采用特 定的某种匹配方法的匹配系统都不具有通用性。将多种匹配方法综合使用,可吸收每种方 法的优势,并提高匹配系统的通用性。 本文提出一种基于语义子图的通用本体匹配方法,与其他本体匹配系统相比,该方法 的主要贡献包括:(1)通过语义子图来精确描述本体元素的语义,匹配过程采用的匹配线 索从语义子图中获得,保证了匹配线索的可信度,从而在一定程度上降低匹配不确定性带 来的负面影响。(2)在语义子图上构造本体元素的语义描述文档,并将语义描述文档相似 度作为本体文本匹配的度量标准。语义描述文档粒度较同类文本匹配方法更细,并覆盖了 目前大多数文本相似启发式规则。(3)为解决本体中缺乏充足文本信息情况下的匹配问题, 进一步提出适用于本体图三元组形式的强条件相似度传播算法,以前期得到的文本相似度 为输入,通过相似度传播获得更多元素间的相似度。(4)最后,通过相似度合并、自动阈 值选择、匹配抽取和匹配调试等处理得到最终匹配结果。公开数据集上的实验结果表明, 基于该方法的本体匹配系统Lily可得到较好的结果,匹配质量优于目前大多数的同类系统。 本体匹配基本概念 定义l(本体):本体可定义为一个五元组蚪C,冗,饨,Z,z),其中C是概念的集 合,冗是关系的集合,饨表示概念层次,Z是实例的集合,疋是公理的集合。 联系作者:汗鹏,E-mail:pwangseut锄gmai!.corn 基于语义子图的本体匹配方法 6l 定义2(本体匹配):本体Dl和D2间的匹配是由四元组构成的集合: A4={mk 个元素或多个元素构成的表达式,,表示匹配关系,,可以为等价(=)、上下义(|/E)、 不交(上)和重叠(I-I)等;S表示匹配的置信度。 本文只讨论概念间和属性间的l:l形式的等价关系匹配。 定义3(本体匹配的不确定性):由于匹配过程可能缺乏足够的背景知识、丰富的线索 和规整的描述,以及可能受到本体演化和人们主观参与的影响,使得无法确定置信度高的 匹配结果都是正确的,也无法确信置信度较低的结果都不正确,这称为匹配的不确定性。 本体匹配的不确定性是客观存在的,无法彻底消除。匹配的不确定性要求应采用客观 的匹配发现算法,选择可信的匹配线索,并通过诸如对匹配结果的合理性进行验证等手段 过滤掉某些错误匹配,提高匹配结果质量,以尽量减少匹配的不确定性对结果造成的影响。 尽可能减少匹配不确定性的负面影响正是本文匹配方法的出发点。 3.语义子图 3.1语义子图定义 元素标识和注释在一定程度上反映部分语义,但并非每个本体都会提供理想的描述文 本。为了精确理解元素语义,往往还需要考虑与该元素相关的其他元素,并称其为元素的 语义上下文。这里将借助本体图来分析元素的语义上下文。直观上,本体图中与元素相关 的点和边构成了元素在本体中的语义上下文,这种语义上下文是本体图中的一个子图,称 之为元素的语义子图。 定义4(元素的语义子图):e是本体D中的元素,称精确描述e的语义的三元组构成 的子图为e的语义子图Gs(e)。 本文中的语义子图将服务于本体匹配,它具有如下特点: (1)元素的语义子图规模是有限的;(2)语义子图并

文档评论(0)

whl005 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档