- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体语义检索.doc
基于本体的语义检索[1] 杨月华, 杜军平 摘 要:本文对基于本体的语义检索进行了综述。从自然语言处理、基于概念的方法以及基于本体三个方面来实现语义在信息检索中的集成和应用。 关键词:本体;语义;检索;信息检索 传统的信息检索方法或有哪些信誉好的足球投注网站引擎,无论是关键字符的匹配,还是结合布尔逻辑运算提供更为复杂的查询表达方式,都是以关键词匹配为基础的。这种方法有两种缺陷:检索结果只是在字面上符合用户的要求,实际内容往往偏离用户的需要。用户输入的查询稍有偏差,检索系统就无法确定用户的真正需要,因而无法提供正确的结果。 为了解决这些问题,研究者尝试从语义的角度进行考虑,提出了各种新的方法和技术,也取得了很多的成果。通常的研究主要从自然语言处理、基于概念的方法以及基于本体的思路三个方面来实现语义在信息检索中的集成和应用。 1994年Voorhees就曾提出基于本体的查询扩展,使用了本体中的概念进行查询扩展,并得出最有效的方式是利用本体中的同义词和特定的子类关系进行扩展。此后,基于本体的查询扩展研究侧重于两个方面——基于结构化的方法和基于注释的方法。前者着重从本体的结构信息中抽取出相似度衡量的依据,而后者则通过计算本体术语的定义中的重叠次数来衡量语义相似度。 Maki在2003年提出了基于本体结构的方法,基本的思想是利用本体中的路径来进行用户查询的扩展。在本体的结构图中,每个概念的节点都与其他节点有连通的路径,因此对用户查询进行扩展时,可以选择与该节点连通的路径上的概念。在对概念选择时,Maki提出利用一系列的关系边和概念节点之间相似度的方法来进行排序,优先选择与被扩展概念相似度大者。而计算相似度的方法依赖于本体的结构,例如进行比较的概念之间路径的数量、长度以及路径中存在关系种类数、路径中节点种类等,都可以作为衡量的标准。 2004年,Navigli提出了基于本体注释的查询扩展方法。该方法假定了在本体中相似的概念或术语也具有相似的定义,使用了WordNet中的概念并对其进行扩充了注释。在计算扩展概念之间的相似度时,对概念的注释中出现的普通单词或短语进行统计,以此来决定两个概念是否相似。 Philip Nour在2000年使用了基于本体的方法在项目开发经验库中建立关于经验的索引,项目管理者、使用者可以通过该索引在经验库中查找信息,并规划当前的项目,例如查找关于“测试中等大小软件系统的方法”,将会得到“测试”的子概念“黑盒测试”和“白盒测试”,以便于从经验库中获得以前的经验。Soldar在2001年提出了语义检索模型的体系结构,以便于从科学数据中提取语义。Khan和McLeod设计并实现了一个用本体构造的基于概念的模型用于文本检索。ATT建立了一个应用本体技术的信息检索系统FindUR系统,通过使用描述逻辑系统规定的描述逻辑语法,表达了Wordnet中定义的词汇间的同义、上义和下义关系,获得简单的背景知识,并调用推理系统来完成推理任务,得到某个词汇的同义词集合、上义词集合以及下义词集合,从而可以实现查询扩展。但该系统从本质上仍然是基于语法的,因其并没有使用本体中的词汇去标记文档,只是强调利用本体来实现查询扩展,而查询输入的词汇本身也并非是依据本体中的词汇来建立。 基于本体论和多主体的信息检索服务器是一种利用多智能主体和本体理论设计的信息检索服务器,集成了界面主体、预处理主体、管理主体、信息处理主体和具有移动性的信息搜集主体,并利用本体对文档进行领域分类,同时对用户的查询信息进行规范。基于本体的信息检索主体MELISA用于在医疗专业领域检索参考文献。但这两项研究都没有使用形式化的本体语言来建立本体,没有考虑本体的推理问题,对本体的应用还是很粗略的。 基于本体的信息检索模型采用了描述逻辑作为构造本体的本体语言,使用本体中定义的词汇来标记文档,生成基于本体的文档逻辑视图和用户信息需求逻辑视图,从而可以实现语义层次的检索,使检索性能大大改善。但是该文只考虑了概念间和个体间的等价关系,忽略了本体所能提供的许多有用的关系,如概念间的包含关系、概念间的不相交关系、个体与概念间的成员关系等,同时对本体的构建采用的是较简单的描述逻辑,知识表达能力较弱。对于如何在较复杂的关系下实现更有效的信息检索、如何在较强的描述逻辑下保证推理的效率等问题有待于进一步研究。 此外,基于案例的信息检索也采用了本体中的领域概念的分类和层次结构以及part-of关系;在基于本体的检索和发现体系结构的地理信息系统中,本体的建立首先要构建一个共享的词表中的基本术语,这些术语用来描述上下文的信息以及信息资源的内容,此后即可构建出一个相应的本体,基因本体也被应用于生物工程领域,为基因的标注提供了语义支持。 在现有的基于本体的信息检索研究中,无论是采用结构化的方法描述文档,还是采用自动标注的方法进行处理,
您可能关注的文档
最近下载
- 树立正确的入党动机_争取早日成为一名合格的共产党员教案.ppt VIP
- 静脉肾盂造影课件课件.ppt VIP
- 广州交通投资集团公司组织架构和部门职能.docx VIP
- 《超级有氧鼓》主题团建拓展生活服务旅游活动方案.pptx VIP
- 颅内动脉瘤介入手术中动脉瘤破裂的围术期精细化管理策略与案例分析.docx
- Haier海尔260升风冷变频三门冰箱 BCD-260WDCN说明书用户手册.pdf
- 第3讲 把人民放在心中最高位置——把人民放在心中最高位置 (课件)统编版道德与法治高年级读本.pptx
- 2025年中原信托有限公司人员招聘笔试备考试题及答案解析.docx VIP
- 2025年中国人保财险招聘笔试参考题库附带答案详解.pdf
- 《常见恶性肿瘤联合筛查专家共识(2025版)》解读PPT课件.pptx VIP
文档评论(0)