基于形式概念分析领域本体描述模型研究.docVIP

基于形式概念分析领域本体描述模型研究.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于形式概念分析领域本体描述模型研究

基于形式概念分析领域本体描述模型研究   [摘要]针对如何运用形式概念分析(FCA)协助完成领域本体的描述问题,先阐明基于FCA的领域本体描述原理,进而提出基于FCA的领域本体描述模型,最后以脊椎动物领域为例,给出一个基于FCA的脊椎动物领域本体描述的实例。   [关键词]概念格领域本体本体描述本体推理   [分类号]G350      领域本体描述是一切基于领域本体的知识工程活动的前提,提高领域本体描述的形式化与规范化程度、语义表达能力和本体知识推理能力就成为领域本体描述所一直追求的目标。形式概念分析(FCA)是应用数学的一个分支,它是建立在概念和概念层次的数学化基础之上的一种新的知识描述手段和数据分析工具,运用形式概念分析的方法,可以发现、构造和展示由属性和对象构成的概念及其之间的关系。   FCA和领域本体是两种形式化的知识表示方法,文献指出两者的差异主要体现在:本体的目的是对人能感觉到的现实世界建立共享的概念模型,提供一种共识以支持知识密集型应用。FCA不是为现实建模,而是为人工世界建模,目的是支持用户在给定数据的基础上进行领域分析和建模。FCA中概念的外延和内涵是同样重要的两方面,而本体则强调概念的内涵部分。   FCA已被尝试用于领域本体的描述,代表性的文献有[4-6]等,这为基于FCA的领域本体描述理论的产生提供新的契机。利用FCA可以完善领域概念的属性集和对象集,提高领域本体的语义完备性和形式化程度,自动分析领域的隐藏概念,并对领域概念进行聚类,从而为本体分类关系提供参考,帮助建立领域本体原型。另外,概念格可以帮助完善用描述逻辑进行本体推理的实际情境,为本体推理的公理和规则的编写提供便利。   本文旨在深入研究运用概念格协助完成领域本体描述的基本原理,并提出基于FCA的领域本体描述模型,为后续相关研究奠定基础和提供启发。      1   基于FCA的领域本体描述原理      基于FCA的领域本体描述基本原理可简述如下:领域本体的描述,必须自始至终贯彻工程化的指导思想、标准化的表达方式和规范化的工作步骤。在需求分析的基础之上,通过预处理过程,将领域的结构化、半结构化及非结构化数据转换为领域核心术语集(即核心词汇集),进而将领域核心词汇集依据“对象一属性”的二元关系转换为形式背景,用形式背景来表达领域背景知识。形式背景形成后,在对其优化处理的基础上,通过造格过程,将形式背景转换成概念格,并用相关工具将概念格显化,接着根据实际需求对概念格进行规范化的编辑操作,得出满足领域本体使用需求的合理概念格,此时,可视化的概念格可以良好地展现出概念层次模型,概念层次清晰地体现了概念间的分类关系。在上述过程的基础上,将概念格通过相关操作转换成领域本体原模型,并在领域专家的参与下对领域本体原模型进行属性、实例、关系和公理规则等多方面的充实,最终通过领域本体的形式化过程,用本体描述语言将领域本体表达出来。最后用领域本体推理过程,对领域本体进行检测,并推理出相关隐性知识。         2   基于FCA的领域本体描述模型      根据基于FCA的领域本体描述原理,本文将运用FCA描述领域本体的过程分为四个阶段:准备阶段、分析阶段、描述阶段和推理阶段。从实际操作的层面上来看,上述四个阶段每阶段都包涵着许多错综复杂、相互作用的要素和内容,这给理解和掌握基于FCA对领域本体进行描述这一过程的本质造成了一定的困难。因此,本文采用模型化的思路,抓住这四个阶段中的主要要素并摒弃次要要素,进而深入研究各主要要素间的关系,对基于FCA的领域本体描述过程进行抽象,构建了基于FCA的领域本体描述模型,如图1所示:   各模块的主要任务概述如下:         2.1 准备模块   该模块主要解决领域本体描述的前期准备问题。在知识工程专家、领域专家和领域本体用户三方面对所要建设的领域本体进行深入需求分析的基础上,搜集领域数据,并将其分为三类:结构化数据、半结构化数据、非结构化数据。随后使用相关技术(映射技术、NLP技术等)从各类数据中抽取出领域核心术语集,并将术语集的格式统一为“对象一属性”集,文献[7]阐述了具体的方法:①对结构化数据(一般为关系数据库表),利用逆向工程或映射技术将关系模型转换为E―R图,用数据库表的元组作为对象,而数据库表的属性作为属性,E―R模型的关系表述概念间的关系;②对非结构化数据(一般是领域纯文本)的处理比较复杂,一般是通过自然语言的解析器,将领域文本中的每一个句子转换成一棵语法树,由语法树来分析,将词汇关系分为动宾关系、并列关系、偏正关系、主谓关系等,进而将这些关系转换成“对象一属性”关系;③半结构化数据一般是大量的XML格式的网页以及它们遵循的文档类型定义(XML

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档