第7章知识检索要点分析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识检索 南京大学信息管理学院 杨建林 知识检索的两类定义 第一类定义包括: “所谓知识检索,就是综合应用信息管理科学、人工智能、认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理和多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取所有媒体类型的知识源,并能准确精选用户需要的结果”【张玉峰】 知识检索的两类定义 第一类定义依然将信息库或信息资源作为被检索的对象,信息检索系统提供给用户的检索结果是不同类型的文件或者这些文件所包含的元数据信息 在第一类知识检索系统中,知识的作用渗透到信息检索过程的各个环节,包括: 利用知识充分表达和优化用户的信息需求 利用知识充分表达和优化检索对象的替代物 利用知识提高信息资源和用户需求匹配的准确程度 利用知识优化检索结果的输出方式 第一类定义认为知识检索是一种高级的信息检索方式,是传统检索技术的继承和发展 知识检索的两类定义 第二类定义包括: “知识检索是指根据用户需求或问题的实际情况找出可利用的知识使问题得到圆满解决的过程”【何立阳】 第二类定义将知识库或知识资源作为被检索的对象,知识检索系统提供给用户的检索结果是有助于用户解决实际问题的知识,而不是不可直接利用的信息集 第二类知识检索系统大大降低了用户进行信息分析获取知识的智力负担 从信息检索的一般过程来看,两类知识检索系统都不够完善,必将走向统一 检索系统的一般模型 表达式构造 标引 资源对象 资源对象 替代物 需求替代物 用户需求 检索结果 相关性判断 本人观点 知识检索是将信息资源或者知识资源按一定的方式组织和存贮起来,并根据用户的需要找出有关信息和知识的过程,其中包括生成资源对象替代物、用户需求替代物、资源对象与用户需求相关性判断、匹配结果的输出等多个环节。 在这个过程中,知识表示、知识存贮、知识组织、知识推理、知识存取和知识发现等多种知识管理技术全面发挥作用,包括利用知识管理技术 充分表达和优化用户信息需求 充分表达和优化检索对象的替代物 提高资源对象和用户需求匹配的准确程度 优化匹配结果的输出方式 从匹配结果中发现隐性的知识 知识标引 从知识资源中提取知识元的过程被称为知识元标引,也被称为知识元挖掘 知识标引是实现知识组织、知识检索的核心,是实现信息服务向知识服务转型的关键技术 实现知识标引,知识才可能被人类有效检索、利用和再创造,信息服务才可能真正转变成知识服务 知识标引的标引对象是文献中包含的数据、公式、事实、结论等类型的知识元,而不是关键词或主题词 以知识标引为基础的知识检索系统提供给用户的不只是文献,而且还直接提供存在于文献中的具体知识 知识与知识元 知识是人们在改造客观世界的实践中所获得的基本概念、认识、经验和规律 知识具有层次性,可以分为四个层次,即:事实——概念——规则——启发式知识,呈金字塔式分布 事实是关于对象、符号和事件之间各种关系的知识,处于知识金字塔的最下层 概念是关于具有共同属性的一组对象、事件或符号的知识 规则是一组操作与步骤,是一种形式化的知识表示方法 启发式知识是关于规则的知识,是事实、概念和规则的集合,处于知识金字塔的顶层 知识与知识元 知识元是一类特殊的知识,是指“不可再分割的具有完备知识表达的知识单位,它是构成知识结构的基元” 对应于与知识的金字塔结构,知识元属于事实类、概念类的知识 知识的表示方法 知识表示是人工智能研究的基础问题 比较经典的知识表示方法: 有状态空间表示法 谓词逻辑表示法 产生式规则表示法 语义网络表示法 框架表示法 概念从属表示法 脚本表示法 面向对象的表示法 面向过程的表示法 本体表示法等 知识元的表示 知识元的表示是知识检索应用最为基础的工作 知识元的表示是人们为了描述知识元所作的一组约定,是知识元的符号化和形式化的过程,主要涉及知识元的表示形式、表示与控制的关系、表示与推理的关系及表示与其他领域的关系等方面 作为一类特殊的、最基本的知识,知识元的表示与组织方法几乎完全源自经典的知识表示方法 知识元的表示 对于不同类型的知识元子集,人们选择不同的特征集来描述知识元 为了防止特征集合不能充分描述知识元中的信息,人们通常增加一个内容属性来保存使用自然语言描述的知识元。 知识元的表示 1)学者周宁在文献中采用2元组(Name,value)来标记一个知识元,并使用框架表示法对抽取到的知识元进行有效组织。每个知识元有一个名(Name)和一个值(Value)。名体现了知识元的意义,值是被抽取的信息。 2)肖洪等学者在文献中使用6元组(时间,主体,指标,谓词,数值,单位)来表示数值型知识元的结构,数值知识元主体是数值知识元的描述对象,如行政区域、行业等。实例:(2005年,盘龙区,工业总产值,完成,62.

文档评论(0)

挺进公司 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档