信息检索第一章绪论教程.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索;;; 信息检索是一门关于信息资源的存储、整理和查找理论及方法的学科,它包括信息资源、检索理论、检索语言、检索工具及使用方法等。它是一门工具性的学科。 ;二、为什么要学习信息检索?;  面对日益增长的信息资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息 ─这就是信息检索所要解决的问题。;三、学习什么内容?----课程内容(1);课程内容(2);四、学习这门课程的现实意义?;;;;;;五、课程学习要求;六、怎样才能学好这门课?;授课与考核方式;四、我们怎样才能学好这门课?;只看到两匹马——有毛病 只看到三匹马——有点儿毛病 只看到四匹马——多少有点儿毛病 只看到五匹马——也许有点儿毛病 ……不合格…… 只看到六匹马——勉强凑合活着吧 - -只看到七匹马——勉强凑合活着吧 只看到八匹马——基本上算正常 ……合格……??????? 只看到九匹马——正常 只看到十匹马——比较优秀 ……良好…… 只看到十一匹马——独俱慧眼 只看到十二匹马——眼睛里不揉沙子 只看到十三匹马——出类拔萃 ……优秀…… 只看到十四匹马——可以去中情局当差 只看到十五匹马——诸葛亮转世 …… 看到十八匹马——上帝来了 ;看到15只: 枣花马2匹; 第二只上方有一人骑马; 天上红云中隐藏一匹; 帐篷画一匹; 帐篷上方隐藏一匹; 闪电是一匹; 远方闪电是一个马头; 树干下方有一只马头; 中间树枝构成一个马头; 上方细树枝构成一个马头; 杂草中隐藏一个马头; 月亮里面隐藏半只; 大石头是一个马头; 二匹马身画一只马头 。; 一、信息 二、知识 三、情报 四、文献 五、信息、知识、情报、文献之间的相互关系 ;一、信息;一、信息;一、信息;二、知识;一、知识;二、知识;三、情报;三、情报;四、文献;四、信息、知识、情报、文献之间的关系 ;第1章 绪论;教学目标: ;1.1 信息检索;1.1.1 信息检索的概念;;2.从信息处理的角度认识信息检索 从信息处理的角度来看,信息检索的基本问题是如何处理信息和信息的结构。这种认识偏重于信息管理领域,认为信息不仅限于传统“文献”的范围,图像、声音、数据等也能反映信息,并把信息检索视为计算机科学技术的一个分支。 这种认识强调如何构造以及利用什么形式来构造信息结构的问题。这种认识对于信息检索工具的设计和组建,具有指导意义。 ;4.全息检索 王永成教授认为,全息检索就是“可以从任意角度,从存储的多种形式的信息中高速准确地查找,并可以任意要求的形式和组织方式输出,也可以仅输出人们所需要的一切相关信息的电脑活动。 任意角度:是指要求检索系统以用户可能的任何检索要求作为出发点,并把这些出发点都设计成“检索入口”; 多种形式的信息:是指在现代多媒体技术能够存储并输出文本、图像和声音信息的条件下,继续发展直至能输出超音频与超视频信息; 任意要求的信息组织形式:是指按用户需求对已检索到的信息加以组织并输出,从而真正实现人机检索过程中“以人为本”的服务宗旨。 输出一切“相关信息”:从存储方面看,系统对存储的文本的外部特征,文本的内涵特征以及其他辅助性特征等的描述与信息本身存在不可避免的差异,应尽量缩小这种差异;从检索一方看,用户对信息需求的认知能力、表述能力也同样影响到其能否检索出与真正的信息需求相关的结果。因此,“相关性”不仅是传统文献检索,也是全息检索的基本特征和评价检索系统的重要参考指标。 ;5.概念信息检索 Chank等专家认为,概念信息检索是基于自然语言处理中对知识在语义层次上的析取,并由此形成知识库,再根据对用户提问的理解来检索其中的相关信息。它与传统文献检索的区别在于,后者是基于关键词为核心的标引与检索,而关键词在很多情况下并不能确切表达文献信息的概念和内容,因此误检与漏检在所难免。 而概念信息检索要对输入的原文内容中的概念,而不是关键字来进行组织和安排,在对其进行语义层次上的自然语言处理基础上,来获取相关的概念和范畴知识,然后通过记忆机制将它们存储到知识库中以备检索。概念信息检索系统一般由记忆机制、语义分析机制、知识库、人机接口等部分组成。;上述观点是从理论角度对信息检索进行定义,但根据实际检索工作的经验,信息检索有广义和狭义之分:; 按检索对象内容区分; (3)事实检索(Fact Retrieval); 按检索方式区分; 思考题:机器检索是否可以完全取代手工检索?为什么? ; 按检索要求区分; 按检索的事件跨度区分; 按检索对象的形式区分; 按检索对象的信息组织方式区分;

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档