信息检索原理和技术.pptVIP

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索原理和技术

第三章 信息检索原理与技术;*;*;*;*;*;*;*;*;*;*;*;*;*;*;第一节 信息检索基本原理; 广义: 信息检索指将信息按一定的方式组织和存储起来,并根据 信息用户的需要查找出有关信息的过程和技术。 Information Storage and Retrieval; 信息检索基本原理的核心是用户信息需求与文献信息集合的比较和选择, 是两者匹配(match)的过程。 一方面是用户的信息需求, 一方面是组织有序的文献信息集合,检索就是从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出(search, locate, hit) 相关的信息。   ;信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下:; 检索点(access point)是检索的出发点,常被称为“检索途径”(approach )。 常用的检索途径有: 1)分类检索 2)主题检索 3)作者检索 4)名称检索 5)号码检索 ;1)分类检索(classification);2)主题检索;3)作者检索;4)名称检索;5)号码检索;其他检索点;EI的检索实例;1.5 信息检索的类型;29;30;31;32;信息检索的类型;计算机检索的优势;信息检索的类型;第二节 信息检索数据库(工具);1、检索工具(数据库)的功能;1)事实检索;2)目录检索:;3)文摘索引检索;2、检索工具(数据库)的分类; (1)参考数据库(Reference Database) 此类数据库信息一般不自足,用户从中获取信息源信息后还需进一步去查找原文。 ; (2)源数据库(Source Database, 在欧洲也称数据银行:Data Bank) 此类数据库数据自足,用户一般不必再查其他信息源,即可满足需求。 ;(3)混合数据库(Mixed Database):此类数据库兼具上两类数据库特点,如多媒体数据库(Multimedia Database)等。 ;3、检索工具(数据库)的构成;数据库与检索系统;第三节 计算机信息检索技术;第三节 计算机信息检索技术;计算机检索的历史和现状;计算机检索的历史和现状;51;52;第三节 计算机信息检索技术;A. 逻辑运算(布尔算符);A. 逻辑运算(布尔算符);;查询:2010 AND 世界杯 AND NOT 小组赛;课堂练习;布???检索的注意事项;B. 截词检索;;;截词符 后截断,将截词符号放在一个字符串的右方,以表示其右的有限或无限个字符不影响该字符串的检索。例如: hyperthyr*可查到hyperthyre、hyperthyreosis、hyperthyroid、hyperthyroidosis、hyperthyroidism等。 hypertensi??可查到hypertension、hypertensive。 涉及到词的单复数、作者、年代、同根词等方面的检索时,选用后截断技术。; 前截断,将截词符号放在一个字符串的左方,以表示其左的有限或无限个字符不影响该字符串的检索。例如: *sighted,可查到farsighted 与nearsighted。 前截断只检索后缀相同的一类词,常用于检索化学化工文献与复合词较多的文献。 ; 中截断,将截词符号放在一个检索词的中间的一种截词方式。只允许有限截断,用于检索词的单复数或英美式不同拚法。例如: wom?n,可查到Woman,Women。 defen?e ,可查到defense,defence。 ;C. 位置检索;C. 位置检索;C. 位置检索;D.检索字段控制;D.检索字段控制;;作者=钱伟长 and 单位=清华大学 and (题名=物理 or 摘要= 物理);检索方式;超文本式、超媒体检索;菜单式检索;命令式检索--专业检索方式;第三节 计算机信息检索技术;3-1 加权检索; 例如:W=计算机(1)情报检索(4)自动化(2) ;3-1 加权检索;3-2 自然语言检索;3-2 自然语言检索;切分歧义;新词识别;3-3 相关信息反馈检索;3-3 相关信息反馈检索;3-4 模糊检索;3-5 概念检索 ;;

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档