计算机检索基础技术总结.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
A with B , 表示要求检索词A和B必须同时出现在同一字段中。 A (nW) B ,表示A和B两词相隔n个单词且前后次序不变;n=0时格式为A(W)B。 例如: A near B ,表示要求检索词A和B必须同时出现在同一句子中,并且两词出现的前后顺序不限。 (3)截词算符 检索 是指在检索词的合适位置进行截断,保留相同的部分,用相应的截词算符代替可变化部分进行检索 。常用的截词算符(又称通配符)有“?”和“*”两种,也有采用其他符号表示的。 作用: 主要是解决一个检索词的单复数、词性的词尾变化,词干相同而词尾不同以及英美词汇拼写差异的问题等。 按截断的字符数量可分为有限截断和无限截断两种: 无限截断是指检索词与被检索词实现部分一致,被截断部分的字符不限。常用“*”表示(*=0-n个字母)。 有限截断是指检索词与被检索词只能在指定的位置可以不一致。常用“?”表示(?=0-1个字母)。例如,输入leukemi?可同时检出leukemia、leukemic、leukemid等词的记录;输入Wom?n,可同时检出Woman和women这两个词的记录。 按照截词的位置: 无限截断可分为左截断(后方一致)、右截断(前方一致)、左右截断(中间一致)、中间截断(前后一致)等四种方式。不同的检索系统有不同的截词方式,但以右截断和中间截断比较常见。 右截断是指检索词与被检索词的词干相同而后缀不同。例如,输入 compute*,可同时检索出compute、computer、computerized、computerization等词的记录。 中间截断是指检索词与被检索词的词头和词尾相同而中间部分不同。 例如,输入leuk*ic可同时检索出leukemic、leukamic、leukemogenic等词的记录。 截词检索是隐含的布尔“逻辑或”(OR)检索,其功能是减少检索词的输入量、简化检索程序、扩大检索范围、防止漏检、提高查全率。在西方语言信息检索系统中得到广泛应用。 (4)限制符检索 限制符检索 是将检索词或检索式限制在数据库记录中出现的字段位置。又称为“字段检索”。 作用:是缩小检索范围,提高查准率。 常用限制符有“in”和“=”。例如,gene in TI,表示检索题名中含有gene一词的文献。其中“TI”是题名字段标识符。又如,py=2002,表示检索2002年发表的文献。其中“py”是出版年字段标识符。一般情况下,数据库中记录的所有字段均可做限定字段检索。在进行字段限制检索时,应参阅有关数据库的使用说明,避免产生误检。 四、检索策略的编制与调整 检索策略 是指为实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。由于计算机信息检索是由计算机程序来控制和执行检索匹配操作,检索者与具体的检索过程是分离的,因此,事前制定适宜的检索策略,是成功检索的关键。 广义的检索策略包括信息需求分析、选择数据库、确定检索途径和标识、编制检索提问表达式并准备多种检索方案和步骤等。 狭义的检索策略主要是确定检索词并根据需要用各种运算符一起编制检索表达式的构思。 检索策略编制流程图 信息需求分析 选择数据库 概念分析 换成系统检索用词 拟定检索策略 检索 检索结果是否满意 输出检索结果 Yes No 调整检索策略 (一)信息需求分析 信息需求分析是制定检索策略的依据。信息需 求按范围和程度的不同,大体可分成三种类型: 普查型:需要全面收集有关某一主题的文献资料。具有普查、回溯的特点,要求尽可能高的查全率。 攻关型:需要收集有关某一主题的某一特定方面的文献资料,不强调查得文献的数量,但需要查得的文献具有较强的专指性。 探索型:需要了解和掌握某一领域的必威体育精装版研究动向或研究成果,要求文献具有新颖性和及时性,而对查全率和查准率的要求不高。 在明确课题对查新、查全和查准要求的同时 ,还要明确对信息形式和内容的需求。 形式需求:包括所需文献的类型、数量、语种、年限等。 内容需求:包括检索课题涉及的学科范围、主题内容和有关主题词、分类号等,以及它们之间的逻辑关系。 在上述基础上,确定检索主题,形成若干能代表信息需求而且具有检索意义的主题概念。为制定检索策略做好准备。 (二)选择数据库 选择数据库时要充分考虑其是否与信息需求结合紧密、学科专业是否对口、信息覆盖面是否广泛、揭示信息内容是否及时、检索功能是否完善等方面的问题。 选择合适的数据库,

文档评论(0)

502992 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档