信息检索第8章.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索第8章.ppt

信息检索效果是指用户利用信息检索系统进行检索所产生的有效结果。 (一)信息检索效果的评价指标 以一个检索提问去检索任何一个数据库都会出现 4 个相关量:检出的相关信息量、未被检出的相关信息量、检出的非相关信息量、未检出的非相关信息量。 一、信息检索效果的评价 1.查全率(Recall Factor ) 是对所需信息被检出程度的衡量指标。 2.查准率(Pertinency Factor) 查准率是衡量拒绝非相关信息的指标。 3.漏检率(Omission Factor) 漏检率是衡量损失所需信息的程度指标。 4.误检率(Noise Factor) 误检率是衡量误检出非相关信息的程度指标。 理想的检出结果是查全率与查准率都趋近于1。但在实际检索中,查全率与查准率之间存在互逆相关性。如果追求过高的查全率,就可能降低查准率。 1 R P 1 0 1. 数据库的质量(客观因素) 二、影响检索效果的主要因素 (1)数据库搜集的信息量的数量与质量 (2)对每条信息揭示的深度与广度,著录标引的质量(字段 的数量,主题词的信息标引网罗度) (3)检索途径及检索字段的数量 2. 检索策略的制定(主观因素) (1)正确分析与研究课题 (2)正确选择检索工具与数据库 检索词的专指度:专指度是指检索词揭示信息主题的准确度。使用专指度高的检索词,查准率高,但查全率会相对降低;使用专指度低的词,有利于提高查全率,但会降低查准率。 (3)正确分析课题的主题内容,选择最佳检索词 注意对同义词、近义词、上位概念、下位概念的选取 选用核心主题词及隐含的主题词,排出检索意义不大的概念词。如:研究、进展、发展、现状、技术、方法 生物体的名称(学名、俗名、拉丁学名) 化学物质的名称(常用与代码) 例: 铅 lead(英) plumbum(化) Pb (4)明确检索词之间的逻辑关系,制定合理检索策略 专用名词的正确书写 例:红茶 错:red tea 正确:black tea (5)在初次检索的基础上进一步修正与完善检索 更换与补充检索词 修定检索式 综合思考题: 1. 将“检索项”的选项分别确定在标题、关键词、文摘及全文字段对检索结果会产生什么影响?(提示:量与质) 2.当检索效果不理想时(检出文献量过多、过少、误查率过高,甚至检索结果为零 ),应从多方面寻找原因,力求有针对性地提高查全率或查准率。 * *

文档评论(0)

tangtianxu1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档