第2章计算机检索理论基础.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章计算机检索理论基础

第二章 计算机检索理论基础 计算机检索 定义 简称机检,指利用计算机查找文献信息的过程 。 原理 计算机将输入机检系统的检索提问特征标识(检索词)或用布尔逻辑运算符(and、or、not)联结起来的检索提问式与已存储在系统中的文献特征标识(标引词如:主题词、分类号和类目名称等)进行机械性匹配比较,凡符合给定的比较原则和逻辑运算条件者即为命中文献。 一、计算机信息检索的发展历程 脱机检索阶段 联机检索阶段 光盘检索阶段 网络化检索阶段 脱机检索阶段(Offline Retrieval) 时间:20世纪50年代-60年代 1954年,美国海军军械实验站图书馆研制出计算机信息检索试验系统。 检索人员——〉检索策略——〉成批检索——〉用户 不足: 地理上的障碍;时间上的迟滞;封闭式的检索 联机检索阶段(Online Retrieval ) 时间:20世纪60年代-80年代 1964年,美国医学图书馆开始了MEDLARS联机信息检索系统商业化服务,使计算机信息检索进入了新的历史发展阶段。 ?用户— 检索策略—“人机对话”— 获取所需信息???? 著名的国际联机检索系统有美国的DIALOG系统、ORBIT系统、BRS系统以及MEDLARS系统,还有欧洲的ESA/IRS系统、英国的BLAESE系统等。 联机检索(Online Retrieval ) 联机检索的优缺点 优点 检索速度快,效率高; 检索范围广泛、全面; 检索途径多,方便、灵活; 检索内容新,实时性强; 检索辅助功能完善(人机对话、检索结果输出方式灵活,输出格式多样等)。 缺点 检索费用高; 对检索系统及其文档(数据库)的收录、标引、特点等问题较难了解、熟悉; 检索技术和技巧不易掌握。 光盘检索阶段 时间:20世纪80年代以来 1985年,美国研制出第一个推向市场的光盘产品BiblioFile (LC-MARC)数据库及其编目软件系统,它收藏了美国国会图书馆自1965年以来的全部英语文献书目,以及1900~1964年的部分书目记录。 1986年,我国国家海洋局海洋科技情报研究所首次引进光盘数据库ASFA(水科学与渔业文摘) 。 储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),可随时修改检索策略而具有很高的查全率和查准率等优点。 CA、BA、SCI、CAJ 光盘检索阶段 单机光盘检索 联机光盘检索 光盘库(2-6个光驱,多达500光盘)/光盘塔(8-64个光驱) 网络化检索阶段 时间:20世纪60年代,90年代以来 1972年,MEDLINE率先加入TYMNET通信网,然后又加入TELENET通信网。随后,DIALOG、ORBIT等系统也相继进入网络,从而使信息检索进入到网络检索阶段。 联结了一百多个国家、几万个信息网络、几百万台主机、几千万个终端用户,并能够跨越时空,进行实时信息检索、资源共享的国际性超级计算机网络。目前,90%的国际联机检索系统都已进入INTERNET,世界上许多国家(包括中国)都从INTERNET上获取重要的科技和经济信息资源 。 二、检索理论基础 1.检索技术及其实现 检索技术包括基本布尔逻辑组配、截词、位置算符、字段检索等。 布尔逻辑(boolean operators)组配是现行计算机检索的基本技术,主要通过“和(and,*)” 、“或(or,+)”、“非(not, -)”等将检索词联络起来,常见运算次序是() and not or 截词(truncation) 用截词符号“?”、“*”、“$”加再检索词的前后和中间,以检索一组概念相关或词根相同的词。 后截断 EG:librar*,可检library、libraries、librarian等 主要用于: 词的单复数,company、companies; 年代检索,199?; 词根检索,socio*,可检sociobiology、socioecology、sociolinguistics、sociology等20多个词汇。 有限截断和无限截断 截词(truncation) 前截断 EG:*magnetic,可检electro-magnetic、 electromagnetic、thermo-magnetic、thermomagnetic等,使用很少。 中截断 EG:organi?ation,可检organization、organisation,查找英美不同拼法最有效。 EBSCO数据库 在Dialog系统中,用?作为截词符,主要有: ? wom?n

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档