第五章 计算机与互联网信息检索.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 计算机与互联网信息检索

5.1 计算机信息检索基础 计算机信息检索也称为机检,是指以计算机作为手段,通过关盘、联机和网络等方式,从机读数据库中识别并获取所需信息的过程。 5.1.1 计算机信息检索发展简史 1.脱机批处理阶段(1954-1964) 2.联机实时检索阶段(1965-1975) 3.联机网络化、关盘检索阶段(1976-1990) 4.网络化、多元化检索阶段(1990-) 5.1.2 计算机信息检索系统的构成 1.硬件 硬件是计算机系统采用的各种设备的总称,主要服务器、终端器、外围设备以及与数据处理或数据传送有关的其他设备。 2.软件 软件是系统中有关程序和各种文档数据的总称。 3.数据库 数据库是由一系列相关记录组成的有序信息集合,是检索系统中的心虚源,可存储在磁盘、磁带或光盘等载体上,是按照数据来组织、存储和管理数据的仓库。 (1)文献型数据库 1)书目数据库 2)全文数据库 (2)非文献型数据库 1)数值型数据库 2)事实数据库 3)术语数据库 (3)多媒体数据库 多媒体数据库是数据库技术结合的产物,多媒体数据库中相互关联的数据集合是多媒体文档的汇集,包括文本、图像、音频、视频等内容。 4.通信网络 借助于路由器、网关、调制解调器、网络适配器等通信设施,通过网络的数据传输将各个计算机连接起来,每个计算机成为网络中的一个节点,每个节点包含一个或多个数据库网络上的每个节点和其终端只要有授权均可对网络中的数据库进行访问 5.1.3 计算机信息检索主要技术方法 1.文本信息检索 (1)布尔信息检索 布尔检索是广泛使用的检索方式,运用布尔逻辑运算符(Boolean Logic Operator)把检索词连接起来,以便较为精确地表达检索要求,正确运用布尔逻辑运算符可构造功能强大的检索表达式。 1)逻辑“与” 2)逻辑“或” 3)逻辑“非” (2)截词检索 截词检索也是一种常用的检索技术,即在恰当的位置截断检索用词的一个局部,检索时认为凡满足这个局部中的所有字符(串)的文献,都为命中的文献。 (3)短语检索(Phrase Search) 短语检索时一种固定词组检索,常用双引号(半角)将短语包含起来,检索出与检索词完全相同的记录,以提高检索的精度和准确度,因而也称为“精确检索” (4)邻近检索(Proximity Search) 邻近检索也称位置检索,按照检索词之间邻近关系的不同,可以有多种不同类型的位置检索,如同句检索、同段检索、同字段检索等,从而使检索出的文献更确切地满足用户要求,提高查准率。 1)W算符(with) 2)nW算符(nWords) 3)N算符(near) 4)nN算符(nNear) 5)F算符(field) 6)S算符(subfield) 7)C算符(citation) 8)L算符(link) (5)字段限制检索(Field Linmiting) 字段限制检索时对检索词在数据库记录中出现的位置进行限定。 (6)全文检索(Full Text Retrieval) 全文检索时以文本数据为主要处理对象,实现内容信息存储于检索的技术。 2.多媒体信息检索 文本信息以抽象、离散的字符形式存在,冗余较少,可以使用结构化查询语言(SQL)或者超链接检索。 5.1.4 信息检索效果评价 信息效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能力。 5.2 Internet 概述 5.2.1 Internet 的发展历程 Internet的历史可以追溯到1969年,美国国防部高级研究计划署(ARPA)出于军事上的需要组建了由4个交换节点组成的分组式计算机网络系统—阿帕计算机网(ARPANET) Internet得到真正发展是在20世纪80年代 Internet的第二次飞跃是在20世纪90年代,世界各地企业的计算机和局域网纷纷连入Internet 5.2.2 Internet的定义 Internet已经不仅仅是一个计算机网络,而是一个异常庞大的、实用的、可以共享的信息资源库。 5.2.3 Internet的常用工具 1.WWW(world wide web) WWW也称Web ,也称环球信息网、万维网。 2.E-mail(Electronic Mail)电子邮件 电子邮件是Internet 使用最广泛的工具之一 3.FTP(File Transer Protocol)文件传输 在文件传输协议FTP的支持下,你可以把文件从远程计算机拷贝到本地计算机上,或把本地计算机的文件传送到远程计算机 4.Remote Login 远程登录 在网络通信协议Telnet的支持下,用户的计算机通过Internet暂时成为远程计算机的仿真终端,并进行交互操作,从而访问远程计算机对外开放的全部资源。 5.Blog/Blogger博客 中文“博客”一词,源于

文档评论(0)

153****9595 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档