- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字图书馆数字化文献再处理工具的开发与实践.pdf
技术与应用
http: //
数字图书馆数字化文献再处理工具的
开发与实践*
□ 曾文 徐硕 张运良 / 中国科学技术信息研究所 北京 100038
摘要:数字图书馆运用计算机系统管理各种载体文献的加工与服务,通过网络和通信技术支持用户访问
数字化文献信息资源。数字图书馆对海量数据的处理能力是保证数据质量、支持与深化数字图书馆服务功能
的基础。文章论述数字图书馆中数字文献再处理工具研究的重要性,介绍和阐述已有工作的开展情况,以及
结构化的数字文献再处理工具的开发与实践工作。
关键词:数字图书馆,结构化数据,数字化文献,再处理工具
DOI :10.3772/j .issn .1673—2286.2013.07.010
1 引言 化的一系列基本处理过程。显而易 和非结构化的数字资源。这些加工
见,自动化处理这些海量的数字化 和处理实现文档扫描、条目著录、
2 1世纪以来,计算机通信与网 文献数据是必要的。本文的研究工 文本化、标引、挂接等一系列操作
络技术的飞速发展,使网络已经成 作正是基于这样的研究背景提出 过程,但实际上这些操作只是文献
为人们获取信息的重要途径,而网 和开展的。 资源层处理的基本环节,并未实现
络信息资源正在以惊人的速度不 对数字化资源的深层次数据处理、
断增加,需要存储和传播的信息 2 国内图书馆数字化文 组织和整合。随着文献资源逐年海
量也越来越大,信息的种类和形式 献处理的现状 量式的递增,这种资源处理方式已
也越来越丰富,数字图书馆应运 经难以更好提高数字图书馆文献
而生。数字图书馆作为数字化信息 国内数字图书馆经过十几年来 的检全率以及检准率,也难以满足
仓储,能够存储大量各种形式的信 的发展,文献资源的数字化建设得 图书馆及情报研究机构对文献资源
[1,2]
息,特别是文献信息数据是数字图 到了极大的进步 。目前多数的图 深层次信息挖掘和分析的需要,对
书馆处理的重点内容之一。即数字 书馆基本上是采用本地加工和外 这些文献数据资源的再处理和整
化文献数据的处理工作是支持数 包加工的方式,使用的数字化加工 合技术研究是必要的。
字图书馆技术服务的数据基础,良 系统有T PI 、T B S 、T R S 、DI P S等 目前,国内外很多研究人员从
好的数字化存储资源是构建优质 数字资源加工系统,这些系统实现 事对文本信息挖掘和处理的研究工
技术和服务的重要保障。目前,随 已有和现有的纸质文献的基本加 作,并取得相应的研究成果,其中
着各类数字化文献数据资源的丰 工和处理过程,将文献资源制作成 包括对文本数据的关键术语抽取,
富,这些来自不同渠道的原始数据 为数字化文献信息资源,进行储存 文本数据内容自动分析、语义分析
格式和质量不尽相同,而且数据量 和管理,丰富虚拟图书馆的文献信 等涉及数据内容挖掘方面的研究工
[3]
的规模日益庞大。因此,这些数据 息资源,来进行网络化检索和阅读 作 。但这些研究成果基本是建立
通过数字图书馆这个窗口面向用户 等服务,从而促进数字图书馆的发 在数据规整、数量规模有限的文本
服务之前,必须经过对其进行数字 展。这类信息资源又可分为结构化 数据实验基础之上的,当实际应用
* 本文受国家自然科学基金项目“支持面向特定情报分析应用的知识组织系统快速构建关键问题研究”(编号、“十二五”国家科技支撑计
文档评论(0)