中国历代典籍总目分析系统介绍.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国历代典籍总目分析系统 (HBCC v1.0) 产品说明 中国国际图书贸易集团有限公司 北京大学数据分析研究中心 北京欣诺格科技有限公司 2010年8月 设计理念和定位 1、产品设计理念 “中国历代典籍总目分析系统”是由国家图书馆出版社出资建设、国家图书馆古籍馆和北京大学数据分析研究中心强强联合,历时两年研制的大型古籍文献目录知识服务系统,其设计理念是基于知识本体构建综合性古籍文献知识库。 国家图书馆和北京大学相关专家在对知识本体和国际图书馆协会联合会《书目记录的功能需求》标准展开深入研究的基础上,首次在文献领域采用实体关系分层描述古籍书目并构建古籍文献知识本体。按照古籍文献知识本体结构和时代分布情况,“中国历代典籍总目”综合分析存世文献著录数据和历史文献著录数据,避免了同类系统只针对存世文献进行检索分析的缺点,为实现“辨章学术,考镜源流”的目标奠定了基础。 2、产品定位 “中国历代典籍总目分析系统”全面汇总中国历代书目,全方位展现华夏五千年文明成果,堪称当代“历史艺文志”,也是全球首个“华夏历史e文志”。目前,本产品形成了包含总计240万条古籍文献书目信息的综合性古籍文献知识库,是全球收录最广、数据最全的权威汉籍目录数据库。并且,在古籍文献知识库的支持下,“中国历代典籍总目”除实现了基本的目录检索功能外,还能够通过在古籍文献中分析责任者、责任时间、责任行为、版本特征,以及装帧特征等多种维度的相关性,进一步揭示数据背后隐藏的丰富知识。是目前世界上具有划时代意义的古籍文献目录知识服务系统。 3、应用领域 ◇为普通读者提供基础文献知识服务,是古籍数字图书馆的重要组成部分; ◇为专业研究人员提供深层知识挖掘和知识重组等高级服务; ◇为全国古籍普查工作提供业务工具,提高普查工作效率; ◇为文化事业和商业经济提供有效的知识咨询服务。 产品简介 数据来源 该系统数据内容详细,数据关系完整,囊括了各类经典的汉籍目录,并且还在不断的扩充中。目录包括史志目录、官修目录、私藏目录、知见目录、公藏目录、专科目录、丛书目录、珍贵古籍名录等。书目内容包含品种信息、版本信息、印次信息和藏本信息等,每一条书目数据都处在由这些信息组成的多维知识数据空间中。 功能特点: “中国历代典籍总目分析系统”拥有强大的全文检索和高级检索功能。除支持繁简通检外,还支持以书名、书目范围、书目分类、书目层级、版本类型、版本时代、责任者、责任行为为条件,进行全文范围的书目信息检索。 “中国历代典籍总目分析系统”与其它系统的显著区别在于其具有强大的多维分析功能,其中最主要的多维分析功能之一即责任者相关性多维分析。同一书目著录的责任者之间通常具有很复杂的社会关系,在品种、版本、印次和藏本层次上,通过对这些责任者著录信息进行定量分析可以获得较多的学术传承、交游往来甚至姻亲关系的知识。同时,在海量数据的基础上,“中国历代典籍总目”还可以对书籍的成书年代、品种、藏地等进行多维分析,以获得定量的学术发展和研究重点的历史分布情况。 产品功能介绍 1、采用自然语言处理技术抽取古籍书目信息 本系统采用自然语言处理技术,先由计算机完成目录原数据的自动标注和切分,并在此基础上完成信息抽取工作和数据语义规范;然后,计算机通过专家知识自动分析结果中的问题,并以“纵向校对”方式组织数据提交人工审校。经过反复自动分析和人工校对,有效保证数据的质量。截止2009年10月,共对27部目录书进行处理,完成近210万条书目数据的处理。 2、基于语义的数据检索 为提高古籍书目检索的准确率和召回率(查全率),在数据处理语义规范的基础上,本系统实现了书名条件的语义检索。此外,为解决古籍分类法体系种类繁多、内容结构复杂、现代人难于掌握的难题,本系统完成了各种古籍分类法语义映射建设,实现了分类扩展检索功能。 3、实现专家知识固化与共享 系统首先根据专家知识,按照书目文献的知识体系结构,从不同知识维度组织数据,提供多种导航功能;在此之上,系统提供了检索方法保存共享机制,为进一步方便专家知识的共享与传播提供了保障,使该系统成为不仅是专家学者的学术研究工具,而且也是文献书目等专业的教育教学平台。 4、古籍文献责任者相关性分析 古籍目录中的责任者信息是研究责任者之间学术和社会关系的重要线索。系统以书目数据著录为桥梁建立了责任者之间的联系。在对责任行为分类的基础上,分组研究责任者间的学术和社会关系。 如图,以罗振玉为例,系统通过多维分析,发现他与王国维关系度极高,通过进一步研究发现,其关系多为互校、互序等,显示出他们是学术水平相当的师友关系。 5、古籍文献成书年代分布统计分析 本系统能够通过按层次描述古籍文献本体,自动统计分析古籍文献成书年代;通过同类文献的年代分布情况,可以进

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档