- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉文古籍标准化元数据转换分析与应用word格式论文
独创性声明本人声明所呈交的学位论文是我个人在导师的指导下进行的研究 工作及取得的研究成果。尽我所知,除文中已标明引用的内容外,本 论文不包含任何其他人或集体已经发表或撰写过的研究成果。对本文 的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完 全意识到本声明的法律结果由本人承担。学位论文作者签名: 日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定, 即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论 文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印 或扫描等复制手段保存和汇编本学位论文。必威体育官网网址□,在年解密后适用本授权书。 本论文属于不必威体育官网网址□√。(请在以上方框内打“√”) 学位论文作者签名:指导教师签名:日期:年月日日期:年月日1绪论1.1 研究背景国内的古籍数字化工作,已经开展了很多年了。一直以来,古籍数据大多以中 国机读目录格式(CNMARC)数据的形式存在,虽然 CNMARC[1]是基于国际化标准 MARC(Machine-Readable Cataloging)[2]数据制定的国家标准,但在实施工作中,各地 方图书馆实际所采用的标准不尽相同。而且 CNMARC 数据的可读性、可统计性、可 检索性以及可输出性,已经不符合数字化信息的基本要求了。此外,还存在大量的 古籍数据由 Excel、Word 等非结构化数据组成,它们同样存在着这些问题。随着网络技术的发展,古籍数字化工作由线下转移到线上,建立古籍元数据模 型,将古籍数据由传统非结构化数据向结构化数据转换,以及实现古籍信息的检索 和输出,这在国内依然是一个比较新颖的课题,没有很成熟的方案。1.1.1古籍数字化的现状20 世纪 90 年代末,科技发展进入了一个数字化和网络化的时代,古籍数字化的一些相关技术也已相继发展并逐步成熟起来。自 1998 年中国数字图书馆的启动,古 籍的数字化有了很大的发展。[3]目前,古籍有两种录入方式。一种是“全文版”形式,一种是“图像版”形式。 “全文版”形式是将古籍逐字输入计算机,并在检索系统的支持下对文本逐字检索。 “图像版”形式是利用数字扫描技术将古籍以图像形式存入光盘。[3]从整体上来讲,各图书馆的古籍数字化工作进展缓慢,一个全国统一的古籍数 据库没有建立起来。此外,“图像版”形式古籍在互联网上的使用也比较少,古籍数 字化工作依然是任重而道远。1.1.2服务平台对古籍数字化现状的影响古籍数字化服务平台的建设,将建立科学的古籍元数据模型,使用统一的数据 库设计,并将古籍传统数据转换为古籍元数据,以及提供古籍信息的检索和编目服 务。由于服务平台将在全国各大图书馆部署运行,将形成全国统一的古籍数据库。 平台是基于 Web 的,所有信息都通过互联网来流通。服务平台的建设,将能够加速 古籍数字化的进程,提高古籍数字化水平。1.2 课题来源、难点、研究目的及意义课题的来源本课题来源于国内某图书馆需求而开发的一套基于 Web 的分布式服务平台—— 古籍数字化服务平台。该平台致力于利用先进的计算机和网络技术,在保证工作质 量的基础上,达到方便、快捷、高效的工作管理目标,并为公众提供优质服务,及 时展现古籍普查成果,提高公众的古籍保护意识。课题的难点当前,在古籍普查工作的过程中,我们发现,各图书馆前期古籍信息建设投入 大,但数据格式标准不统一。其中,国家图书馆、首都图书馆、湖北图书馆、浙江图书馆、北京大学图书馆等采用 CNMARC 格式进行存储,见图 1.1。天津图书馆、甘肃图书馆、云南图书馆、 杭州图书馆、青岛图书馆、苏州博物馆、中山图书馆、中山大学图书馆等采用由十 六表 Excel 组成的古籍普查表进行存储,见图 1.2。南京图书馆则采用 Access 进行古 籍数据存储,见图 1.3。此外,还有很多图书馆各种格式兼有,甚至同一种载体的标 准也不尽相同。图 1.1 中国机读目录格式数据(CNMARC 数据)图 1.2 十六表古籍普查表图 1.3Access 数据基于以上问题的考虑,很有必要设计统一的古籍元数据模型,对古籍信息进行数字化处理并存储到数据库中,从而实现存储的统一。 由于各馆前期古籍信息建设投入大,存在大量的传统非结构化数据,仅国家图书馆有 30 万条 CNMARC 数据。这些传统非结构化数据格式标准不同,以中 CNMARC 格式、十六表 Excel、Word 和 Access 为主。因此,需要将古籍传统数据转换为古籍 元数据存储到数据库中。在古籍信息检索方面,当前广泛用于 CNMARC 数据管理的 ILAS 系统[4](Integrated Library Automation System),当
您可能关注的文档
- 国有a股上市公司高管薪酬与公司绩效相关性分析word格式论文.docx
- 国有电信企业政策执行力提升研究——以湘潭市联通公司为例word格式论文.docx
- 国有电力企业的中高级管理人才培养和使用分析——以jt市电力公司为例word格式论文.docx
- 国有公司监事会制度分析word格式论文.docx
- 国有股减持主体权益问题分析word格式论文.docx
- 国有股份制商业银行公司治理结构之法律分析word格式论文.docx
- 国有化工企业社会责任与环境可持续发展关系研究—以s市t化工集团为例word格式论文.docx
- 国有股权信托制度分析word格式论文.docx
- 国有股权行使主体的重塑及其利益保护机制分析word格式论文.docx
- 国有建筑施工企业项目成本管理分析——以四川华西集团为例word格式论文.docx
- 汉魏乐器发展分析word格式论文.docx
- 汉译英过程中逻辑连接的转化——以《微风入林》的英译为例word格式论文.docx
- 汉阳工业区龟北片区产业类历史建筑保护与再利用分析——以汉阳造文化创意产业园为例word格式论文.docx
- 汉阳陵博物馆建筑节能分析word格式论文.docx
- 汉译英新闻翻译增补手段的有效性探讨——以2009年南宁政务网新闻为例分析word格式论文.docx
- 汉译英作为新cet语法结构测试题型的效度分析word格式论文.docx
- 汉英“名名结构”对比分析及互译研究word格式论文.docx
- 汉译英新闻翻译增补手段的有效性探讨——以2009年南宁政务网新闻为例研究word格式论文.docx
- 汉英“先时”类副词性关联词语比较研究 ——功能语言学视角word格式论文.docx
- 汉英导游口译中补偿策略的应用——张氏帅府导游口译实践报告word格式论文.docx
最近下载
- 海信日立空调工程安装操作标准.pdf VIP
- 2021-2027全球及中国红外探测器芯片行业研究及十四五规划分析报告.docx VIP
- 2025-2026学年小学美术二年级上册(2024)岭南版(2024)教学设计合集.docx
- 02s404防水套管图集.docx VIP
- NASA认知负荷评估量表(TLX).docx VIP
- 20以内加减法练习题(a4).pdf VIP
- 光纤通信考试题及答案.doc VIP
- 天津市南开区2024-2025学年九年级上学期期末语文试题(含答案).pdf VIP
- 2025年公路水运安全员证考试题库答案.docx
- (推荐!)《ISO 37001-2025反贿赂管理体系要求及使用指南》专业深度解读和应用培训指导材料之7:9绩效评价(2025A1).docx VIP
文档评论(0)