XML结构化数字出版的特点与流程.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
XML结构化数字出版的特点与流程.doc

XML结构化数字出版的特点与流程   XML结构化标引是传统出版的数字化转型核心,出版社的图书或期刊资源只有通过XML结构化转换,才是真正意义上的数字化出版,才能为实现数字产业化、知识集成化发展打下坚实基础。   一、传统出版机构XML数字转型的必要性   我国2014年6月发布的数字出版统计数据显示,我国的数字出版产业正处于高速增长阶段。另据数据统计,全国584家出版社中有256家有数字出版相关产品,但其中只有102家设有数字出版机构,这些出版社的数字化进程,以大学出版社、科学技术出版社、教育出版社为代表走在前列。虽然发展势头良好,但由于类型单一、投资规模不大,没有出现像爱思唯尔、施普林格那样的数字出版企业。大多数传统出版企业的数字出版仍然基于传统出版模式,即单纯的纸质内容数字化或电子化,只是载体形式的变化,而不是产品内容结构的变化,出版社没有对内容资源进行多媒体呈现与集成化、结构化处理[1]。   结构化是数字转型的核心,结构化的首要环节是建立数字化标准,知识分类的基本单元不再基于某一篇文章,而是以文章结构以及词语为基本单元,通过语义标签对文章进行结构化处理。所以,结构化标准是数字化过程中的重要标准之一,结构化质量的好坏直接影响数字化的水平。   在学术出版领域,各大数字出版厂商和数字图书馆也开始规划构建用于文献存档的XML规范,如NLM DTD、AIP(美国物理学会)、BMC、PlosOne等。   另外,文档结构化也是出版社实现数字化编辑系统的核心,数字编辑平台无论是在工作效率上,还是在工作质量上,都远远超过传统编辑出版模式[2]。   二、 XML结构化数字转型的特点与优劣性   1.XML结构化的几个重要环节   首先,采用新技术。即对传统出版资源进行结构化整理,按照语义标准进行分类、存储。传统出版的电子版内容资源仅仅是服务、排版与印制,只包含标题、正文等格式控制命令,没有按照语义标准进行结构化整理,也就无法实现语义检索与分类,所以要采用新技术,通过XML结构化语言对原始资源进行加工与整理。   其次,改造出版流程。传统出版机构要大力开展网络出版业务,或设立完全市场化的数字出版公司。数字化出版可以依托传统的编、印、发环节基础,通过新技术改造,加之与互联网整合形成新的产业模式。随着产业融合的逐渐深入,在数字化浪潮的推动下,原本严格区分的行业边界会愈发模糊,内容提供商、技术提供商和渠道运营商之间的相互融合会越来越紧密。   最后,出版资源数字版权授权解决方案。由于数字出版具有海量存储、有哪些信誉好的足球投注网站便捷、传输快速、互动性强、成本低廉等特点,已经成为战略性新兴产业和出版业发展的主要方向。数字出版的特点也是数字版权面临的问题,政府与企业应加快技术创新和标准制定,为版权保护提供有效的技术手段;同时加大对数字版权侵权盗版行为的打击力度,切实保障著作权人合法权益。   2.XML标记语言的特点   结构化的本质就是为文档建立一个描述框架,通过标识符使文档任一部分(任一个元素)都和其他部分保持关联,关联的级数就形成了结构。标识本身的含义与它描述的文档信息相分离。结构化文档(Structured Document)是由标题、章节、段落、图表、公式等框架结构组成。   XML正是具备这一特性的扩展性标识语言。XML文档是由 XML元素组成的,每个XML元素包括一个开始标记(),一个结束标记()以及两个标记之间的信息(称为内容)。XML允许无限的标记集,各标记集并不表示如何显示,而是表示其含义。例如,可以将XML元素标记为标题、作者或工作单位,等等。   3.XML结构化优势与劣势   XML最初就是为信息标准化所设计,选择XML作为稿件存储格式有下述优点:   (1)树状层次信息结构存储稿件的内容,可以方便地提取索引。即按照父子关系节点存储文档的内容,可以通过统一的XSL模板对文档稿件进行批处理,经过结构化的稿件可以方便信息的提取与索引。   (2)完全以内容为中心,从而分离了不必要的格式信息。对于每一篇稿件,XML可以以树状信息结构存储稿件的内容,忽略排版格式信息,从而实现语义层面上对文档的定义。   (3)只要设计统一的模板即可格式化为单独期刊具体页面格式。可以依据各期刊和图书体例的统一性设计转换模板,实现XML统一转换。   (4)有利于资料的共享和标准化。经过转换的所有文档,可以方便地建立全文数据库,实现内容资源的统一管理,实现知识提取、知识比较、知识关联。并针对选题策划等各种任务需求实现资源共享,实现个性化、片段化、碎片化出版。   (5)可以方便地转换为任意的格式,如HTML、PDF 、RTF等格式,实现多渠道出版。   选择XML作为稿件存储格式有下述缺点:   (1)出版商要

文档评论(0)

guan_son + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档