- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数字对象散列存储模型的设计与实现.pdf
中国科技期刊数据库 科研 数字对象散列存储模型的设计与实现 吴 彬 有色金属华东地质勘查局,江苏 南京 210007 摘要:通过研究现有数字资源的 装、存储等特点;以散列函数为模型;提出基于散列模型下的数字资源均匀存储方案,并 对比分析基于该模型下的资源分布特点。 关键词:数字对象;散列存储 TP311.13 A 167 1-5780(20 16)08-0 165-02 中图分类号: 文献标识码: 文章编号: 1 引言 (3)如果输入值不同,则经过散列函数计算后,输出 海量数字资源的建设是数字档案馆建设过程中的重要 的结果也必须不同。散列函数主要应用在数字签名及密码加 环节,随着档案馆业务范围的不断 展以及人们对各种资源 密方面,目前较常用的散列函数主要有: 要求的不断提高,大量的数字资料需要通过数字档案馆平台 ①MD5:全称是 Message Digest Algorithm 5 (信息 进行分发和交流,而随着信息化的不断发展,单个资源载体 摘要算法),md5 以512 位分组来处理输入的信息,且每一分 所包含的信息量不断增加、格式不断增多、并且与之相关的 组又被划分为 16 个 32 位子分组,经过了一系列的处理后, 非结构化数据也在增多,这些非结构化数据主要表现为大量 算法的输出由四个 32 位分组组成,将这四个 32 位 分组级 [1] 图片、音视频、XML 文件、相关文档、报告等 ,这些资料 联后将生成一个128 位散列值。 以单个实体的形式存在,为了方便后续对数字资源进行管理 ②SHA1:(Secure Hash Algorithm)这是一种较新的散 和存储,需要将原始的单个数字资源进行封装,形成最小数 列算法,可以对任意长度的数据运算生成一个160 位的数值。 字对象单元,数字对象不仅包含资源实体,还包含资源的元 此外还有 MAC (Message Authentication Code)、CRC 数据信息。 (Cyclic Redundancy Check)这些算法目前已成为国际上 2 关键技术 通用的算法,因此不受平台的限制,使用任何一种平台,采 所有的资源经过封装后形成单个的数字对象后,需要将 用相同的散列函数都会得到相同的结果。 [2] 众多的数字对象合理的组织在一起形成一个大的仓储单元 , 3 散列存储模型的算法实现 在这一过程中的关键是如何快速的定位到数字对象的地址, 目前,在数字档案馆建设过程中,为了可以将资源在不 通常的做法有两种: 同的档案馆之间进行传递,通常资源是按照仓储的形式进行 (1)将每个数字对象存放在关系数据库中的BOLB 字段 组织和存放,对于单个的仓储来说,其大小已经达到以 TB 中,因此只要在数据库中找到数字对象的 ID 号,然后解析 级,采用仓储的形式进行管理所具有的最大优点是当需要共 相应的 blob 字段,便能将资源完整的再现出来。这种做法
文档评论(0)