- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于文本字符频度点积零水印研究
基于文本字符频度点积零水印研究
摘要:在分析现有文本零水印缺陷的基础上,该文提出了基于字符频度点积的数字零水印的思想,为了能提取更能体现文本特征的字符,该文研究时去除了一些无特征、无意义,并且是大家常用的一些高频词汇,这些词若是统计进来,无疑给系统运行造成了一定的工作量,并且会使特征值出现偏移;在水印的检测上,该文采用向量点积函数作为数字水印的检测模型,保护作品和被检测作品相应文本字符的频度做积运算,并求出cosθ值,根据这一值来确定被检测文本的真伪或是盗版情况;该文还结合了互关联后继树,把水印进行了二维编码和对字符的频度进行统计。经过反复的实验证明:这一思想是非常可靠、科学。
关键词:零水印;频度;点积;互关联后继树;二维编码
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)22-5129-04
随着计算机技术的发展,无纸化办公已经成为了现实。各类电子读物的安全问题也日渐突出,无疑在这一方面数字水印技术起到了举足轻重的作用。加上数字产品易于复制和修改等原因,盗版问题日渐严峻。如何保护所有有者的权利,已经成为世界各国的学者和工程技术人员关注的热点问题。近十年来数字水印技术被广泛认为是解决知识产权问题的关键技术之一,数字水印的研究有助于保护文本数字信息的版权及增加文本数字信息在互联网上传输的安全度。
数字水印技术是指通过一定的算法将一些数据直接嵌入到受保护的数字产品中,但又不影响原有数据变化和使用,并且不能被他人随意修改,只有通过专用的检测工具才能提取的技术。数字水印不仅要实现有效的版权保护,而且加入水印的产品与原始产品使用上没有任何差别。
1 零水印概念和典型水印算法
1.1零水印概念及用途
早期的水印算法都是基于文本格式进行编码的,算法通过改变文本字间距或行间距来嵌入水印,或是基于字符特征编码水印算法一般是通过修改文本字符特征或在文档中附加空格以嵌入水印,这两种算法均是基于HVS 的视觉掩蔽特性来进行嵌入水印。但是加视觉掩膜使得水印的嵌入过程复杂化,不利于现实之中的应??。基于这些问题,提出了零水印的概念。
零数字水印指这种不修改原图像或文本任何数据的水印称为“零数字水印”。零水印技术真正地解决了数字水印的不可感知性和鲁棒性之间的矛盾
1.2目前提出的典型水印算法
尽管水印最近几年才得以发展,但是目前已经提出了许多有关数字水印的算法,这些方法大体上可分为两类:一类是频域水印算法;一类是空域水印算法。
频域水印算法有:1)NEC算法;2)扩展频谱通信技术;3)压缩域算法;4)生理模型算法。
空域典型水印算法有:1)Schyndel算法;2)Patchwork算法。
2 本文水印算法策略
随着零水印算法的出现,从技术上真正的解决了数字水印的不可感知性和鲁棒性之间的矛盾。零水印的构造最为主要的问题是怎样才能提取保护作品最为有代表性的特征
在文献[1]中提到了利用汉字偏旁部首进行编码运算来提取作品特征,偏旁是通过分解合体字而得到的汉字结构符号,所以它不是整个汉字体系的结构成分,而只是其中合体字的结构成分,除了能够充当偏旁的独体字有一定的意义以外,它不是文本构成的最小单位,而字包含了一定的意义在里面,所以整字才是文字使用单位;其次,汉字是由偏旁部首构造而成的合体字或是独体字,所以不同的汉字可能有相同的偏旁部首,所以这种统计并不能很好体现的文本的关键特征。
其次,在汉字集中有很多汉字本身是没有意义的,但是这类字却属于最常用字,例如:“的,一,是,了,我,不,人,在,他,有,这,个,上,们,来,到,时,大,地,为,子,中,你,说,生,国,年,着,就,那,和,要,她,出,也,得,里,后,自,以”这42个字符的使用频率之和为30%,这类字符中的“的”、“了”、“地”、“得”、“着”和“也”,并没什么意义,可以去掉频度的统计。
本文论述的水印提取算法是以字符(去除了无意义的常用词)的频度值为文本关键特征,这种水印比部首频度更具有一定意义的代表性;同时采用互关联后继树的商空间变化思想,根据系统中现有的基本字符列表,随机产生出字符变化编码种子,从而给水印进行加密处理。经过以上叙述方法提取出来的关键特征通过互关联后继树进行加密换算,形成一种肉眼不能看懂的密文,为了保证第三方保存的水印的原版性,该文提出了采用MD5对密文水印进行了hash值的求取,并一道交由第三方进行注册保存。
3 算法设计与实现
3.1 利用互关联后继树进行加密和对字符的频度进行统计
互关联后继树[8]是由复旦大学胡运发教授提出的一种新型的数据索引模型。其基本思想是将任何文字(或符号)序列看成二维符号序列空间(即由符号和编号组
文档评论(0)