水印信息扩展编码、嵌入、评估、检测提取方法和装置制造方法及图纸

技术编号:3910415 阅读:431 留言:0更新日期:2012-04-11 18:40
本发明专利技术提出了一种水印信息的扩展编码方法,一种水印信息嵌入、检测提取方法及装置。该在信息载体中嵌入水印信息的方法,包括:对待嵌入的水印信息进行扩展编码,使得该扩展编码后的水印信息中包含隐式模式,所述隐式模式是指扩展编码后的水印信息具有独立于扩展编码前的水印信息的、预定的分布规律和统计特性;以及将所述扩展编码后的水印信息嵌入所述信息载体中。其对应的检测提取方法则是利用所述隐式模式的统计及分布特征自适应地进行水印信息的提取和自纠正提取错误,同时根据隐式模式特征的量化结果得出水印信息提取可信度。根据本发明专利技术的嵌入扩展模式水印信息的方法和装置具有可视性好、抗打印扫描、自适应强、稳定性高的特点。

【技术实现步骤摘要】

本专利技术一般地涉及信息工程和文档保护,具体涉及到数字水印的嵌入、评估与检 测提取的方法和装置。
技术介绍
数字水印技术是信息隐藏
中的一个重要组成部分,它是将特定意义的信 息利用数字处理方法以不易感知的方式隐藏在图像,音视频,文本等数字产品中并可通过 一定的技术手段检测出被隐藏的信息。该技术可用于数字产品的版权保护、内容验证与防 伪、操作跟踪及秘密通信等。根据信息载体的不同,数字水印可分为图像数字水印,音视频 水印和文本数字水印等几个主要的类别。例如,文本数字水印领域的特点是水印信息隐蔽 在由字符为主要元素的二值文本图像文件中。现有的二值文本图像水印技术可分为与内容无关的技术和内容相关技术,前者又 称为
技术介绍
,是在文本图像之上产生由细小网点构成的一层灰底图像,利用网点空间分 布的变化来隐藏水印信息,显然该技术视觉感较差并且会消耗过多的油墨。与内容相关的水印技术则是利用文档中的字符图像的位置信息或象素点信息或 与象素关联的高层信息(比如语义)进行水印的嵌入与检测。常见的方法有行移/字间距 移,字结构微调以及字符边界象素的局部特征修改,上述方法大都在空域中完成水印的嵌 入与检测,通常在检测前需对扫描得到的灰度图像作二值化处理。 美国专利US 6983056提供了一种利用分块象素特征在二值图像中嵌入水印的技 术,在该专利中每一分割后的子块图像内部分做2部分,根据被嵌入信息的不同,令一部分 黑色象素增加另一部分则减少来实现水印的嵌入;提取水印时候则令这两部分象素相减, 通过与一定的阈值比较来最终确定水印信息。显然该阈值大小不仅与视觉效果紧密关联, 也和其抗打印扫描能力紧密绑定,这两者是互为矛盾的,而文中并没给出平衡这个矛盾的 技术手段。国内公开号为CN 101119429A专利提供了一种按一定步长的奇偶数翻转字符轮 廓线的方法来嵌入水印,该步长所代表的冗余和US6983056专利中阈值一样是其抗打印 扫描攻击的关键所在,但其实际取值受打印及扫描深浅和二值化影响较大,文中只是简单 给出步长的一个经验值,既没给出该步长适合的打印扫描条件,更没涉及到该步长的自适 应提取的问题,这恰是该专利无法解决缩放检测及进一步提高视觉效果的关键所在,也是 其抗打印扫描能力不足的一个因素(体现在对使用环境正常变化下的检测的不稳定,并 没有效地规避不确定性因素)。类似使用步长概念的一系列专利大都存在同样不足,如 CN1996381。国内公开号为CN 1684115A提出一种基于字符拓扑结构的文本数字水印技术,其 核心是通过改变字符字形的拓扑结构,设计出语义上相同字符的多种字形,对这些字形的 拓扑结构进行编码。该技术没引进对不确定性因素(如二值化带来笔画的粘连)的处理, 仅以拓扑结构的理论不变性作为抗打印扫描的前提,因而不可避免给视觉带来较大修改的痕迹,而且为不同的字符不同的字体设计出不同的拓扑结构,其工作量相当可观,同时在其 技术中无论是水印的嵌入还是检测都需要先完成语义字符的识别即OCR处理,这无疑加大 了实现的难度和复杂度。文 章 A Text Watermarking Algorithm based on Word Classification andlnter-word Space Statistics (Proceedings of the Seventh International Conferenceon Document Analysis and Recognition(ICDAR 2003 IEEE) 共了—禾中ff胃 词的分类及在每一分类中利用词间距统计特征来嵌入水印的方法。具体说来通过同左右近 邻词间距的大小比较来定义一个词的类型,两邻的几个词构成一个片段并依据词的类型自 然获得一标识号,同标识号的片段构成一个类,通过研究并修改该类中所有词间距的统计 特性比如均值和方差来实现水印的嵌入。该方法通过构建样本群,采用统计学的技术手段 来消除打印扫描中的随机因素影响,但其能实现的水印容量过小。以上现有技术在平衡视觉效果和抗打印扫描攻击能力方面存在或技术手段欠缺, 或水印容量过小等不足。此外一个普遍的技术特点是这些技术在检测和提取水印信息时都 以假定水印存在为前提,回避或少有提及如何科学地判断水印信息是否存在的问题(也有 部分系统依靠有限的标记信息来判断水印存在与否,但该标记信息易与正常的编码信息混 淆,导致其可信度同样受到质疑)。这个问题等价于,即使水印信息存在但因其所受破坏较 大提取出数据已经不可信的时候如何对其可信度作出正确的评估和判定。
技术实现思路
本专利技术的目的之一是解决现有技术中难以做到水印信息容量,其隐藏的视觉效果 和稳定检测能力三者同时兼顾的问题,特别是解决载体形式为印刷品情况下水印信息以高 可信度自适应地正确检测和提取的问题。不过需要注意的是,即使本专利技术的某一方面不能解决上述全部问题,也不能据此 否定本专利技术该方面的技术方案。根据本专利技术的一个方面,提供了一种水印信息在嵌入前编码的方法,包括对该水 印信息进行纠错编码;对纠错编码后的数据进行扩展编码,使得该扩展编码后的数据中包 含隐式模式,所述隐式模式是指扩展编码后的数据具有独立于扩展编码前的预定的分布规 律和统计特性;其中所述扩展编码是指采用新的编码码元集和新的变换规则改写原水印信 肩、O根据本专利技术的另一方面,提供了一种评估从信息载体中提取出的数字数据是否为 预定水印信息的方法,包括从信息载体中恢复出作为潜在水印信息的编码数据流;根据 预定的隐式模式的特征,计算该恢复出的编码数据流具有该预定的隐式模式的特征中任一 特征的概率;基于所计算出的各个特征概率来计算该编码数据流中存在预定的隐式模式的 整体概率;通过把该计算出的整体概率与一定的阈值比较,来判断该恢复出的编码数据流 中是否存在预定的隐式模式,从而判断该信息载体是否存在该预定水印信息,所述预定的 隐式模式是指在预定水印信息中存在预定的可测量的分布规律和统计特性。根据本专利技术的另一方面,提供了一种在二值文本图像中嵌入水印信息的方法,包 括对待嵌入的水印信息进行扩展编码,使得该扩展编码后的水印数据中包含隐式模式,所 述隐式模式是指扩展编码后的水印数据具有独立于扩展编码前的水印信息的、预定的分布规律和统计特性,其中所述扩展编码是指采用新的编码码元或变换规律改写原水印信息; 从二值文本图像中提取出高频出现的字符图像序列用于水印的嵌入,每个字符图像序列由 相同形状及相同大小但是位于二值文本图像中不同位置的字符图像组成;为提取出的字符 图像序列中每类字符设计变异并对变异后的字符图像和原字符图像赋予不同的编码;以及 根据扩展编码之后的水印数据的编码流,参照字符的差异编码,修改该提取出的字符图像 序列中的字符,从而实现水印信息的嵌入。根据本专利技术的另一方面,提供了一种相应的二值文本图像中预定水印信息的检测 提取方法,包括从二值文本图像中提取出高频出现的字符图像序列,每个字符图像序列由 相同形状及相同大小但是位于二值文本图像中不同位置的字符图像组成;根据同一高频字 符序列内部变异特征属性的统计规律,及预定的字符变异和编码之间的对应关系,从高频 出现的字符图像序列中恢复出编码数据流;根据预定的隐式模式的特征本文档来自技高网
...

【技术保护点】
一种水印信息在嵌入信息载体前编码的方法,包括:对该水印信息进行纠错编码;以及对纠错编码后的数据进行扩展编码,使得该扩展编码后的数据中包含隐式模式,所述隐式模式是指扩展编码后的数据具有独立于扩展编码前的预定的分布规律和统计特性;其中所述扩展编码是指采用新的编码码元集和新的变换规则改写原水印信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:熊怀欣
申请(专利权)人:株式会社理光
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1