当前位置: 首页 > 专利查询>河海大学专利>正文

一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法技术

技术编号:33404356 阅读:23 留言:0更新日期:2022-05-11 23:27
本发明专利技术提出了一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法,包括1,提取电子档案中的有效图像并过滤掉无效图像,作为需要嵌入数字水印的载体图像;2,将电子档案图像的著录项目编码到汉信码中;3,对汉信码进行二值化处理,获得原始图像水印,并进行分块置乱;4,对载体图像和图像水印进行缩放、灰度化和小波分解;5,再次进行逆小波变换得到嵌入图像水印之后的图像;6,图像水印提取采用嵌入后的载体图像与嵌入前的载体图像进行小波分解和小波逆变换重构。本发明专利技术解决了传统的图像水印信息存储容量有限的问题,通过分块置乱的方式降低了在水印嵌入和提取过程中噪声造成的失真对整体图像水印的影响,提高了汉信码的识别效果。别效果。别效果。

【技术实现步骤摘要】
一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法


[0001]本专利技术属于图像作品水印
,具体涉及一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法。

技术介绍

[0002]随着互联网的普及和信息技术的广泛应用,电子档案图像的版权保护问题也日益突出。数字水印技术作为图像版权保护的一种解决方案,以信息隐藏技术将水印信息嵌入载体图像之中,使水印信息以载体图像为载体,随着载体图像的传播,水印信息也随之传播。其中数字水印的透明性使攻击者难以察觉出水印信息,因而不易剔除,保证了电子档案图像版权的安全性。
[0003]现有的数字水印技术为了保证水印图像的安全性和鲁棒性,采用像素置乱的方式来对水印图像进行处理,此类水印图像多为具有实际意义的图像,如商标图像,在提取过程中虽然会出现失真现象,但是并不影响水印图像的识别。这种方式的缺陷在于水印图像所隐含的信息有限,例如只能读取一个商标名,当水印图像中含有的文字信息过多就会导致提取到的图像水印由于噪声失真导致模糊而无法识别。
[0004]现如今的数字水印技术,在电子档案图像领域上的应用还较少,因为当前的数字水印信息存储容量有限,而在电子档案图像领域中,一个图像是有很多与之相关的著录项目信息的,如何在嵌入更多信息的情况下依旧保持提取到的图像水印较好的识别效果是一个难点。
[0005]面对档案领域的图像需要更多的信息需要嵌入到载体图像中,以实现版权的保护,传统的数字水印技术不能很好的满足这一要求。而采用汉信码或者二维码来对文字信息进行汉字编码并将其作为图像水印的方式显然能够提高图像水印本身所隐含的信息容量。汉信码作为我国自主研发的一种编码方式,对汉字的编码效果要优于二维码等其他类型的编码,并且具有抗畸变,抗无损和信息容量大等显著优势,因此采用汉信码作为信息编码的方案,如中国专利,申请号:201310471737.7,名称:一种基于汉信码与数字水印的防伪方法。但是随着需要编码的文字信息增多,汉信码的结构会变得越来越复杂,而汉信码属于一种高精度编码,传统的像素置乱方式在数字水印的嵌入和提取过程中的失真现象极大地影响了汉信码的识别效果。

技术实现思路

[0006]本专利技术的目的在于提供一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法,解决现有技术中传统的汉信码编码的方式将汉信码作为图像水印,虽然能够通过复杂的编码结构提高图像水印的信息存储容量,并通过像素置乱的方式保障图像水印的安全性和鲁棒性,但是在图像水印嵌入和提取过程中噪声造成的失真极大地影响了提取到的图像水印的识别效果的技术问题。
[0007]为了解决上述技术问题,本专利技术采用采用如下技术方案实现:
[0008]一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法,包括如下步骤:
[0009](1)提取电子档案中的有效图像作为候选载体图像集合,过滤掉其中无效的图像,并将过滤后的图像作为需要嵌入数字水印的载体图像,并在载体图像集合文件中保存;
[0010](2)将电子档案图像的著录项目编码到汉信码中;
[0011](3)对步骤(2)中的汉信码进行二值化处理,获得原始图像水印,并对此图像水印进行基于Arnold变换的分块置乱,并将置乱后的图像作为需要嵌入的图像水印;
[0012](4)对步骤(1)中的载体图像进行缩放和灰度化,并对载体图像进行二级二维Haar小波变换实现小波分解;
[0013](5)对步骤(3)中的图像水印进行缩放,并对图像水印进行二级二维Haar小波变换实现小波分解;
[0014](6)将步骤(4)中经过变换的载体图像和步骤(5)中经过变换的图像水印的小波变换低频系数相加,然后生成一个新的小波系数,最后再进行一次逆小波变换即可以得到嵌入图像水印之后的图像;
[0015](7)图像水印提取采用嵌入后的载体图像与嵌入前的载体图像进行小波分解和小波逆变换重构,并通过置乱密钥进行Arnold逆变换恢复原始图像水印。
[0016]本专利技术提出的通过对汉信码进行Arnold的分块置乱方法和二级二维Haar小波变换实现的数字水印嵌入和提取方法不仅充分利用了汉信码字符编码效率高,信息密度大,信息容量大,抗污损和畸变能力强的优点,解决了传统的图像水印信息存储容量有限的问题,而且考虑到汉信码识别需要较高精度的特性,通过分块置乱的方式降低了在水印嵌入和提取过程中噪声造成的失真对整体图像水印的影响,提高了汉信码的识别效果,使得其在电子档案图像的版权保护上的实用性更强。
[0017]申请号:201310471737.7,名称:一种基于汉信码与数字水印的防伪方法,该专利提出的方法在应对结构复杂的编码(结构复杂是因为档案领域需要存储的信息容量多导致编码结构复杂)时由于噪声产生的失真会极大的影响水印识别效果,实际测试将图像的著录信息(30字符左右)编码后基于像素置乱,嵌入提取然后逆变换恢复得到的图像水印是几乎是无法识别的。而本专利技术采用的分块置乱对汉信码能较好保持编码的整体完整性,应对噪声的能力具有显著优势。本专利技术的重点在于提高图像水印的信息容量,因此采用汉信码编码,同时解决了像素置乱的方式造成的识别效果差的问题。
[0018]进一步优化,所述步骤(1)具体包括:
[0019](11)对于收集到的PDF格式电子档案做基于fitz库的正则匹配来提取图像元素;
[0020](12)提取到图像元素后,将其元素转化为像素后再以图像形式写出,并将其作为候选载体图像集合;
[0021](13)采用图像像素阈值法对提取到的图像进行过滤过滤,根据需求设置固定的像素阈值,当提取图像像素pix.siz小于像素阈值,则会被过滤掉;
[0022](14)将过滤之后的图像整理为需要嵌入图像水印的载体图像,并在集合文件中保存。
[0023]进一步优化,所述步骤(2)具体包括:
[0024](21)确定著录项目信息,包含档案馆代号、文件编号、图像编号、文字说明和保管
期限,并将著录项目信息作为输入数据进行编码;首先根据输入数据进行数据分析,确定要进行编码的字符类型;
[0025](22)根据步骤(21)中的字符类型确定编码模式;
[0026](23)将输入数据用二进制位流表示:每个模式的编码形成的二进制位流都包含模式指示符、字符计数指示符、编码后的信息位流和模式结束符四个部分;
[0027](24)根据所有的位流信息生成信息码字序列,并结合汉信码信息纠错分块表将信息码字序列进行分块,计算每部分对应的纠错码字,信息码字和纠错码字按块组合得到最终的数据码字;接着确定汉信码功能图形,完成其码图的放置,得到矩形结构的汉信码符号;将数据码字进行重排,并将其转换为对应的二进制位流形式,依次填入信息编码区;最后将得到汉信码符号进行掩模处理,并在功能信息区填入对应的功能信息,实现输入数据到汉信码符号的转换。
[0028]进一步优化,所述步骤(22)中,汉信码的主要编码模式包括数字模式、T本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法,其特征在于,包括如下步骤:(1)提取电子档案中的有效图像作为候选载体图像集合,过滤掉其中无效的图像,并将过滤后的图像作为需要嵌入数字水印的载体图像,并在载体图像集合文件中保存;(2)将电子档案图像的著录项目编码到汉信码中;(3)对步骤(2)中的汉信码进行二值化处理,获得原始图像水印,并对此图像水印进行基于Arnold变换的分块置乱,并将置乱后的图像作为需要嵌入的图像水印;(4)对步骤(1)中的载体图像进行缩放和灰度化,并对载体图像进行二级二维Haar小波变换实现小波分解;(5)对步骤(3)中的图像水印进行缩放,并对图像水印进行二级二维Haar小波变换实现小波分解;(6)将步骤(4)中经过变换的载体图像和步骤(5)中经过变换的图像水印的小波变换低频系数相加,然后生成一个新的小波系数,最后再进行一次逆小波变换即可以得到嵌入图像水印之后的图像;(7)图像水印提取采用嵌入后的载体图像与嵌入前的载体图像进行小波分解和小波逆变换重构,并通过置乱密钥进行Arnold逆变换恢复原始图像水印。2.根据权利要求1所述的用于PDF格式电子档案图像的数字水印信息嵌入及提取方法,其特征在于,所述步骤(1)具体包括:(11)对于收集到的PDF格式电子档案做基于fitz库的正则匹配来提取图像元素;(12)提取到图像元素后,将其元素转化为像素后再以图像形式写出,并将其作为候选载体图像集合;(13)采用图像像素阈值法对提取到的图像进行过滤过滤,根据需求设置固定的像素阈值,当提取图像像素pix.siz小于像素阈值,则会被过滤掉;(14)将过滤之后的图像整理为需要嵌入图像水印的载体图像,并在集合文件中保存。3.根据权利要求1所述的用于PDF格式电子档案图像的数字水印信息嵌入及提取方法,其特征在于,所述步骤(2)具体包括:(21)确定著录项目信息,包含档案馆代号、文件编号、图像编号、文字说明和保管期限,并将著录项目信息作为输入数据进行编码;首先根据输入数据进行数据分析,确定要进行编码的字符类型;(22)根据步骤(21)中的字符类型确定编码模式;(23)将输入数据用二进制位流表示:每个模式的编码形成的二进制位流都包含模式指示符、字符计数指示符、编码后的信息位流和模式结束符四个部分;(24)根据所有的位流信息生成信息码字序列,并结合汉信码信息纠错分块表将信息码字序列进行分块,计算每部分对应的纠错码字,信息码字和纠错码字按块组合得到最终的数据码字;接着确定汉信码功能图形,完成其码图的放置,得到矩形结构的汉信码符号;将数据码字进行重排,并将其转换为对应的二进制位流形式,依次填入信息编码区;最后将得到汉信码符号进行掩模处理,并在功能信息区填入对应的功能信息,实现输入数据到汉信码符号的转换。4.根据权利要求3所述的用于PDF格式电子档案图像的数字水印信息嵌入及提取方法,
其特征在于,所述步骤(22)中,汉信码的主要编码模式包括数字模式、Text模型、二进制字节模式、常用汉字1区编码模式和常用汉字2区编码模式;汉信码对GB18030中的常用汉字采用常用汉字1区、常用汉字2区、GB 1...

【专利技术属性】
技术研发人员:刘喆杨志勇
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1