一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法技术

技术编号：33404356 阅读：34 留言：0更新日期：2022-05-11 23:27

本发明专利技术提出了一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法，包括1，提取电子档案中的有效图像并过滤掉无效图像，作为需要嵌入数字水印的载体图像；2，将电子档案图像的著录项目编码到汉信码中；3，对汉信码进行二值化处理，获得原始图像水印，并进行分块置乱；4，对载体图像和图像水印进行缩放、灰度化和小波分解；5，再次进行逆小波变换得到嵌入图像水印之后的图像；6，图像水印提取采用嵌入后的载体图像与嵌入前的载体图像进行小波分解和小波逆变换重构。本发明专利技术解决了传统的图像水印信息存储容量有限的问题，通过分块置乱的方式降低了在水印嵌入和提取过程中噪声造成的失真对整体图像水印的影响，提高了汉信码的识别效果。别效果。别效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法

[0001]本专利技术属于图像作品水印
，具体涉及一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法。

技术介绍

[0002]随着互联网的普及和信息技术的广泛应用，电子档案图像的版权保护问题也日益突出。数字水印技术作为图像版权保护的一种解决方案，以信息隐藏技术将水印信息嵌入载体图像之中，使水印信息以载体图像为载体，随着载体图像的传播，水印信息也随之传播。其中数字水印的透明性使攻击者难以察觉出水印信息，因而不易剔除，保证了电子档案图像版权的安全性。
[0003]现有的数字水印技术为了保证水印图像的安全性和鲁棒性，采用像素置乱的方式来对水印图像进行处理，此类水印图像多为具有实际意义的图像，如商标图像，在提取过程中虽然会出现失真现象，但是并不影响水印图像的识别。这种方式的缺陷在于水印图像所隐含的信息有限，例如只能读取一个商标名，当水印图像中含有的文字信息过多就会导致提取到的图像水印由于噪声失真导致模糊而无法识别。
[0004]现如今的数字水印技术，在电子档案图像领域上的应用还较少，因为当前的数字水印信息存储容量有限，而在电子档案图像领域中，一个图像是有很多与之相关的著录项目信息的，如何在嵌入更多信息的情况下依旧保持提取到的图像水印较好的识别效果是一个难点。
[0005]面对档案领域的图像需要更多的信息需要嵌入到载体图像中，以实现版权的保护，传统的数字水印技术不能很好的满足这一要求。而采用汉信码或者二维码来对文字信息进行汉字编码...

【技术保护点】

【技术特征摘要】
1.一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法，其特征在于，包括如下步骤：(1)提取电子档案中的有效图像作为候选载体图像集合，过滤掉其中无效的图像，并将过滤后的图像作为需要嵌入数字水印的载体图像，并在载体图像集合文件中保存；(2)将电子档案图像的著录项目编码到汉信码中；(3)对步骤(2)中的汉信码进行二值化处理，获得原始图像水印，并对此图像水印进行基于Arnold变换的分块置乱，并将置乱后的图像作为需要嵌入的图像水印；(4)对步骤(1)中的载体图像进行缩放和灰度化，并对载体图像进行二级二维Haar小波变换实现小波分解；(5)对步骤(3)中的图像水印进行缩放，并对图像水印进行二级二维Haar小波变换实现小波分解；(6)将步骤(4)中经过变换的载体图像和步骤(5)中经过变换的图像水印的小波变换低频系数相加，然后生成一个新的小波系数，最后再进行一次逆小波变换即可以得到嵌入图像水印之后的图像；(7)图像水印提取采用嵌入后的载体图像与嵌入前的载体图像进行小波分解和小波逆变换重构，并通过置乱密钥进行Arnold逆变换恢复原始图像水印。2.根据权利要求1所述的用于PDF格式电子档案图像的数字水印信息嵌入及提取方法，其特征在于，所述步骤(1)具体包括：(11)对于收集到的PDF格式电子档案做基于fitz库的正则匹配来提取图像元素；(12)提取到图像元素后，将其元素转化为像素后再以图像形式写出，并将其作为候选载体图像集合；(13)采用图像像素阈值法对提取到的图像进行过滤过滤，根据需求设置固定的像素阈值，当提取图像像素pix.siz小于像素阈值，则会被过滤掉；(14)将过滤之后的图像整理为需要嵌入图像水印的载体图像，并在集合文件中保存。3.根据权利要求1所述的用于PDF格式电子档案图像的数字水印信息嵌入及提取方法，其特征在于，所述步骤(2)具体包括：(21)确定著录项目信息，包含档案馆代号、文件编号、图像编号、文字说明和保管期限，并将著录项目信息作为输入数据进行编码；首先根据输入数据进行数据分析，确定要进行编码的字符类型；(22)根据步骤(21)中的字符类型确定编码模式；(23)将输入数据用二进制位流表示：每个模式的编码形成的二进制位流都包含模式指示符、字符计数指示符、编码后的信息位流和模式结束符四个部分；(24)根据所有的位流信息生成信息码字序列，并结合汉信码信息纠错分块表将信息码字序列进行分块，计算每部分对应的纠错码字，信息码字和纠错码字按块组合得到最终的数据码字；接着确定汉信码功能图形，完成其码图的放置，得到矩形结构的汉信码符号；将数据码字进行重排，并将其转换为对应的二进制位流形式，依次填入信息编码区；最后将得到汉信码符号进行掩模处理，并在功能信息区填入对应的功能信息，实现输入数据到汉信码符号的转换。4.根据权利要求3所述的用于PDF格式电子档案图像的数字水印信息嵌入及提取方法，
其特征在于，所述步骤(22)中，汉信码的主要编码模式包括数字模式、Text模型、二进制字节模式、常用汉字1区编码模式和常用汉字2区编码模式；汉信码对GB18030中的常用汉字采用常用汉字1区、常用汉字2区、GB 1...

【专利技术属性】
技术研发人员：刘喆，杨志勇，
申请(专利权)人：河海大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人