本发明专利技术涉及一种隐藏信息检测方法,包括:对待识别文件进行扫描,生成图像文件;其中,所述待识别文件为待检测文档或其碎片,其中,通过对原始文档上全部或部分字进行版式变形嵌入隐形标识获得所述待检测文档;将原始文档生成图像;将待识别文件以及原始文档的图像分别做OCR识别;根据对待识别文件和原始文档的图像的OCR识别结果,得到待识别文件的每个字和原始文档的每个字的对应关系;根据待识别文件的每个字和原始文档的每个字的对应关系,对待识别文件中的每个字的版式变形进行判别。运用该方法检测隐藏信息,可以提高检测的准确性和匹配速度。
【技术实现步骤摘要】
本专利技术涉及计算机通信安全领域,尤其涉及信息隐藏
技术介绍
随着计算机通信技术的普及,利用网络传送电子文件变得越来越普遍。然而,电子 文件却容易使他人轻而易举地复制及传播,甚至被篡改。因此,为了保障电子文件的安全 传输,人们利用密码学的加解密技术,通过软件或者硬件加解密文档,保护电子文件的安全 性。但是加解密技术不能保证电子文件解密后的复制及传播的问题。为了解决这个问题, 1995年,人们提出了信息隐藏技术,即在文档中隐藏某些不可见的、可以表明某些特性,如 版权信息,使电子文档在复制及传播过程中得到保护及追踪。其中,数字水印是近年来比较 热门的技术。数字水印(Digital Watermark)技术是指用信号处理的方法在数字化的多媒体数 据中嵌入隐蔽的标记,这种标记通常是不可见的,只有通过专用的检测器或阅读器才能提 取。数字水印是信息隐藏技术的一个重要研究方向。嵌入数字作品中的信息必须具有以下基本特性才能称为数字水印隐蔽性在数字作品中嵌入数字水印不会引起明显的降质,并且不易被察觉。隐藏位置的安全性水印信息隐藏于数据而非文件头中,文件格式的变换不应导 致水印数据的丢失。鲁棒性所谓鲁棒性是指在经历多种无意或有意的信号处理过程后,数字水印仍 能保持完整性或仍能被准确鉴别。可能的信号处理过程包括信道噪声、滤波、数/模与模/ 数转换、重采样、剪切、位移、尺度变化以及有损压缩编码等。 在数字水印技术中,水印的数据量和鲁棒性构成了一对基本矛盾。从主观上讲, 理想的水印算法应该既能隐藏大量数据,又可以抗各种信道噪声和信号变形。然而在实际 中,这两个指标往往不能同时实现,不过这并不会影响数字水印技术的应用,因为实际应用 一般只偏重其中的一个方面。如果是为了隐蔽通信,数据量显然是最重要的,由于通信方式 极为隐蔽,遭遇敌方篡改攻击的可能性很小,因而对鲁棒性要求不高。但对保证数据安全来 说,情况恰恰相反,各种保密的数据随时面临着被盗取和篡改的危险,所以鲁棒性是十分重 要的,此时,隐藏数据量的要求居于次要地位。目前,典型的数字水印算法是把目标数据待嵌入信息都转换为图像来处理,下面 列举一些典型的数字水印算法1.最低有效位算法(LSB)是L. F. Turner和R. G. van Schyndel等人提出的第一 种数字水印算法,是一种典型的空间域信息隐藏算法。特定的密钥通过m序列发生器产生 随机信号,然后按一定的规则排列成2维水印信号,并逐一插入到原始图像相应像素值的 最低几位。由于水印信号隐藏在最低位,相当于叠加了一个能量微弱的信号,因而在视觉和听觉上很难察觉。LSB水印的检测是通过待测图像与水印图像的相关运算和统计决策实现 的。Stego Dos,White Noise Storm、STools等早期数字水印算法都采用了 LSB算法。LSB 算法虽然可以隐藏较多的信息,但隐藏的信息可以被轻易移去,无法满足数字水印对于鲁 棒性的要求,因此现在的数字水印软件已经很少采用LSB算法了。不过,作为一种大数据量 的信息隐藏方法,LSB在隐蔽通信中仍占据着相当重要的地位。2. Patchwork算法是麻省理工学院媒体实验室Walter Bander等人提出的一种 数字水印算法,主要用于打印票据的防伪。Patchwork数字水印隐藏在特定图像区域的统计 特性中,其鲁棒性很强,可以有效地抵御剪切、灰度校正、有损压缩等攻击,其缺陷是数据量 较低,对仿射变换敏感,对多拷贝平均攻击的抵抗力较弱。3.纹理块映射编码纹理块映射将水印信息隐藏在图像的随机纹理区域中,利用 纹理间的相似性掩盖水印信息。该算法对滤波、压缩和扭转等操作具有抵抗能力,但需要人 工干预。4. DCT (离散余弦)变换域数字水印算法DCT变换域数字水印是目前研究最多的 一种数字水印,它具有鲁棒性强、隐蔽性好的特点。其主要思想是在图像的DCT变换域上选 择中低频系数叠加水印信息。之所以选择中、低频系数,是因为人眼的感觉主要集中在这一 频段,攻击者在破坏水印的过程中,不可避免地会引起图像质量的严重下降,一般的图像处 理过程也不会改变这部分数据。由于JPEG、MPEG等压缩算法的核心是在DCT变换域上进行 数据量化,所以通过巧妙地融合水印过程与量化过程,就可以使水印抵御有损压缩。此外, DCT变换域系数的统计分布有比较好的数学模型,可以从理论上估计水印的信息量。5.直接序列扩频水印算法扩频水印算法是扩频通信技术在数字水印中的应用。 与传统的窄带调制通信方法不同,扩频通信将待传递的信息通过扩频码调制后散布于非常 宽的频带中,使其具有伪随机特性。收信方通过相应的扩频码进行解扩,获得真正的传输信 息。扩频通信具有抗干扰性强、高度保密的特性,在军事上应用广泛。事实上,扩频通信也 可以看作是一种无线电密写方法。抛开其信息论方面的理论依据不讲,单从感知的角度考 虑,扩频通信之所以具有保密性,就在于它将信息伪装成信道噪声,使人无法分辨。扩频水 印方法与扩频通信类似,是将水印信息经扩频调制后叠加在原始数据上。从频域上看,水印 信息散布于整个频谱,无法通过一般的滤波手段恢复。如果要攻击水印信息,则必须在所有 频段上加入大幅度噪声,这无疑会严重损害原始数据的质量。6.其他变换域数字水印算法变换域数字水印并不局限于DCT变换域或傅立叶 谱,只要能很好地隐藏水印信息,一切信号变换都是可行的。近年来,有很多学者尝试用小 波变换或其他时/频分析的手段,在时间/尺度域或时/频域中隐藏数字水印信息,取得了 比较好的效果。评价一种数字水印算法优劣的主要依据包括1.抗干扰能力(鲁棒性)数字水印技术对于鲁棒性有一定的的要求,即它可以抵抗第三方的攻击或正常的、标准的数据操作和变换。换句话说,即使攻击者知道传递的数据 中包含隐藏的重要信息,但也无法将其提取出来,或在不严重损坏宿主数据的情况下难以 将水印破坏掉。鲁棒性测试实际上是一个主动攻击过程,主要测试数字水印对数据同步的 依赖程度、抗各种线性和非线性滤波的能力,以及抵御几何变换等其他攻击的能力。2.信息嵌入量能否在有限的原始信息数据中嵌入足够的特定标示信息。3.信息隐藏度(对原始信息的干扰程度)数字水印的信息量与隐蔽性之间存在 着矛盾,随着水印信息量的增加,作品的质量必然下降。隐蔽性测试需要对水印算法的信息 量与能见度进行评估,给出水印信息量与数据降质之间的准确关系。对于图像、声音等多媒 体数据质量的评估不能仅依据信噪比、峰值信噪比等信号处理中的指标,必须依赖视觉和 听觉的生理模型,否则就不具有科学性,这不仅是数字水印也是数据压缩的基本准则之一。4.安全性安全性测试主要是对破解水印算法的时间及复杂性进行评估,以此作 为水印安全性的指标。上面描述的几种典型的数字水印技术,一般是把待标识的信息,即水印信息,通过 图像处理的方法嵌入。比较适合应用于将标识信息嵌入图像、视频、音频等媒体。这种技术 把文件看作是一般性的流式媒体或者平面媒体,不区分文字信息和其他信息。处理的时候 一般通过频域变换,时域变换等做图像处理。一般这些处理都是通过变换人眼不易觉察的 图像中的信息,如高频信息,来达到嵌入水印的目的。这样的方法类似于JPEG压缩等算法。 但是传统数字水本文档来自技高网...
【技术保护点】
一种隐形编码检测方法,其特征在于,包括: 对待识别文件进行扫描,生成图像文件;其中,所述待识别文件为待检测文档或其碎片,其中,通过对原始文档上全部或部分字进行版式变形嵌入隐形标识获得所述待检测文档;生成原始文档的图像; 将待识别文件以及原始文档的图像分别做OCR识别; 根据对待识别文件和原始文档的图像的OCR识别结果,得到待识别文件的每个字和原始文档的每个字的对应关系; 根据待识别文件的每个字和原始文档的每个字的对应关系,对待识别文件中的每个字的版式变形进行判别。
【技术特征摘要】
【专利技术属性】
技术研发人员:王东临,
申请(专利权)人:北京书生国际信息技术有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。