一种具有加密功能的智能图文识别方法及系统技术方案

技术编号:38463621 阅读:12 留言:0更新日期:2023-08-11 14:40
本发明专利技术公开了一种具有加密功能的智能图文识别方法及系统,属于数据处理技术领域,本发明专利技术先对图像灰度处理,便于提取轮廓图,在轮廓图提取后,对灰度值进行归一化处理,降低计算量,再对归一化轮廓图进行分类处理,得到图像上各个轮廓对象的类型,在存在文字类型时,从归一化轮廓图上提取出文字部分的文字轮廓图,避免其他非文字部分对文字识别过程的影响,提高文字识别精度,采用文字识别模型对文字轮廓图进行识别,得到文字信息,将文字信息和类型信息加密输出,避免识别方随意获取图文信息。信息。信息。

【技术实现步骤摘要】
一种具有加密功能的智能图文识别方法及系统


[0001]本专利技术涉及数据处理
,具体涉及一种具有加密功能的智能图文识别方法及系统。

技术介绍

[0002]现有针对电子设备(例如扫描仪或数码相机)检查纸上打印的字符,采用光学字符识别技术OCR,但通常情况下,图和文字均在一个图像上,若仅采用光学字符识别技术OCR来识别图像上的文字,那么图像上的非文字部分则会干扰文字部分的检测,影响文字的识别精度。同时,现有识别文字的方法将识别后的文字直接展示出来,造成内容信息容易被窃取,不便于信息的管理。

技术实现思路

[0003]针对现有技术中的上述不足,本专利技术提供的一种具有加密功能的智能图文识别方法及系统解决了光学字符识别技术OCR存在识别精度不高,且信息容易被窃取的问题。
[0004]为了达到上述专利技术目的,本专利技术采用的技术方案为:一种具有加密功能的智能图文识别方法,包括以下步骤:
[0005]S1、采集待识别图文的图像,并对图像灰度处理,得到灰度图;
[0006]S2、对灰度图提取轮廓,得到轮廓图;
[0007]S3、将轮廓图的灰度值进行归一化处理,得到归一化轮廓图;
[0008]S4、对归一化轮廓图进行分类,得到归一化轮廓图上各对象的类型;
[0009]S5、在对象类型存在文字时,提取归一化轮廓图上文字所在区域,得到文字轮廓图;
[0010]S6、采用文字识别模型对文字轮廓图进行处理,得到文字信息;
[0011]S7、将文字信息和对象类型加密输出,得到加密的图文信息。
[0012]进一步地,所述S2包括以下分步骤:
[0013]S21、设定轮廓提取窗口;
[0014]S22、采用轮廓提取窗口在灰度图上滑动;
[0015]S23、以轮廓提取窗口中心的像素点作为当前待处理的像素点;
[0016]S24、判断当前待处理的像素点是否满足轮廓像素点条件,若是,则将当前待处理的像素点保留,作为轮廓图的像素点,若否,则将当前待处理的像素点剔除。
[0017]上述进一步地方案的有益效果为:轮廓提取窗口在灰度图上滑动,每滑动一次后,就要进行步骤S24的判断,判断轮廓提取窗口下中心像素点是否满足轮廓像素点条件,如果满足,则保留下来,如果不满足,则剔除,将轮廓像素点选出来,从而实现轮廓图的提取,通过轮廓提取窗口不断滑动实现对灰度图上像素点的遍历。
[0018]进一步地,所述S24中轮廓像素点条件为:
[0019]条件一:
[0020],
[0021]条件二:
[0022]或,
[0023]其中,为轮廓提取窗口中第个像素点的灰度值,为当前待处理的像素点的灰度值,为灰度差阈值,为轮廓提取窗口下像素点数量,为当前待处理的像素点右侧的第个像素点的灰度值,为当前待处理的像素点左侧的第个像素点的灰度值,为当前待处理的像素点上侧的第个像素点的灰度值,为当前待处理的像素点下侧的第个像素点的灰度值,为当前待处理的像素点左侧、右侧、上侧或下侧的像素点数量。
[0024]上述进一步地方案的有益效果为:上述条件一和条件二轮廓像素点均需满足,在条件一中,需要判断该像素点是否与周边像素点存在较大灰度差,若存在较大灰度差,则该像素点可能是在轮廓上,若不存在,则该像素点肯定不是轮廓像素点,在该像素点满足条件一的情况下,通过条件二尽可能的去避免该像素点为异常点的可能性,通过条件二中任一不等式,去判断该像素点周边像素值的分布情况,若该像素点为轮廓像素点则其周边像素点也存在轮廓像素点,因此其上下左右也存在满足条件二的像素点,通过条件二来进一步确定该像素点为轮廓像素点。
[0025]进一步地,所述S3中归一化处理的公式为:
[0026],
[0027]其中,为第个像素点的归一化灰度值,为轮廓图上最大灰度值,为轮廓图上最小灰度值,为轮廓图上第个像素点的灰度值。
[0028]上述进一步地方案的有益效果为:本专利技术对轮廓图的灰度值归一化处理,减少计算量。
[0029]进一步地,所述S6中文字识别模型包括:CNN神经网络、最大池化层、平均池化层、第一LSTM层、第二LSTM层、特征拼接层和特征识别网络;
[0030]所述CNN神经网络的输入端作为文字识别模型的输入端,其输出端分别与最大池化层的输入端和平均池化层的输入端连接;所述第一LSTM层的输入端与最大池化层的输出端连接;所述第二LSTM层的输入端与平均池化层的输出端连接;所述特征拼接层的输入端分别与第一LSTM层的输出端和第二LSTM层的输出端连接,其输出端与特征识别网络的输入端连接;所述特征识别网络的输出端作为文字识别模型的输出端。
[0031]进一步地,所述特征识别网络包括:第一卷积块、第二卷积块、第一加法器A1、第二加法器A2、第三加法器A3、上采样层、第一卷积层和第二卷积层;
[0032]所述第一卷积块的输入端分别与第一加法器A1的第一输入端和第三加法器A3的第一输入端连接,并作为特征识别网络的输入端;所述第一加法器A1的第二输入端与第一卷积块的输出端连接,其输出端分别与第二卷积块的输入端和第二加法器A2的第一输入端
连接;所述第二卷积块的输出端与第二加法器A2的第二输入端连接;所述第二加法器A2的输出端与第三加法器A3的第二输入端连接;所述上采样层的输入端与第三加法器A3的输出端连接,其输出端与第一卷积层的输入端连接;所述第二卷积层的输入端与第一卷积层的输出端连接,其输出端作为特征识别网络的输出端。
[0033]上述进一步地方案的有益效果为:本专利技术中采用CNN神经网络提取特征,通过最大池化层和平均池化层再分别提取显著特征和全局特征,显著特征传输给第一LSTM层处理,全局特征传输给第二LSTM层处理,将第二LSTM层和第一LSTM层处理后的特征输入特征拼接层,进行特征拼接,再将拼接后的特征输入到特征识别网络中,进行文字识别,本专利技术为了解决梯度消失的问题,将特征拼接层连接到第三加法器A3,一方面能保障特征的丰富性,另一方面能增强部分特征的表达,提高识别精度。
[0034]进一步地,所述特征拼接层的表达式为:
[0035],
[0036],
[0037],
[0038]其中,为特征拼接层的输出特征,为第一LSTM层输出后的压缩特征,为第二LSTM层输出后的压缩特征,为特征的长度,为特征的宽度,为第一LSTM层的输出特征第行第列元素,为第二LSTM层的输出特征第行第列元素,为激活函数,为第一权值,为第二权值,为特征拼接符号。
[0039]上述进一步地方案的有益效果为:本专利技术先对第一LSTM层和第一LSTM层输出后的特征进行压缩处理,实现数据空间上的融合,再将数据分别赋予不同权值,再采用激活函数解决梯度消失的问题,增强模型的适应性。
[0040]进一步地,所述S7包括以下分步骤:
[0041]S71、将文字信息和对象类型转成二进制码,得到信息向量;...

【技术保护点】

【技术特征摘要】
1.一种具有加密功能的智能图文识别方法,其特征在于,包括以下步骤:S1、采集待识别图文的图像,并对图像灰度处理,得到灰度图;S2、对灰度图提取轮廓,得到轮廓图;S3、将轮廓图的灰度值进行归一化处理,得到归一化轮廓图;S4、对归一化轮廓图进行分类,得到归一化轮廓图上各对象的类型;S5、在对象类型存在文字时,提取归一化轮廓图上文字所在区域,得到文字轮廓图;S6、采用文字识别模型对文字轮廓图进行处理,得到文字信息;S7、将文字信息和对象类型加密输出,得到加密的图文信息。2.根据权利要求1所述的具有加密功能的智能图文识别方法,其特征在于,所述S2包括以下分步骤:S21、设定轮廓提取窗口;S22、采用轮廓提取窗口在灰度图上滑动;S23、以轮廓提取窗口中心的像素点作为当前待处理的像素点;S24、判断当前待处理的像素点是否满足轮廓像素点条件,若是,则将当前待处理的像素点保留,作为轮廓图的像素点,若否,则将当前待处理的像素点剔除。3.根据权利要求2所述的具有加密功能的智能图文识别方法,其特征在于,所述S24中轮廓像素点条件为:条件一:,条件二:或,其中,为轮廓提取窗口中第个像素点的灰度值,为当前待处理的像素点的灰度值,为灰度差阈值,为轮廓提取窗口下像素点数量,为当前待处理的像素点右侧的第个像素点的灰度值,为当前待处理的像素点左侧的第个像素点的灰度值,为当前待处理的像素点上侧的第个像素点的灰度值,为当前待处理的像素点下侧的第个像素点的灰度值,为当前待处理的像素点左侧、右侧、上侧或下侧的像素点数量。4.根据权利要求1所述的具有加密功能的智能图文识别方法,其特征在于,所述S3中归一化处理的公式为:,其中,为第个像素点的归一化灰度值,为轮廓图上最大灰度值,为轮廓图上最小灰度值,为轮廓图上第个像素点的灰度值。5.根据权利要求1所述的具有加密功能的智能图文识别方法,其特征在于,所述S6中文字识别模型包括:CNN神经网络、最大池化层、平均池化层、第一LSTM层、第二LSTM层、特征拼
接层和特征识别网络;所述CNN神经网络的输入端作为文字识别模型的输入端,其输出端分别与最大池化层的输入端和平均池化层的输入端连接;所述第一LSTM层的输入端与最大池化层的输出端连接;所述第二LSTM层的输入端与平均池化层的输出端连接;所述特征拼接层的输入端分别与第一LSTM层的输出端和第二LSTM层的输出端连接,其输出端与特征识别网络的输入端连接;所述特征识别网络的输出端作为文字识别模型的输出端。6....

【专利技术属性】
技术研发人员:严松黄奎刘利科
申请(专利权)人:四川集鲜数智供应链科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1