一种基于可形变卷积的批量模糊标识重建方法技术

技术编号:38932729 阅读:22 留言:0更新日期:2023-09-25 09:36
本发明专利技术涉及一种基于可形变卷积的批量模糊标识重建方法。根据使用的背景不同,制作模糊标识数据集,用于图像去模糊网络模型的训练。其次,识别标识图像是否是模糊图像,如果是模糊图像,将该图像进行下一步骤的去运动模糊操作。然后,构建基于可形变卷积的生成对抗网络的图像去模糊算法,使用模糊的标识数据集进行训练以获得权重文件,使其在图像模糊核未知的情况下仍能获得去模糊效果;最后针对标识图像可能存在的局部区域强度不均,需使用图像二值化算法;并需要对图像进行校正工作。并需要对图像进行校正工作。并需要对图像进行校正工作。

【技术实现步骤摘要】
一种基于可形变卷积的批量模糊标识重建方法


[0001]本专利技术涉及机器人图像处理领域,具体而言,设计一种基于可形变卷积的批量模糊标识重建方法。

技术介绍

[0002]随着科技的快速发展,二维码、条形码等标识作为一种自动识别技术,在携带信息大小、识别速度等方面有很多优点,几乎被应用于所有行业和领域,如商品标识、共享单车、移动支付、社交软件等,极大的方便了人们的日常生活。但是,人们可能由于拍摄抖动造成拍摄出来的标识图像为模糊图像,不能被解码。
[0003]得益于深度学习的快速发展,研究人员提出了很多基于深度卷积神经网络的图像处理算法,这些算法通过对大量的训练样本进行训练,进一步得到需要的结果。相比传统的图像处理方法,深度学习具有更好的性能和更高的鲁棒性,现在已经成为人工智能领域研究热点。
[0004]将模糊的标识进行重建并使其可识别是一个很典型的逆问题,处理起来难度较大,在对边缘和平滑度等细节信息的尺度把握具有很高的难度。传统方法首先通过一些手段获得关于模糊核的信息,再根据模糊核重建出清晰的图像,但是在一般情况下,模糊函数是未知的,因此使用传统方法会有很大的局限性,不足以解决实际生活中由各种复杂因素引起的图像模糊问题。

技术实现思路

[0005]针对由于标识图像存在模糊而无法准确识别的情况,采用基于可形变卷积的生成对抗网络的去模糊算法和图像处理算法相结合的标识识别方法,能够在标识图像受模糊和噪声影响比较大时仍能准确识别,提高了标识识别的鲁棒性,有效解决了现有标识识别方法中存在的问题。r/>[0006]本专利技术采用如下技术方案:一种基于可形变卷积的批量模糊标识重建方法,包括以下步骤:
[0007]1)去模糊模型构建:
[0008]构建模糊标识数据集;
[0009]对于模糊标识数据集中的每幅图像,判断图像是否是模糊图像;当判断为模糊图像时,将模糊图像加入到模糊标识数据集以进行去模糊网络模型的训练;
[0010]使用模糊标识数据集进行去模糊网络模型训练;
[0011]2)模糊标识识别:
[0012]将待识别图像通过去模糊网络模型得到去模糊后的图像;
[0013]对去模糊后的图像进行二值化,通过边缘检测提取标识目标边缘所在直线,通过直线倾斜角度并旋转校正。
[0014]所述构建模糊标识数据集,包括以下步骤:
[0015]由多幅标识图像构成标识数据集;标注标识图像中的标识目标背景、标识目标、标识目标与摄像头距离;
[0016]在设定的背景下使用图像采集装置采集标识图像,并进行不同模糊长度和模糊角度的模糊处理得到模糊标识图像,采集的标识图像与模糊标识图像构成标识数据集。
[0017]所述判断图像是否是模糊图像,包括以下步骤:
[0018]获取图像大小;将图像裁剪及缩放至设定尺寸;
[0019]获取图像包含的颜色数量和像素点数量、及像素点所对应的灰度值;
[0020]根据图像像素点位置对应的灰度值,将灰度值为0和255以外的像素点的灰度值置为一个新的可区分的灰度值;
[0021]根据图像中标识目标的灰度值信息,得到各灰度值像素点的数量及所占的比例,并构建灰度直方图分布,将大于阈值T的图像判断为模糊标识图像。所述去模糊网络模型的构建,包括以下步骤:
[0022]去模糊网络模型包括依次连接的特征金字塔网络、深度学习模型:
[0023]1)对于特征金字塔网络:
[0024]将特征金字塔网络的3*3卷积核的block换成可形变卷积DCN,得到不同的特征;
[0025]将提取的特征上采样到特征金字塔网络输入图像大小的1/4并级联成一个张量,包含不同级别的语义信息;
[0026]在特征金字塔网络的最后依次添加一个上采样层和一个卷积层;
[0027]2)对于深度学习模型:
[0028]顺次的生成网络G和判别网络D构成深度学习模型,并将生成网络G和判别网络D中的block替换为可形变卷积DCN。
[0029]所述对去模糊后的图像进行二值化,通过边缘检测提取标识目标边缘所在直线,通过直线倾斜角度并旋转校正,包括以下步骤:
[0030]统计标识目标像素个数所占图像总像素个数的比例、标识目标像素的平均值;得到类间方差或类内方差;当使类间方差最大或者使类内方差最小的阈值,即为最佳阈值;使用最佳阈值,对图像进行二值化处理;
[0031]将二值化后的图像通过canny算子进行边缘检测,得到标识目标边缘,然后通过Hough变换得到边缘所在直线的斜率和旋转角度,最后用双线性插值法对标识目标进行旋转校正,以完成标识目标的识别。
[0032]一种基于可形变卷积的批量模糊标识重建系统,包括:
[0033]去模糊模型构建模块,用于构建模糊标识数据集;对于模糊标识数据集中的每幅图像,判断图像是否是模糊图像;当判断为模糊图像时,将模糊图像加入到模糊标识数据集以进行去模糊网络模型的训练;使用模糊标识数据集进行去模糊网络模型训练;
[0034]模糊标识识别模块,用于将待识别图像通过去模糊网络模型得到去模糊后的图像;对去模糊后的图像进行二值化,通过边缘检测提取标识目标边缘所在直线,通过直线倾斜角度并旋转校正。
[0035]本专利技术能够产生如下有益效果和优点:
[0036]1.本专利技术中,加入模糊图像筛选模块,可以减少对可以识别的表示图像作不必要的识别,而只去识别模糊标识图像,提高效率。
[0037]2.本专利技术中,DCN在感受野中引入了偏移量,而且这偏移量是可学习的。这样之后的卷积区域便始终覆盖在物体周围。引入可形变卷积,可以更精准的提取图像信息,进一步达到精准识别。
附图说明
[0038]图1是本专利技术中的模糊标识图像判断方法流程图。
[0039]图2是本专利技术中的模糊标识图像重建识别方法流程图。
具体实施方式
[0040]为了更好地理解本专利技术的技术方案,以下结合附图和具体例子对本专利技术的实施方式作进一步的介绍。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本专利技术的保护范围进行任何限制。
[0041]本专利技术涉及一种基于可形变卷积的批量模糊标识重建方法。根据使用的背景不同,制作模糊标识数据集,用于图像去模糊网络模型的训练。其次,设计了一种识别模糊图像的方法,识别标识图像是否是模糊图像,如果是模糊图像,将该图像进行下一步骤的去运动模糊操作。然后,构建基于可形变卷积的生成对抗网络的图像去模糊算法,使用模糊的标识数据集进行训练以获得权重文件,使其在图像模糊核未知的情况下仍能获得去模糊效果;最后针对标识图像可能存在的局部区域强度不均,需使用图像二值化算法;并需要对图像进行校正工作,包括对图像进行边缘检测提取,其次通过Hough检测边缘所在直线,最后通过插值法计算直线倾斜角度并旋转校正。
[0042]一种基于可形变卷积的批量模糊标识重建方法,该方法包括:
[0043]步骤1本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于可形变卷积的批量模糊标识重建方法,其特征在于,包括以下步骤:1)去模糊模型构建:构建模糊标识数据集;对于模糊标识数据集中的每幅图像,判断图像是否是模糊图像;当判断为模糊图像时,将模糊图像加入到模糊标识数据集以进行去模糊网络模型的训练;使用模糊标识数据集进行去模糊网络模型训练;2)模糊标识识别:将待识别图像通过去模糊网络模型得到去模糊后的图像;对去模糊后的图像进行二值化,通过边缘检测提取标识目标边缘所在直线,通过直线倾斜角度并旋转校正。2.根据权利要求1所述的一种基于可形变卷积的批量模糊标识重建方法,其特征在于,所述构建模糊标识数据集,包括以下步骤:由多幅标识图像构成标识数据集;标注标识图像中的标识目标背景、标识目标、标识目标与摄像头距离;在设定的背景下使用图像采集装置采集标识图像,并进行不同模糊长度和模糊角度的模糊处理得到模糊标识图像,采集的标识图像与模糊标识图像构成标识数据集。3.根据权利要求1所述的一种基于可形变卷积的批量模糊标识重建方法,其特征在于,所述判断图像是否是模糊图像,包括以下步骤:获取图像大小;将图像裁剪及缩放至设定尺寸;获取图像包含的颜色数量和像素点数量、及像素点所对应的灰度值;根据图像像素点位置对应的灰度值,将灰度值为0和255以外的像素点的灰度值置为一个新的可区分的灰度值;根据图像中标识目标的灰度值信息,得到各灰度值像素点的数量及所占的比例,并构建灰度直方图分布,将大于阈值T的图像判断为模糊标识图像。4.根据权利要求1所述的一种基于可形变卷积的批量模糊标识重建方法,其特征在于,所述去模糊网络模型的构建,包括以下步骤:去模糊网络模型包括依次连接的特征金字塔网络、深度学习模型...

【专利技术属性】
技术研发人员:刘意杨陈佳欣唐川宁杨仁枫王智凝白洪飞崔好
申请(专利权)人:中国科学院沈阳自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1