一种面向复杂环境的零售酒类识别方法技术

技术编号:38143985 阅读:11 留言:0更新日期:2023-07-08 10:00
本发明专利技术属于物体检测技术领域,公开了一种面向复杂环境的零售酒类识别方法,包括:步骤1:采集在不同环境下酒类的图像,并对采集到的图像进行预处理;步骤2:对步骤1预处理后的酒类的图像进行去反光,去除瓶身以及标签的反光;步骤3:将步骤2去反光后的图像进行低光增强,增强阴影部分的信息;步骤4:对经过步骤3处理的图像进行超分辨率,增强图像的细节信息;步骤5:针对步骤4处理后的图像,用训练好的物体检测模型进行酒类的分类识别。本发明专利技术通过深度学习对酒瓶的特征进行归类和分析,采用了去反光、低光增强和超分辨率的三种图像增强技术,对待识别的酒瓶图像进行修复和校正,最后通过YOLO输出不同的品类,提高识别的正确率。提高识别的正确率。提高识别的正确率。

【技术实现步骤摘要】
一种面向复杂环境的零售酒类识别方法


[0001]本专利技术属于物体检测
,具体的说是涉及一种面向复杂环境的零售酒类识别方法。

技术介绍

[0002]目前的主要的识别技术有基于视觉的物体检测,RFID射频识别和barcode。基于视觉的物体检测方法将目标区域预测和目标类别预测整合于单个神经网络模型中,实现在准确率较高的情况下快速目标检测与识别,更加适合现场应用环境。RFID射频识别作为一种非接触式的自动识别技术,通过射频信号自动识别目标对象并获取相关数据,识别工作无需人工干预,可工作于各种恶劣环境。barcode方法具有成本非接触式的自动识别技术,通过射频信号自动识别目标对象并获取相关数据,识别工作无需人工干预,可工作于各种恶劣环境。
[0003]但是基于视觉的物体检测对小目标及邻近目标检测效果差,且受限于复杂环境,当一个小格中出现多于两个小目标或者一个小格中出现多个不同目标时效果欠佳,光照异常、玻璃遮挡等环境因素也会影响识别效果。RFID成本太高,以及RFID发射器,读取机,编码器及天线等设备的花费也不低,且会涉及到个人隐私的问题。barcode方法具有成本低、效率高、差错率低的优点,可也存在数据容量小、尺寸大、易损坏等不可忽视的缺点。
[0004]虽然传统的识别方法,在普通环境下已经取得了一定的准确率,但在复杂环境下仍显不足,还存在较大的进步空间。在目前的零售中的酒类识别,由于品类复杂、玻璃反光严重、店铺光照较暗等问题,现有人工智能方法存在复杂情况下识别率低的问题。

技术实现思路
/>[0005]为了解决上述技术问题,本专利技术提供可了一种面向复杂环境的零售酒类识别方法,该方法利用深度学习图像处理方法,通过去反光、暗光增强、超分辨等进行图像增强,并有效结合yolo(you only look once,指只需要浏览一次就可以识别出图中的物体的类别和位置)检测物体的识别速度优势,从而在复杂环境下提高零售中的酒类检测的识别率和准确率。
[0006]为了达到上述目的,本专利技术是通过以下技术方案实现的:
[0007]本专利技术是一种面向复杂环境的零售酒类识别方法,该方法包括如下步骤:
[0008]步骤1:采集在不同环境下酒类的图像,并对采集到的图像进行预处理;
[0009]步骤2:对步骤1预处理后的酒类的图像进行去反光,去除瓶身以及标签的反光;
[0010]步骤3:将步骤2去反光后的图像进行低光增强,增强阴影部分的信息;
[0011]步骤4:对经过步骤3处理的图像进行超分辨率,增强图像的细节信息;
[0012]步骤5:针对步骤4处理后的图像,用训练好的物体检测模型进行酒类的分类识。
[0013]本专利技术可以利用深度学习图像处理方法进行图像增强,有效结合yolo检测物体的识别速度优势,从而在复杂环境下提高物体检测的识别率和准确率。
[0014]进一步的,步骤(1)中的不同环境下的酒类的图像选取正常光照,反光环境,低光环境,或者低分辨率的图像。
[0015]进一步的,步骤(1)中预处理具体包含图像锐化,平滑、去噪等操作,改善图像的视觉效果转换为更适合于人或机器分析处理的形式。
[0016]进一步的,步骤(2)2具体包括:
[0017](2

1)基于多尺度高斯函数的光照分量的提取。本方法选用多尺度高斯函数的方法来提取光照不均匀图像的光照分量,为了同时兼顾提取出的光照值的全局特性和局部特性,本文采用多尺度高斯函数的方法,利用不同尺度的高斯函数分别提取出场景的光照分量后进行加权,最终得到光照分量的估计值。
[0018](2

2)基于二维伽马函数的自适应亮度校正,在提取出场景的光照分量后,就可以根据光照分量的分布特性构造光照不均匀校正函数,对图像进行去反光处理,降低光照过强区域的亮度值。
[0019](2

3)色彩空间转换。鉴于HSV色彩空间更符合人眼的视觉特性,而且HSV色彩空间中的色调(H)、饱和度(S)和亮度(V)三者相互独立(根据颜色的直观特性创建的一种颜色空间),因此对于亮度V的操作不会影响图像的色彩信息,因此选择在HSV色彩空间中实现对彩色图像进行去反光处理。
[0020]进一步的,步骤(3)具体包括:
[0021](2

1)使用了一个3*3的卷积从输入图像中提取特征,然后用relu为激活函数的3*3卷积从rgb图像中映射出反射率和光照,最后一个3*3的卷积从特征空间投影R和I。
[0022](2

2)采用多尺度级联的方式,在不同的层级上分别调整光照。首先对图像进行3次下采样,使网络提取出光照特性。在拥有大量光照的信息后,采用三个逐步向上的上采样块,每个上采样块中提取出C通道特征图。
[0023](2

3)将增强后的光照图和反射图依据公式S=R*I进行恢复,从而得到一个增强的图像。
[0024]进一步的,步骤(4)具体包括:
[0025](4

1)浅层特征抽取网络,提取浅层特征。低分辨率图像进入后会经过一个卷积+RELU函数,将输入通道数调整为64。
[0026](4

2)使用了RDDB结构,提升了网络容量,使训练变得更容易。其中包含若干个RDB密集残差块和一个残差边,每个RDB都包含5个卷积+RELU,将主干网络的输出与残差边叠加。
[0027](4

3)上采样网络,进入上采样部分,在经过两次上采样后,原图的高宽变为原来的4倍,并且实现分辨率的提升。
[0028](4

4)对抗网络,使用相对论平均判别器RaD,通过在对抗训练中生成的数据和实际的数据的渐变使得网络学习到更尖锐的边缘和细节的纹理。
[0029](4

5)感知损失,采用的是激活前的特征,感知损失在预先训练的深度网络的激活层上预先定义。
[0030]本专利技术的有益效果是:本专利技术的零售酒类识别方法针对低分辨率、低光环境、玻璃反射等情况进行分析,以实现在复杂环境下的酒类识别与检测;
[0031]本专利技术利用深度学习图像处理方法进行图像增强,有效结合yolo检测物体的识别
速度优势,从而在复杂环境下提高物体检测的识别率和准确率。
[0032]通过实验可以发现,使用本专利技术相比于传统的物体检测方法可以极大提高复杂场景下的识别性能。
附图说明
[0033]图1是本专利技术方法流程图。
[0034]图2是本专利技术使用该专利技术方法在复杂环境下提高检测识别率的结果示意图。
[0035]图3是本专利技术拍摄到的原始图片。
[0036]图4是经过本专利技术识别方法增强后的图片
具体实施方式
[0037]以下将以图式揭露本专利技术的实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向复杂环境的零售酒类识别方法,其特征在于:所述零售酒类识别方法包括如下步骤:步骤1:采集在不同环境下酒类的图像,并对采集到的图像进行预处理;步骤2:对步骤1预处理后的酒类的图像进行去反光,去除瓶身以及标签的反光;步骤3:将步骤2去反光后的图像进行低光增强,增强阴影部分的信息;步骤4:对经过步骤3处理的图像进行超分辨率,增强图像的细节信息;步骤5:针对步骤4处理后的图像,用训练好的物体检测模型进行酒类的分类识别。2.根据权利要求1所述的一种面向复杂环境的零售酒类识别方法,其特征在于:所述步骤2对预处理后的酒类的图像进行去反光具体包括如下步骤:步骤2

1:基于多尺度高斯函数的光照分量的提取光照不均匀图像的光照分量,利用不同尺度的高斯函数分别提取出场景的光照分量后进行加权,最终得到光照分量的估计值;步骤2

2:基于二维伽马函数的自适应亮度校正,在提取出场景的光照分量后根据光照分量的分布特性构造光照不均匀校正函数,对图像进行去反光处理,降低光照过强区域的亮度值;步骤2

3:色彩空间转换:在HSV色彩空间中实现对彩色图像进行去反光处理。3.根据权利要求2所述的一种面向复杂环境的零售酒类识别方法,其特征在于:所述步骤2

1具体为:步骤2
‑1‑
1:基于多尺度高斯函数的光照分量的提取光照不均匀图像的光照分量,其中高斯函数为式中:c为尺度因子,λ为归一化常数,确保高斯函数G(x,y)满足归一化条件,即∫∫G(x,y)dxdy=1,利用高斯函数和原图像做卷积即可得到光照分量的估计值,其结果如下:I(x,y)=F(x,y)G(x,y)步骤2
‑1‑
2:采用多尺度高斯函数,利用不同尺度的高斯函数分别提取出场景的光照分量后进行加权,最终得到光照分量的估计值,表达式为:式中:I(x,y)为(x,y)点处由多个不同尺度的高斯函数提取并加权后的光照分量值,ω
i
为第i个尺度高斯函数提取出的光照分量的权系数,i=1,2,

,N为用到的尺度数。4.根据权利要求2所述的一种面向复杂环境的零售酒类识别方法,其特征在于:所述步骤2

2具体为:对于输入的图像F(x,y),假设提取出的光照分量为I(x,y),构造二维伽马函数:式中:O(x,y)为校正后的输出图像的亮度值;γ为用于亮度增强的指数值,其中包含了图像的光照分量特性,m为光照分量的亮度均值;
当某一点(x,y)处的光照值大于整幅光照分量的均值时,二维伽马函数会依指数减弱原图像在该点处的亮度值,光照过强的区域的亮度得到了衰减,同时压缩了图像的动态范围,正是在光照分量的均值和每一个像素点处的光照值的共同作用下,得到较好的光照不均匀校正效果。5.根据权利要求1所述的一种面向复杂环境的零售酒类识别方法,其特征在于:所述步骤3将去反光后的图像进行低光增强,低光增强网络主要由三部分分...

【专利技术属性】
技术研发人员:袁宇航罗培原侯天旭张伯雷
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1