当前位置: 首页 > 专利查询>长春大学专利>正文

一种牛脸图像增强方法技术

技术编号:36358976 阅读:31 留言:0更新日期:2023-01-14 18:16
本发明专利技术公开了一种牛脸图像增强方法,包括以下步骤:采集带有牛脸的图片;设计牛脸图像增强网络模型;优化网络模型,保证每个像素的RGB向量的颜色正确性;将实时采集到的牛脸图像输入到牛脸图像增强网络中,最终生成图像增强后的高动态范围HDR牛脸图像并输出。本发明专利技术能够利用LDR牛脸图像生成更清晰更真实的HDR牛脸图像,解决了自然界环境中拍摄牛脸图像因为弱光或者强光存在的细节信息缺失的问题,使得生成的高动态范围HDR牛脸图像对比度更高,图像细节更清晰,成像更加真实,能对不同颜色的牛脸进行识别,在一定程度上辅助现有的牛脸检测技术,提高牛脸检测的准确率。提高牛脸检测的准确率。提高牛脸检测的准确率。

【技术实现步骤摘要】
一种牛脸图像增强方法


[0001]本专利技术涉及图像处理领域,特别是涉及一种牛脸图像增强方法。

技术介绍

[0002]随着经济社会的发展,牛肉在肉食消费中所占的比例越来越大,同时牛奶以及奶制品的消费需求也在不断增长。在养牛业在不断壮大的同时,饲养方式规模化、集约化程度越来越高,现在越来越多的养殖场开始信息化、智能化养殖,这种养殖方式避免不了对牛脸进行拍照,通过牛脸的识别实现对养殖场的现代物联网技术管理。牛脸识别技术是基于图像中牛脸部特征的差异进行牛只身份识别方法。牛脸识别技术可以方便对牛只进行保险或者抵押贷款。
[0003]但是由于养殖场的客观条件,牛常常处于自然界场景中,这种条件下亮度范围十分宽广,明暗跨度较大,可以带来更加鲜艳的颜色从而呈现出较多的视觉细节。但是目前优于硬件的限制,大多数消费级的相机只能捕捉有限范围亮度的照片,即为常见的低动态范围(Low Dynamic Range, LDR)图像。LDR图像虽然在一定程度上反映了牛脸的大部分信息,拍摄的牛脸图像因为弱光或者强光原因存在不少的细节信息丢失。而高动态范围(High Dynamic Range,HDR)允许更自然、更真实的显示,不会减弱明亮或黑暗区域的色调,可以展示牛脸上的更多细节。同时养殖场中的牛也有很多种类,不同类别的牛之间颜色差异很大,这也对牛脸识别带来了很多干扰。
[0004]因此,如何实现对牛脸图像的增强成为亟待解决的问题。

技术实现思路

[0005]本专利技术目的在于提供一种牛脸图像增强方法用于解决现有的牛脸识别技术中由于硬件的限制,大多数消费级的相机只能捕捉有限范围亮度的照片,即为常见的低动态范围(Low Dynamic Range, LDR)图像,存在牛脸上的细节信息丢失的现象;不同类别的牛之间颜色差异很大,给牛脸识别带来干扰等技术问题。
[0006]一种牛脸图像增强方法,包括以下步骤,并且以下步骤顺次进行:S1:采集带有牛脸的图片,所述带有牛脸的图片为相机或者手机实地采集牛只的视频中截取的图片,图片为RGB格式并且是低动态范围LDR(Low Dynamic Range),作为训练集;S2:构建牛脸图像增强网络模型并通过训练集中的图片对该网络模型进行训练,获得预测的高动态范围HDR(High Dynamic Range)格式的牛脸图片;所述牛脸图像增强网络模型中采用改进的ExpandNet网络对输入的训练集的LDR图像进行增强,所述改进的ExpandNet网络通过局部分支、扩张分支以及全局分支三个分支来提取原始图像的高频、中频和低频细节特征图,之后将三个分支提取的特征图进行连接、混合、卷积操作,最后输出预测的高动态范围HDR格式的牛脸图像;S3:获取与训练集中对应的真实的高动态范围HDR牛脸图像,利用损失函数以及预
测的高动态范围HDR格式的牛脸图像和真实的HDR牛脸图像之间的距离优化网络模型,保证每个像素的RGB向量的颜色正确性;S4:将实时采集到的牛脸图像输入到牛脸图像增强网络中,最终生成图像增强后的高动态范围HDR牛脸图像并输出。
[0007]所述S1中视频中截取的图片为视频总每隔5帧截取一幅图片。
[0008]所述改进的ExpandNet网络对输入的训练集的LDR图像进行增强具体为:所述局部分支提供像素级的学习,用来产生高频特征,即图像中的细节部分,局部分支包含两个卷积层和一个混合域注意力机制CBAM(Convolutional Block Attention Module),混合域注意力机制CBAM位于两个卷积层之间,优化对图像的细节纹理的处理;所述扩张分支通过学习图像中像素邻域的信息,用来产生中频特征;所述全局分支通过学习输入的整张图像的全局上下文来提供低频特征,全局分支接受整个LDR牛脸图像作为输入,并重新设置图像的尺寸;同时在全局分支的卷积层之间加入了残差连接,使用全等映射直接将前层信息直接传输到后面的卷积层中,避免在训练过程中牛脸图像的原始信息丢失和损耗;最后将局部分支和扩张分支输出的特征图沿着各自对应通道的特征图维度进行连接操作,并将全局分支输出的特征图复制来匹配前两个分支的输出特征图尺寸,然后叠加到前两个分支的特征图上,形成固定数量的特征图;再利用卷积将三个分支的特征向量的每个像素融合在一起;然后将融合后的输出由最后的卷积层进一步处理,最后输出预测的HDR格式的牛脸图像。
[0009]所述的混合域注意力机制CBAM包括通道注意力机制和空间注意力机制;所述通道注意力机制用于处理特征图通道的分配关系,通道注意力机制先将输入特征图分别进行全局最大池化和全局平均池化,对特征映射基于宽和高两个维度压缩,获得池化后的两张不同维度的特征图;将池化后的两张不同维度的特征图共用一个多层感知器网络,分别通过卷积降维再升维;将升维后的两张特征图叠加,经过sigmoid激活函数归一化特征图的每个通道的权重,并将归一化后的权重和输入特征图相乘;所述空间注意力机制用于使神经网络只处理图像中对特征表达起决定作用的像素区域;空间注意力机制首先将通道注意力机制的输出特征图分别进行基于通道维度的全局最大池化和全局平均池化,将输出的两张特征图在通道维度堆叠;然后使用卷积调整通道数,最后经过sigmoid激活函数归一化权重,将归一化权重和输入特征图相乘。
[0010]所述损失函数中添加了一个额外的余弦相似项,损失函数表示为: 其中,表示第i幅图像的损失贡献,表示预测的高动态范围HDR牛脸图像,表示真实的高动态范围HDR牛脸图像,是调整余弦相似项贡献的常数因子,是图像第j个RGB像素向量,是图像第j个RGB像素向量,是图像的像素总数,表示预测的高动态范围HDR格式的牛脸图像和真实的HDR牛脸图像之间的曼哈顿距离即L1距离,表示的模长,表示的模长。
[0011]通过上述设计方案,本专利技术可以带来如下有益效果:本专利技术针对自然界环境中拍摄的牛脸图像因为弱光或者强光存在的牛脸细节信息缺失问题,提供一种牛脸图像增强方法,使得生成的高动态范围HDR牛脸图像对比度更高,图像细节更清晰,成像更加真实,能对不同颜色的牛脸进行识别,在一定程度上辅助现有的牛脸检测技术,提高牛脸检测的准确率。
附图说明
[0012]图1为本专利技术一种牛脸图像增强方法的流程框图。
[0013]图2为本专利技术一种牛脸图像增强方法中采用的牛脸图像增强网络结构图。
具体实施方式
[0014]为了更好地了解本专利技术的目的、结构及功能,下面结合附图,对本专利技术的一种牛脸图像增强方法作进一步详细的描述。
[0015]实施例1:如附图所示,一种牛脸图像增强方法,所述方法的具体步骤如下:1.采集带有牛脸的图片使用相机或者手机实地采集牛只的视频,每隔5帧截取一幅图片,从中选取有牛脸的图片,大概5000张。牛的种类本专利技术不做限制。图像的数量应该尽可能地多,并且每张图片的拍摄环境最好不同。
[0016]2.设计牛脸图像增强网络模型参阅图2,该网络的输入为LDR格式的牛脸图片,包括局部分支、扩张分支以及全局分支三个主要的分支来分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种牛脸图像增强方法,其特征是:包括以下步骤,并且以下步骤顺次进行:S1:采集带有牛脸的图片,所述带有牛脸的图片为相机或者手机实地采集牛只的视频中截取的图片,图片为RGB格式并且是低动态范围LDR(Low Dynamic Range),作为训练集;S2:构建牛脸图像增强网络模型并通过训练集中的图片对该网络模型进行训练,获得预测的高动态范围HDR(High Dynamic Range)格式的牛脸图片;所述牛脸图像增强网络模型中采用改进的ExpandNet网络对输入的训练集的LDR图像进行增强,所述改进的ExpandNet网络通过局部分支、扩张分支以及全局分支三个分支来提取原始图像的高频、中频和低频细节特征图,之后将三个分支提取的特征图进行连接、混合、卷积操作,最后输出预测的高动态范围HDR格式的牛脸图像;S3:获取与训练集中对应的真实的高动态范围HDR牛脸图像,利用损失函数以及预测的高动态范围HDR格式的牛脸图像和真实的HDR牛脸图像之间的距离优化网络模型,保证每个像素的RGB向量的颜色正确性;S4:将实时采集到的牛脸图像输入到牛脸图像增强网络中,最终生成图像增强后的高动态范围HDR牛脸图像并输出。2.根据权利要求1所述的一种牛脸图像增强方法,其特征是:所述S1中视频中截取的图片为视频总每隔5帧截取一幅图片。3.根据权利要求1所述的一种牛脸图像增强方法,其特征是:所述改进的ExpandNet网络对输入的训练集的LDR图像进行增强具体为:所述局部分支提供像素级的学习,用来产生高频特征图,即图像中的细节部分,局部分支包含两个卷积层和一个混合域注意力机制CBAM(Convolutional Block Attention Module),混合域注意力机制CBAM位于两个卷积层之间,优化对图像的细节纹理的处理;所述扩张分支通过学习图像中像素邻域的信息,用来产生中频特征图;所述全局分支通过学习输入的整张图像的全局上下文来提供低频特征图,全局分支接受整个LDR牛脸图像作为输入,并重新设置图像的尺寸;同时在...

【专利技术属性】
技术研发人员:肖治国卢佳孙大文王玉英李念峰赵楠王春湘丁天娇梁文惠戴文新陈显庆张冬
申请(专利权)人:长春大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1