【技术实现步骤摘要】
一种引用逆注意力与像素相似度学习的图像语义分割方法
本专利技术涉及计算机视觉领域,尤其涉及一种引用逆注意力与像素相似度学习的图像语义分割方法。
技术介绍
图像语义分割技术是计算机视觉领域的热点和难点问题之一,该技术是将图像分割成若干个不同的语义区域,并识别出每个区域类别,获得最终的语义标注,图像语义分割技术在自动驾驶、基于图像语义的定位导航,医学图像分析等领域均具有广泛的应用价值。根据语义特征提取的不同,通常将图像语义分割分为传统与非传统方法两大类;传统的图像语义分割方法包括基于阈值的图像语义分割、基于区域的图像语义分割和基于边缘特征的图像语义分割;传统的图像语义分割方法主要是利用低级图像语义特征来实现图像分割,不能很好的解决复杂图像场景的分割问题;非传统的图像语义分割方法主要是利用图像中的高级图像语义信息进行图像分割,该类方法大都引入深度学习网络以实现图像语义分割,但当前该类方法所关注的是特征理解和目标类别的预测,而忽略让深度网络有意识学习不同目标类别的区别,另外,深度学习网络中,卷积层大的感受野和池化层的存在会导致最深的全卷积网络较低的空间分辨。
技术实现思路
本专利技术的目的在于提供一种引用逆注意力与像素相似度学习的图像语义分割方法,解决了复杂图像场景的图像分割问题。为了实现上述目的,本专利技术采用以下技术方案:一种引用逆注意力与像素相似度学习的图像语义分割方法,其特征在于,包括以下步骤:步骤A:对输入图像进行初步语义分割,即利用DeepLabv2ResneT1-101网络不同尺度的分支网络提取不同尺度的输入图像的特征;具体采用以下方法:DeepLabv ...
【技术保护点】
一种引用逆注意力与像素相似度学习的图像语义分割方法,其特征在于,包括以下步骤:步骤A:对输入图像进行初步语义分割,即利用DeepLab v2ResneT1‑101网络不同尺度的分支网络提取不同尺度的输入图像的特征;具体采用以下方法:DeepLab v2ResneT1‑101网络包含三个分支网络,三个分支网络的输入图像的尺度大小各不相同;通过分别使用1:1、1:0.75和1:0.5三个不同尺度的分支网络来提取输入图像在三个不同尺度下的特征;步骤B:在步骤A的基础上,利用逆注意力层对输入图像中的目标区域和背景区域的混淆区域的边界进行分割;步骤C:在步骤A的基础上,利用像素相似度学习层进一步对输入图像中的目标区域和背景区域的混淆区域的边界进行分割;步骤D:对逆注意力层和像素相似度学习层进行优化,定义相应的损失函数;步骤E:训练网络参数。
【技术特征摘要】
1.一种引用逆注意力与像素相似度学习的图像语义分割方法,其特征在于,包括以下步骤:步骤A:对输入图像进行初步语义分割,即利用DeepLabv2ResneT1-101网络不同尺度的分支网络提取不同尺度的输入图像的特征;具体采用以下方法:DeepLabv2ResneT1-101网络包含三个分支网络,三个分支网络的输入图像的尺度大小各不相同;通过分别使用1:1、1:0.75和1:0.5三个不同尺度的分支网络来提取输入图像在三个不同尺度下的特征;步骤B:在步骤A的基础上,利用逆注意力层对输入图像中的目标区域和背景区域的混淆区域的边界进行分割;步骤C:在步骤A的基础上,利用像素相似度学习层进一步对输入图像中的目标区域和背景区域的混淆区域的边界进行分割;步骤D:对逆注意力层和像素相似度学习层进行优化,定义相应的损失函数;步骤E:训练网络参数。2.根据权利要求1所述的一种引用逆注意力与像素相似度学习的图像语义分割方法,其特征在于,所述的步骤B包括以下步骤:步骤B1:将步骤A由Deeplabv2ResneT1-101网络所提取的输入图像在三个不同尺度下的特征,经过双线性插值进行缩放,变成同样的维度,并定义输入图像在三个不同尺度下的特征经过缩放之后的大小均为n×n×m;步骤B2:将步骤B1中得到的大小均为n×n×m的三个不同尺度下的特征经过Max层处理后,取出三个不同尺度下的特征中最大的响应记为T1,T1的大小为n×n×m;步骤B3:将T1分别输入到逆向网络和预测网络;步骤B4:定义逆向掩码Reversemask(i,j):其中,f表示在T1在预测网络中经过卷积之后的特征,i和j表示T1的空间坐标,T1特征经过ReLU激活函数之后的取值范围在[0,+∞],因此的范围在[-4,4]之间,这样就将逆向掩码的值约束在了区间内部;对T1的每个通道都运用公式生成逆向掩码;步骤B5:将步骤B4中得到的逆向掩码Reversemask(i,j)与T1输入逆向网络后经过逆向网络处理的结果相乘得到T1经过逆向网络处理后的预测结果,然后将T1经过预测网络处理的结果减去T1经过逆向网络处理后的预测结果,即得到了精细化的混淆区域边界分割结果,从而对输入图像中的目标区域和背景区域的混淆区域的实现有效分割,即去掉或者减弱逆向网络不精确的预测区域。3.根据权利要求1所述的一种引用逆注意力与像素相似度学习的图像语义分割方法,其特征在于,所述的步骤C包括以下步骤:步骤C1:将输入图像以及输入图像经过Deeplabv2ResneT1-101网...
【专利技术属性】
技术研发人员:肖立智,李涛,赵雪专,裴利沈,李冬梅,朱晓珺,曲豪,张栋梁,汪伟,邹香玲,郭航宇,
申请(专利权)人:盐城禅图智能科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。