基于注意力机制和U-net网络的人像分割方法及系统技术方案

技术编号:39243869 阅读:11 留言:0更新日期:2023-10-30 11:56
本发明专利技术公开了基于注意力机制和U

【技术实现步骤摘要】
基于注意力机制和U

net网络的人像分割方法及系统


[0001]本专利技术涉及图像分割
,尤其涉及基于注意力机制和U

net网络的人像分割方法及系统。

技术介绍

[0002]人像图像分割作为计算机视觉领域的重要一部分,在学术界中研究历史较为久远,其本质把图像分为不同边缘的小块,进行二分类处理,最终划分为背景语义以及人像语义,从计算机视觉的方面考虑,人像语义分割算法的分割精度影响到整个人像智能系统的性能,一个训练好的高精度语义分割模型能够帮助人们从复杂的背景中得到一个较好的人像边界,避免了后续操作中背景等无关信息的干扰,提高后续任务的精度。可以得知,人像智能系统给人们的生活带来了诸多便利,而人像语义分割则是给整个系统带来了效率的提升。在现实生活中,人们通过摄像头或者其他设备将场景转化为图像,再通过算法对图像中客观对象分割和标注语义,从而进行应用,便捷人们的生活;
[0003]随着图像分割技术的发展,目前研究学者将图像分割技术分成两类:基于传统方法的图像分割技术和基于深度学习方法的图像分割技术,在图像处理研究早期,传统图像分割方法主要基于图像自身的内在特征,通过对目标函数的最优化求解达到分割图像的目的,比如结构化随机森林、k

means聚类算法等算法。传统的图像分割方法由于需要手动优化特征表示,往往会导致泛化效果较差。同时,单独使用这些算法,当分割的目标背景信息较为复杂时,特别是目标人像和背景中的灰度值会较为靠近是,分割精度较差,分割细节难以保证;再者,受限于计算机本身的性能,图像分割迭代时间长,分割速度慢。由于传统方法难以胜任精细分割的任务,且随着计算机硬件的支持,研究人员提出了基于深度学习的人像语义分割技术,目前已有的图像分割模型中,依据网络的模型结构、技术特点等,基于卷积神经网络的语义分割方法可以划分为三类,具体包括基于FCN(全连接卷积网络)的分割方法、基于编码器

解码器的分割方法、基于空洞卷积的分割方法三种,在此基础上,存在大量基于U

net及注意力机制下的图像分割模型,如AttentionU

net等,其主要是通过在U

net的编码器或者解码器的部分中引入注意力机制,将原模型提取的特征输入至注意力机制中进行过滤,获取图像语义分割中当前任务的更多的细节与关键信息,从而进一步加强图像的分割能力。还有SAU

net,不同于AttentionU

net,其主要是在skip connection(跳跃连接)阶段使用自注意力模块增加全局信息,充分挖掘有效的上下文信息对特征进行深入提取,但是由于人像图像因为姿势、光线遮挡等原因与医学图像具有相似的组织像素易变性的特点,因此U

net用于人像图像分割时,即使面对图像中的复杂背景,也能取得很好的分割效果,而目前,将U

net用于人像分割会存在以下问题:
[0004]首先,U

net其网络深度等相关结构,是基于对神经元结构进行语义分割而进行设计的,如果需要对不同类型的图像进行分割,必然需要对网络结构进行修改,同时,面对足够复杂的图像时,原始U

net受到背景信息影响,提取出来的特征值不足以支持模型完成足够准确的分割,再者,受限于卷积神经网络自身的感受野,U

net缺乏捕捉长距离依赖的能
力,并且,卷积核的大小和形状固定,不能有效适应输入图像类型,限制了卷积的泛化范围,降低了分割模型的泛化性,最后,尽管现行的模型所依靠的硬件要求依然较高,不易于落地部署,模型应用困难。

技术实现思路

[0005]为了解决上述技术问题,本专利技术的目的是提供基于注意力机制和U

net网络的人像分割方法及系统,提出一种人像分割U

net模型,使模型更关注目标人像相关的特征,提高模型的灵敏度、像素分类的准确性及模型的泛化能力。
[0006]本专利技术所采用的第一技术方案是:基于注意力机制和U

net网络的人像分割方法,包括以下步骤:
[0007]获取人像数据集并进行数据预处理,得到预处理后的人像数据集;
[0008]引入Inception模块与分解卷积模块作为特征提取模块,并引入高效注意力模块,构建基于U

net的人像分割模型;
[0009]将预处理后的人像数据集输入至基于U

net的人像分割模型进行迭代训练,直至训练结果满足预设迭代次数,输出最终的人像分割结果。
[0010]进一步,所述对人像数据集进行数据预处理包括:
[0011]对人像数据集进行图像尺寸统一处理,得到统一后的人像数据集;
[0012]对统一后的人像数据集进行对比度调节与亮度调节处理,得到调节后的人像数据集;
[0013]对调节后的人像数据集进行图像背景替换处理,构建预处理后的人像数据集。
[0014]进一步,所述构建基于U

net的人像分割模型其具体包括编码器模块、跳跃连接模块和解码器模块,其中:
[0015]所述编码器模块包括第一3x3卷积层、第一下采样模块、第二下采样模块和第三下采样模块,所述第一下采样模块包括第一Inception模块和第一分解卷积模块,所述第二下采样模块包括第二Inception模块和第二分解卷积模块,所述第三下采样模块包括第三Inception模块和第三分解卷积模块,所述第一3x3卷积层、第一下采样模块、第二下采样模块和第三下采样模块依次连接;
[0016]所述解码器模块包括第一上采样模块、第二上采样模块、第三上采样模块和第七3x3卷积层,所述第一上采样模块包括第四3x3卷积层和第四分解卷积模块,所述第二上采样模块包括第五3x3卷积层和第五分解卷积模块,所述第三上采样模块包括第六3x3卷积层和第六分解卷积模块,所述第一上采样模块、第二上采样模块、第三上采样模块和第七3x3卷积层依次连接;
[0017]所述跳跃连接模块包括第一高效通道意力模块、第二高效通道意力模块和第三高效通道意力模块,所述第一高效通道意力模块的输入端与第一分解卷积模块的输出端连接,所述第一高效通道意力模块的输出端与第六分解卷积模块的输入端连接,所述第二高效通道意力模块的输入端与第二分解卷积模块的输出端连接,所述第二高效通道意力模块的输出端与第五分解卷积模块的输入端连接,所述第三高效通道意力模块的输入端与第三分解卷积模块的输出端连接,所述第三高效通道意力模块的输出端与第四分解卷积模块的输入端连接。
[0018]进一步,所述将预处理后的人像数据集输入至基于U

net的人像分割模型进行迭代训练,直至训练结果满足预设迭代次数,输出最终的人像分割结果这一步骤,其具体包括:
[0019]将预处理后的人像数据集输入至基于U
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于注意力机制和U

net网络的人像分割方法,其特征在于,包括以下步骤:获取人像数据集并进行数据预处理,得到预处理后的人像数据集;引入Inception模块与分解卷积模块作为特征提取模块,并引入高效注意力模块,构建基于U

net的人像分割模型;将预处理后的人像数据集输入至基于U

net的人像分割模型进行迭代训练,直至训练结果满足预设迭代次数,输出最终的人像分割结果。2.根据权利要求1所述基于注意力机制和U

net网络的人像分割方法,其特征在于,所述对人像数据集进行数据预处理包括:对人像数据集进行图像尺寸统一处理,得到统一后的人像数据集;对统一后的人像数据集进行对比度调节与亮度调节处理,得到调节后的人像数据集;对调节后的人像数据集进行图像背景替换处理,构建预处理后的人像数据集。3.根据权利要求2所述基于注意力机制和U

net网络的人像分割方法,其特征在于,所述构建基于U

net的人像分割模型其具体包括编码器模块、跳跃连接模块和解码器模块,其中:所述编码器模块包括第一3x3卷积层、第一下采样模块、第二下采样模块和第三下采样模块,所述第一下采样模块包括第一Inception模块和第一分解卷积模块,所述第二下采样模块包括第二Inception模块和第二分解卷积模块,所述第三下采样模块包括第三Inception模块和第三分解卷积模块,所述第一3x3卷积层、第一下采样模块、第二下采样模块和第三下采样模块依次连接;所述解码器模块包括第一上采样模块、第二上采样模块、第三上采样模块和第七3x3卷积层,所述第一上采样模块包括第四3x3卷积层和第四分解卷积模块,所述第二上采样模块包括第五3x3卷积层和第五分解卷积模块,所述第三上采样模块包括第六3x3卷积层和第六分解卷积模块,所述第一上采样模块、第二上采样模块、第三上采样模块和第七3x3卷积层依次连接;所述跳跃连接模块包括第一高效通道意力模块、第二高效通道意力模块和第三高效通道意力模块,所述第一高效通道意力模块的输入端与第一分解卷积模块的输出端连接,所述第一高效通道意力模块的输出端与第六分解卷积模块的输入端连接,所述第二高效通道意力模块的输入端与第二分解卷积模块的输出端连接,所述第二高效通道意力模块的输出端与第五分解卷积模块的输入端连接,所述第三高效通道意力模块的输入端与第三分解卷积模块的输出端连接,所述第三高效通道意力模块的输出端与第四分解卷积模块的输入端连接。4.根据权利要求3所述基于注意力机制和U

net网络的人像分割方法,其特征在于,所述将预处理后的人像数据集输入至基于U

net的人像分割模型进行迭代训练,直至训练结果满足预设迭代次数,输出最终的人像分割结果这一步骤,其具体包括:将预处理后的人像数据集输入至基于U

net的人像分割模型;基于U

net的人像分割模型的编码器模块,对预处理后的人像数据集进行特征提取处理,获取预处理后的人像数据集的底层特征与预处理后的人像数据集的高层特征;基于U

net的人像分割模型的跳跃连接模块,对预处理后的人像数据集的底层特征与预处理后的人像数据集的高层特征进行特征融合处理,得到融合后的人像数据集特征;
基于U

net的人像分割模型的解码器模块,对融合后的人像数据集特征进行解码处理,输出初步的人像分割结果;循环上述基于U

net的人像分割模型对人像数据集进行训练的步骤,直至训练结果满足预设迭代次数,输出最终的人像分割结果。5.根据权利要求4所述基于注意力机制和U

net网络的人像分割方法,其特征在于,所述基于U

【专利技术属性】
技术研发人员:汤翀冯广刘云海吴晓婷杨群
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1