一种基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法技术

技术编号：41910515 阅读：22 留言：0更新日期：2024-07-05 14:13

本发明专利技术公开了一种基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，涉及计算机视觉和图像处理技术领域，包括构建矮化密植枣园中枣带区域图像数据集并预处理；设计DeepLabV3+神经网络架构；使用混合损失函数Focal Loss+Dice Loss对DeepLabV3+神经网络进行训练与验证；基于条形池化模块和轴向注意力机制优化DeepLabV3+神经网络，将底层特征连接传递到解码器的相应层；使用优化的DeepLabV3+神经网络进行枣园中枣带区域图像的语义分割，通过获取枣园中枣带图像，对枣园中枣带图像数据集进行数据增强，将主干网络替换为MobileNetV2，将图像输入至训练后的DeepLabV3+神经网络中进行枣带图像区域的语义分割，对枣园中枣带图像数据集进行数据增强，提升DeepLabV3+神经网络分割的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉和图像处理，特别是一种基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法。

技术介绍

1、深度卷积神经网络dcnn在计算机视觉领域引起了革命性的变革，努力都集中在构建更加深入和复杂的网络架构上，这在许多具有挑战性的视觉任务中表现出了卓越的性能，随着机器人视觉、自动驾驶以及环境感知应用的持续发展，先进的网络对于计算资源和内存的需求不断上升，远远超出嵌入式平台应用的处理能力，图像分割是计算机视觉研究中的关键任务，传统的图像分割方法主要依靠图像的颜色、纹理以及形状特征来生成区域，并通过合并分类的区域实现图像分割，过程不仅复杂，而且分割精度也有很大的提升空间，深度学习技术，凭借其强大的计算能力和高效的非线性处理能力，已经在包括图像分割、目标检测和模式识别在内的计算机视觉领域得到了广泛应用，语义分割作为图像分割领域的先进方法，已经成为该领域内的热门研究方向。

2、对于边界模糊、具有较长的带状结构的分割任务，传统的分割模型可能无法提供满意的结果，模型基于像素级别的分类和分割，难以捕捉到长距离的依赖关系和全局上下文信息，提供一种基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法，使模型在边界模糊、具有较长的带状结构中具有更高的分割精度是研究重点。

技术实现思路

1、鉴于上述现有的基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法中存在的问题，提出了本专利技术。

2、因此，本专利技术所要解决的问题

3、为解决上述技术问题，本专利技术提供如下技术方案：一种基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法，其包括，构建矮化密植枣园中枣带区域图像数据集并预处理；设计deeplabv3+神经网络架构；使用混合损失函数focal loss+dice loss对deeplabv3+神经网络进行训练与验证；基于条形池化模块和轴向注意力机制优化deeplabv3+神经网络，将底层特征连接传递到解码器的相应层；使用优化的deeplabv3+神经网络进行枣园中枣带区域图像的语义分割。

4、作为本专利技术所述基于改进deeplabv3+的矮化密植枣园中枣带区域图像图像语义分割方法的一种优选方案，其中：所述构建矮化密植枣园中枣带区域图像数据集并预处理指利用工业相机拍摄枣园中枣带道路区域的图像，将收集的照片通过翻转和旋转，利用labelme软件对图像创建标注，只标注图片中枣带区域部分，并随机生成训练集与验证集。

5、作为本专利技术所述基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法的一种优选方案，其中：所述设计deeplabv3+神经网络架构指在deeplabv3+的结构中，将主干网络替换为mobilenetv2，将mobilenetv2的预训练模型加载为特征提取器，并移除分类层，将输出连接到aspp模块，根据mobilenetv2的输出特征图大小调整aspp模块的扩张率。

6、作为本专利技术所述基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法的一种优选方案，其中：所述使用混合损失函数focal loss+dice loss对优deeplabv3+神经网络进行训练与验证包括以下内容：

7、使用focal loss公式为：

8、

9、其中p为预测样本为正类的概率，γ为调节因子，y为真实标签；

10、令：

11、

12、dice公式为：

13、

14、其中|x∩y|为预测和真实分割区域的交集，|x|+|y|为预测和真实分割区域的并集，x为预测的分割区域，y为真实的分割区域；

15、使用混合损失函数训练改进的deeplabv3+神经网络，通过验证集预测输出精确率、召回率、mpa值以及miou值，与改进前的评价指标对比，评价指标比改进前提升则停止训练获得训练好的deeplabv3+神经网络。

16、作为本专利技术所述基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法的一种优选方案，其中：所述基于条形池化模块优化deeplabv3+神经网络指在aspp模块添加并行的处理水平条带和处理垂直条带条形池化层；

17、将图像分成水平和垂直的条带，并对条带进行池化操作；

18、对条带进行池化后，得到条带的特征表示，通过特征捕获到目标在不同位置的信息；

19、将条带的特征表示进行关系建模，获得孤立区域间远距离关系的特征表示；

20、调整aspp模块中膨胀卷积的膨胀率，使deeplabv3+神经网络捕捉不同尺度的图像特征。

21、作为本专利技术所述基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法的一种优选方案，其中：所述基于轴向注意力机制优化deeplabv3+神经网络指通过卷积神经网络cnn，对输入的图像进行特征提取，得到特征图；

22、计算轴向位置在特征图上的注意力权重；

23、将轴向位置的注意力权重组合成空间全局的注意力权重热图；

24、将生成的空间全局注意力权重热图与原始特征图进行加权，得到轴向注意力机制的加权结果；

25、将加权的特征图输入到deeplabv3+的解码器部分，使用加权特征图中突出的信息优化分割边界的准确性和清晰度。

26、作为本专利技术所述基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法的一种优选方案，其中：所述将底层特征连接传递到解码器的相应层指使用mobilenetv2中初级和中级层的输出，作为底层特征的源；

27、使用跳跃连接策略，将底层特征直接连接到解码器的对应层。

28、作为本专利技术所述基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法的一种优选方案，其中：所述使用优化的deeplabv3+神经网络进行枣园中枣带区域图像的语义分割指将将采集到的枣园图像数据集输入优化的deeplabv3+神经网络进行处理，输出对枣园中枣带区域图像的语义分割。

29、一种计算机设备，包括：存储器和处理器；所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法的步骤。

30、一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法的步骤。

31、本专利技术有益效果为：通过获取枣园中枣带图像，对枣园中枣带图像数据集进行数据增强，将主干网络替换为mobilenetv2，将图像输入至训练后的deeplabv3本文档来自技高网...

【技术保护点】

1.一种基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：包括，

2.如权利要求1所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述构建矮化密植枣园中枣带区域图像数据集并预处理指利用工业相机拍摄枣园中枣带道路区域的图像，将收集的照片通过翻转和旋转，利用labelme软件对图像创建标注，只标注图片中枣带区域部分，并随机生成训练集与验证集。

3.如权利要求2所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述设计DeepLabV3+神经网络架构指在DeepLabV3+的结构中，将主干网络替换为MobileNetV2，将MobileNetV2的预训练模型加载为特征提取器，并移除分类层，将输出连接到ASPP模块，根据MobileNetV2的输出特征图大小调整ASPP模块的扩张率。

4.如权利要求3所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述使用混合损失函数Focal Loss+Dice Los

5.如权利要求4所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述基于条形池化模块优化DeepLabV3+神经网络指在ASPP模块添加并行的处理水平条带和处理垂直条带条形池化层；

6.如权利要求5所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述基于轴向注意力机制优化DeepLabV3+神经网络指通过卷积神经网络CNN，对输入的图像进行特征提取，得到特征图；

7.如权利要求6所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述将底层特征连接传递到解码器的相应层指使用MobileNetV2中初级和中级层的输出，作为底层特征的源；

8.如权利要求7所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述使用优化的DeepLabV3+神经网络进行枣园中枣带区域图像的语义分割指将将采集到的枣园图像数据集输入优化的DeepLabV3+神经网络进行处理，输出对枣园中枣带区域图像的语义分割。

9.一种计算机设备，包括：存储器和处理器；所述存储器存储有计算机程序，其特征在于：所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的基于改进DeepLabV3+的矮化密植枣园中枣带区域图像语义分割方法的步骤。

...

【技术特征摘要】

1.一种基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：包括，

2.如权利要求1所述的基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述构建矮化密植枣园中枣带区域图像数据集并预处理指利用工业相机拍摄枣园中枣带道路区域的图像，将收集的照片通过翻转和旋转，利用labelme软件对图像创建标注，只标注图片中枣带区域部分，并随机生成训练集与验证集。

3.如权利要求2所述的基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述设计deeplabv3+神经网络架构指在deeplabv3+的结构中，将主干网络替换为mobilenetv2，将mobilenetv2的预训练模型加载为特征提取器，并移除分类层，将输出连接到aspp模块，根据mobilenetv2的输出特征图大小调整aspp模块的扩张率。

4.如权利要求3所述的基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述使用混合损失函数focal loss+dice loss对优deeplabv3+神经网络进行训练与验证包括以下内容：

5.如权利要求4所述的基于改进deeplabv3+的矮化密植枣园中枣带区域图像语义分割方法，其特征在于：所述基于条形池化模块优化deeplabv3+神经网络指在aspp模块添加并行的...

【专利技术属性】
技术研发人员：李景彬，梁明霞，杨宏飞，丁惠哲，丁龙朋，李树峰，王贤斐，姜柯伊，郭典，杨金山，
申请(专利权)人：石河子大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人