一种基于深监督掩码自编码网络的图像边缘检测方法技术

技术编号：42057282 阅读：28 留言：0更新日期：2024-07-16 23:35

本发明专利技术公开了一种基于深监督掩码自编码网络的图像边缘检测方法。本发明专利技术包括以下步骤：首先，使用自监督方式预训练掩码自编码器，作为提取图像特征的主干网络；接着使用掩码自编码器输出的特征图，构建特征金字塔形的网络连接结构；再将特征金字塔输入基于深监督技术构建的主从解码器，分别输出边缘特征图，得到边缘检测结果；网络中采取基于焦点损失的图像边缘检测模型损失函数计算并整合主从解码器损失；采取分段学习率策略和学习率预热策略优化训练过程。本发明专利技术提升了边缘检测在光照和噪声等因素干扰下的精度和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种边缘检测方法，尤其是涉及了一种视觉测量场景下基于深监督掩码自编码网络的图像边缘检测方法。

技术介绍

1、边缘是工业零件的重要几何特征之一。在零件的装配、对接等过程中，常以边缘作为特征，进行后续的测量和定位。因此，实现高精度的边缘检测尤为重要。

2、由于工业场景具有光照变化大、噪声干扰强的特点，在复杂应用场景中，常常存在误检和漏检问题。传统边缘检测方法通常采用基于图像梯度的方式，易受环境因素影响，在光照变化大、噪声较大的情况下，难以准确提取边缘。

3、近年来随着深度学习算法的发展，图像处理领域涌现出更多优秀的图像边缘检测算法。卷积神经网络中由于卷积和池化导致特征图尺度产生变化，因此最终输出图像并不对应于每个原始像素。而基于编解码器的方法能够针对输入图像产生等大的输出图像，这是因为解码器可以将编码器生成含有语义信息的特征图像映射回输入图像的大小，实现逐像素分类。

4、目前更多边缘检测的研究是基于多尺度特征融合的方法，通过逐层抽象，融合不同尺度特征的方式来提取图像边缘。其原因在于高层网络具有更大的感受野，因此具有更强的语义信息刻画能力；而下层网络具有更小的感受野，因而具有较强的细节信息刻画能力。

5、基于深度学习的边缘检测技术一定程度上提升了检测的精度和鲁棒性，然而仍然面临着边缘断续、边缘误检的问题。

技术实现思路

1、为解决
技术介绍
中存在的问题，本专利技术提出一种基于深监督掩码自编码网络的图像边缘检测方法，具有精度高、鲁棒性好等优点。

2、本专利技术的技术方案如下：

3、(1)使用自监督方式预训练掩码自编码器，获得预训练的掩码自编码器；

4、(2)基于预训练的掩码自编码器构建图像边缘检测网络；

5、(3)对图像边缘检测网络进行训练后，获得训练好的图像边缘检测网络；

6、(4)将待检测图片输入到训练好的图像边缘检测网络中，网络输出边缘检测结果。

7、所述(2)中，图像边缘检测网络包括预训练的掩码自编码器、金字塔特征提取模块和主从解码器，图像边缘检测网络的输入作为预训练的掩码自编码器的输入，预训练的掩码自编码器经金字塔特征提取模块后再与主从解码器相连，主从解码器的输出作为图像边缘检测网络的输出。

8、所述(3)中，采取分段学习率策略和学习率预热策略优化图像边缘检测网络的训练过程。

9、所述(1)中，掩码自编码器由12层vit依次相连组成。

10、所述(2)中，金字塔特征提取模块对掩码自编码器的3、5、7和11层vit的输出特征分别实现4倍、2倍、1倍和0.5倍特征尺寸缩放。

11、所述主从解码器的损失函数包括主解码器损失和从解码器损失，公式如下：

12、ltotal＝βllead+ηlaux

13、l(e,ytrue)-∑yi，jαlog(ei，j)+(1-yi，j)(1-α)log(1-ei，j)

14、

15、其中，llead为主解码器损失，laux为从解码器损失；l(e,ytrue)为主从解码器损失函数，e表示模型输出的推理边缘图片，ei,j表示模型输出的推理边缘图片中第(i,j)个元素的值，ttrue表示标签矩阵，α作为权重系数，yi,j为分割样本，为负样本数量，为正样本数量。

16、所述(3)中，采取分段学习率策略和学习率预热策略优化图像边缘检测网络的训练过程。

17、所述分段学习率策略具体为：

18、在掩码自编码器中采用较低学习率，在主从解码器中应用高学习率，如下式所示：

19、

20、其中，wmae表示掩码自编码器权重，wdecoder表示主从解码器权重；为掩码自编码器更新后的权重；为主从解码器更新后的权重；ξ为vit中的权重更新速度；η为学习率；ltotal为损失函数；ψ为卷积神经网络中的权重更新速度。

21、所述学习率预热策略具体为：

22、在训练开始时采用较小的学习率，再增大到预先设定好的学习率，最后随着训练逐渐衰减学习率，如下式所示：

23、

24、其中，lr代表当前的学习率，lrbase表示初始学习率；stepnow表示步长；ew为预热轮数；be为训练集迭代一个预热轮数所需的步数。

25、本专利技术的有益效果是：

26、1)本专利技术采用预训练的掩码自编码器作为网络的主体提取边缘特征，并对编码器输出3、5、7和11层特征进行卷积和上采样，构建了特征金字塔形的网络连接结构，使得整体结构能更好地利用图像信息学习的边缘特征。

27、2)本专利技术采用主从解码器、分段训练和学习率预热策略使得主体网络得到更加充分有效的训练，提升对精细边缘的提取能力。

28、3)本专利技术采用基于焦点损失的边缘提取模型损失函数，减少对无意义背景信息的权重，增加边缘信息的权重，并采用权重系数整合了主从解码器的不同损失，提升了训练效率和精度。

本文档来自技高网...

【技术保护点】

1.一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述(2)中，图像边缘检测网络包括预训练的掩码自编码器、金字塔特征提取模块和主从解码器，图像边缘检测网络的输入作为预训练的掩码自编码器的输入，预训练的掩码自编码器经金字塔特征提取模块后再与主从解码器相连，主从解码器的输出作为图像边缘检测网络的输出。

3.根据权利要求1所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述(3)中，采取分段学习率策略和学习率预热策略优化图像边缘检测网络的训练过程。

4.根据权利要求1所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述(1)中，掩码自编码器由12层ViT依次相连组成。

5.根据权利要求2所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述(2)中，金字塔特征提取模块对掩码自编码器的3、5、7和11层ViT的输出特征分别实现4倍、2倍、1倍和0.5倍特征尺寸缩放。

>6.根据权利要求2所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述主从解码器的损失函数包括主解码器损失和从解码器损失，公式如下：

7.根据权利要求1所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述(3)中，采取分段学习率策略和学习率预热策略优化图像边缘检测网络的训练过程。

8.根据权利要求7所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述分段学习率策略具体为：

9.根据权利要求7所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述学习率预热策略具体为：

...

【技术特征摘要】

1.一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，包括以下步骤：

4.根据权利要求1所述的一种基于深监督掩码自编码网络的图像边缘检测方法，其特征在于，所述(1)中，掩码自编码器由12层vit依次相连组成。

5.根据权利要求2...

【专利技术属性】
技术研发人员：刘振宇，王蕴睿，段桂芳，马睿豪，谭建荣，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人