本发明专利技术涉及一种基于改进编解码网络模型的裂缝检测方法,将经过数据预处理的数据集送入编码器进行特征提取,模型采用编码器
【技术实现步骤摘要】
一种基于改进编解码网络模型的裂缝检测方法
[0001]本专利技术涉及安全监测图像处理
,尤其是一种基于改进编解码网络模型的裂缝检测方法。
技术介绍
[0002]混凝土表面裂缝检测是混凝土建筑结构健康监测的重要内容。如果建筑物表面出现裂缝并继续延伸,长此以往会导致结构失效,造成较严重的经济损失与人员伤亡。人工检测裂缝的过程费时费力,并且有一定的主观判断因素影响检测精度,高层建筑、桥梁等结构也很难实现人工检测。因此,基于图像处理技术的混凝土裂缝自动化检测的方法成为当前研究的热点。
[0003]随着信息技术的飞速发展,研究人员提出将计算机视觉和图像处理技术应用到裂缝检测中,传统的裂缝检测方法有Gabor滤波器、定向梯度直方图、局部二值模式、基于阈值估计等。虽然这些方法也取得了不错的检测结果,但是对于数据集质量要求较高,在光照不均、裂缝拓扑结构复杂、噪声多的数据集上表现欠佳。随着深度学习在各领域中的广泛应用与优异表现,近年来,研究者们致力于将卷积神经网络运用到裂缝检测中以解决传统方法的局限性。
[0004]在裂缝检测领域,传统的卷积神经网络特征提取阶段降低了特征图的分辨率,使得很多裂缝图像低级语义信息以及细粒度的空间结构信息丢失,容易漏检误检某些细小裂缝。即使有上采样以及特征融合等操作恢复图像细节信息,网络仍难以精确提取到拓扑结构复杂、前景与背景极度不平衡的裂缝图像细节特征。
技术实现思路
[0005]本专利技术要解决的技术问题是:为了克服现有技术中之不足,本专利技术提供一种基于改进编解码网络模型的裂缝检测方法,以解决现有技术中混凝土表观裂缝的检测准确率低、易丢失细小裂缝、裂缝像素占比小的问题。
[0006]本专利技术解决其技术问题所采用的技术方案是:一种基于改进编解码网络模型的裂缝检测方法,包括以下步骤:
[0007]S1、数据获取:使用智能设备在混凝土建筑上拍摄采集裂缝图像数据;
[0008]S2、数据标记:使用labelme软件对采集的图像数据进行标记分类;
[0009]S3、数据预处理:采用数据增强方法倍化所采集的数据集;
[0010]S4、将经过数据预处理的数据集送入编码器进行特征提取:编码器中主干网络使用经过预训练的Resnet34,ResNet的主要思想是在网络中增加了直连通道,即Highway Network的思想。ResNet通过直接将输入信息绕道传到输出,保护信息的完整性,整个网络只需要学习输入、输出差别的那一部分,简化学习目标和难度。
[0011]在编码器中间层加入空洞卷积,编码器阶段为了提取图片特征,卷积神经网络能够自动学习图片特征,图片中的特征信息分为低层语义信息和高层语义信息,浅层神经网
络学习到的是图像的轮廓、纹理等低层信息,随着神经网络层数的加深,网络能够学习到更加抽象、高级的特征。但是,上述方法在提取特征阶段也即多层卷积最大池化操作中降低了特征图的分辨率并增大感受野,使得很多图像细节信息以及空间信息丢失,容易漏检某些细小裂缝。
[0012]空洞卷积的提出就是为了在不降低特征图的尺寸的同时实现感受野的增长,让每个卷积的输出包含更大范围的信息。
[0013]定义k为卷积核大小、k
’
为感受野大小、d为扩张率大小,则感受野的计算公式为:
[0014]k
′
=k+(k
‑
1)*(d
‑
1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0015]从一维角度解释空洞卷积,定义H为输入大小、FR为卷积核大小、Output为输出特征图尺寸、D为扩张率、P为填充、S为步长。输出特征图大小尺寸计算公式为:
[0016][0017]S5、特征提取结束,进行特征图尺寸恢复至原图尺寸的解码器操作:在解码器前端加入多核池化模块来生成多个感受野捕捉不同尺度上信息,池化操作后输出特征图尺寸计算公式如下所示:
[0018][0019]上式中,(H,W)为特征图分辨率、(FH,FW)为池化核大小、(OutputH,OutputW)为输出特征图分辨率、P为填充、S为步长,最外面符号为向下取整;
[0020]S6、使用改进的网络模型对步骤S3中的数据集进行检测,生成训练模型,生成模型过程中使用损失函数对模型进行监督,使用裂缝数据集训练改进的编解码网络模型生成检测模型,判断图片裂缝像素区域,输出裂缝分割结果。
[0021]具体说,所述的步骤S5中,多核池化模块获取上下文语境信息包括以下步骤:
[0022]S5
‑
1、不同池化核下输出的多尺寸的低维特征图通过双线性插值进行上采样,使其与原始特征图尺寸相同;
[0023]S5
‑
2、在每个特征图后使用1x1卷积,使特征图的维数降到原始特征的1/n,这里的n表示为原始特征图的通道数;
[0024]S5
‑
3、将不同层级的特征图和原始特征图拼接成最终输出的特征图,这里的拼接就是concat过程。
[0025]优选地,所述生成训练模型时,选择组合损失函数Bce loss+Dice loss,Bce loss为二分类交叉熵损失函数,公式表示为:
[0026][0027]其中y
i
表示为第i个像素点的标签值,为第i个像素点的预测标签值,普通的交叉熵损失函数在大量简单样本的迭代过程中比较缓慢且可能无法优化至最优,
[0028]Dice可以理解为两个轮廓区域的相似程度,用A、B表示两个轮廓区域所包含的点
集,定义为:
[0029]DSC(A,B)=2|A∩B|/(|A|+|B|)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0030]二分类Dice loss的公式表示为:
[0031][0032]将上述两者线性结合得到损失函数,公式表示为:
[0033]Loss=0.5BL+DL
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0034]本专利技术的有益效果是:本专利技术所提出的一种用于裂缝检测的级联双核空洞卷积,在下采样中间层使用此模块,目的是可以保留有更多裂缝的低层语义信息和容易丢失的空间结构信息在跳跃连接阶段进行融合,从而实现更详细的图像信息保留;通过在在解码器阶段引入多核池化模块,生成多个感受野捕捉不同尺度上的信息并融合,相比单一的池化层所获得的信息更有全局性,能够有效提高不同尺寸裂缝的检测效果。
附图说明
[0035]下面结合附图和实施例对本专利技术进一步说明。
[0036]图1是本专利技术中的数据增强示意图。
[0037]图2是本专利技术中所述ResNet的残差示意图。
[0038]图3是本专利技术中所述不同扩张率的空洞卷积示意图。
[0039]图4是本专利技术中所述级联的双核空洞卷积模块示意图。
[0040]图5是本专利技术中所述多核池化模块的结构示意图。
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于改进编解码网络模型的裂缝检测方法,其特征是:具有以下步骤:S1、数据获取:使用智能设备在混凝土建筑上拍摄采集裂缝图像数据;S2、数据标记:使用labelme软件对采集的图像数据进行标记分类;S3、数据预处理:采用数据增强方法倍化所采集的数据集;S4、将经过数据预处理的数据集送入编码器进行特征提取:编码器中主干网络使用经过预训练的Resnet34,在编码器中间层加入空洞卷积,定义k为卷积核大小、k
’
为感受野大小、d为扩张率大小,则感受野的计算公式为:k
′
=k+(k
‑
1)*(d
‑
1)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)从一维角度解释空洞卷积,定义H为输入大小、FR为卷积核大小、Output为输出特征图尺寸、D为扩张率、P为填充、S为步长。输出特征图大小尺寸计算公式为:S5、特征提取结束,进行特征图尺寸恢复至原图尺寸的解码器操作:在解码器前端加入多核池化模块来生成多个感受野捕捉不同尺度上信息,池化操作后输出特征图尺寸计算公式如下所示:上式中,(H,W)为特征图分辨率、(FH,FW)为池化核大小、(OutputH,OutputW)为输出特征图分辨率、P为填充、S为步长,最外面符号为向下取整;S6、使用改进的网络模型对步骤S3中的数据集进行检测,生成训练模型,生成模型过程中使用损失函数对模型进行监督,使用裂缝数据集训练改进的编解码网络模型生成检测模...
【专利技术属性】
技术研发人员:徐守坤,杨秋媛,李宁,石林,庄丽华,王雨生,
申请(专利权)人:常州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。