一种基于视频语义分割技术的混凝土裂缝识别方法和装置制造方法及图纸

技术编号：25088691 阅读：48 留言：0更新日期：2020-07-31 23:33

本发明专利技术公开了一种基于视频语义分割技术的混凝土裂缝识别方法和装置，属于混凝土结构损伤检测技术领域，包括：获取裂缝视频，在视频图片帧中手动标注标签；利用空间位移卷积块对已标注的帧预测未来帧和未来标签，并同时传播未来帧和未来标签，获得合成样本并进行预处理，形成裂缝数据库；修改Deeplabv3+的数据的输入、输出端口及参数，使其接受视频输入，并以视频输出，建立CVN模型；将已训练好的Deeplabv3+网络中的卷积层，作为CVN模型的初始权重进行迁移；将裂缝数据库输入迁移后的CVN模型，训练针对裂缝数据的混凝土裂缝检测语义分割模型CVN。相比卷积神经分类网络减少了对数据量的需求，能够以视频输入、以视频输出，快速准确识别目标，具有实际工程意义。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于视频语义分割技术的混凝土裂缝识别方法和装置
本专利技术属于混凝土结构损伤检测
，尤其涉及一种基于视频语义分割技术的混凝土裂缝识别方法和装置。
技术介绍
混凝土是目前用量最大的一种建筑材料，广泛应用于道路、桥梁、隧道及工民建等基础设施的建设中。混凝土结构表面的损伤，包括裂缝、风化、孔洞和剥落等，从视觉上反映了混凝土结构的耐久性和安全性。其中，裂缝是对结构损伤最大、引起关注最多的一种损伤类型，定期的裂缝检测在基础设施的维护和运营中具有非常重要的作用。根据裂缝的形态和位置等特征，可以推断出结构内部的破坏程度以及劣化原因，这为结构健康性评估提供了合理的指导。早期所采用的裂缝检测方法以人工检测为主，需要维护人员配备一定的设备进行现场勘查、标记、测量，并记录检测结果。传统人工视觉检测方法效率低、成本高、漏查多，正逐渐被非接触式图像采集和计算机视觉分析相结合的机器学习方法取代。例如人工检测一座跨径100m的预应力混凝土箱梁桥，需要工程师借助钢卷尺、照相机、裂缝宽度、深度检测仪等工具并租用昂贵的桥检车，在临时封闭交通的条件下，至少花费6个小时进行现场原始记录，再借助CAD等画图工具才能将整个大桥的裂缝分布示意图绘制完成。机器学习方法借助无人机、爬壁机器人等先进设备携带高清摄像头对桥梁表面进行全覆盖拍照，再采用先进的算法对裂缝进行识别和定位，具有病害调查全面、信息真实可靠的优点，正在被学者关注和研究。为了保证裂缝图片的清晰度，一般每张图片的桥梁实际尺寸不超过4m2，按照100m跨径箱梁外表面4000m2和20％照...

【技术保护点】
1.一种基于视频语义分割技术的混凝土裂缝识别方法，其特征在于，包括以下步骤：/n获取裂缝视频，将视频每一帧图像保存下来，以预定间隔选取帧进行手动标注，作为手动标注样本；/n利用空间位移卷积块对已标注的帧预测未来帧和未来标签，并同时传播未来帧和未来标签，获得合成样本；/n对所述合成样本以及手动标注样本进行预处理，形成裂缝数据库；/n修改Deeplabv3+的数据的输入、输出端口以及参数，使其接受视频输入，并以视频输出，建立CVN模型；/n将已训练好的Deeplabv3+网络中的卷积层，作为CVN模型的初始权重进行迁移；/n将所述裂缝数据库输入迁移后的CVN模型，训练针对裂缝数据的混凝土裂缝检测语义分割模型CVN，使用混凝土裂缝检测语义分割模型CVN进行混凝土裂缝的识别。/n

【技术特征摘要】
1.一种基于视频语义分割技术的混凝土裂缝识别方法，其特征在于，包括以下步骤：
获取裂缝视频，将视频每一帧图像保存下来，以预定间隔选取帧进行手动标注，作为手动标注样本；
利用空间位移卷积块对已标注的帧预测未来帧和未来标签，并同时传播未来帧和未来标签，获得合成样本；
对所述合成样本以及手动标注样本进行预处理，形成裂缝数据库；
修改Deeplabv3+的数据的输入、输出端口以及参数，使其接受视频输入，并以视频输出，建立CVN模型；
将已训练好的Deeplabv3+网络中的卷积层，作为CVN模型的初始权重进行迁移；
将所述裂缝数据库输入迁移后的CVN模型，训练针对裂缝数据的混凝土裂缝检测语义分割模型CVN，使用混凝土裂缝检测语义分割模型CVN进行混凝土裂缝的识别。

2.根据权利要求1所述的一种基于视频语义分割技术的混凝土裂缝识别方法，其特征在于，所述手动标注时使用Labelme图像标注软件对图像中的裂缝进行。

3.根据权利要求1所述的一种基于视频语义分割技术的混凝土裂缝识别方法，其特征在于，所述空间位移卷积块会根据视频当前帧以及过去帧来预测未来帧中的物体。

4.根据权利要求1所述的一种基于视频语义分割技术的混凝土裂缝识别方法，其特征在于，传播未来帧和未来标签时，可由原始帧向前传播或向后传播。

5.根据权利要求1所述的一种基于视频语义分割技术的混凝土裂缝识别方法，其特征在于，利用空间位移卷积块预测未来帧和未来标签，其中，未来帧、未来标签中任意一点的坐标Ft+1(x,y)、Mt+1(x,y)为：

(u，v)＝C(I1：t)
式中，(x，y)是某一帧内任意像素点的坐标，C是一个用于预测基于输入帧F1到Ft的运动矢量(u,v)的三维CNN，K(x,y)∈RN×N是C在(x,y)处预...

【专利技术属性】
技术研发人员：申永刚，俞臻威，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人