基于深度学习的乱贴乱画检测方法,存储装置及服务器制造方法及图纸

技术编号:36892070 阅读:25 留言:0更新日期:2023-03-15 22:01
本发明专利技术提供一种基于深度学习的乱贴乱画检测方法,包括以下步骤:S1通过摄像头采集视频图像数据,删除重复乱贴乱画图像数据,删除没有乱贴乱画的图像数据;S2标注数据;S3按8:2拆分数据集为训练集和验证集;S4数据增强和归一化训练集,调整到预设大小维度;S5计算训练集的RGB平均值和方差;S6数据通过Darknet

【技术实现步骤摘要】
基于深度学习的乱贴乱画检测方法,存储装置及服务器


[0001]本专利技术提供一种基于深度学习的乱贴乱画检测方法,属于深度学习

机器视觉技术范畴。

技术介绍

[0002]乱贴、乱画、乱挂是指擅自在城区道路、场地、公共场所、公用设施、建筑物、构筑物、树木及其他设施上涂写、刻画、张贴和设置条幅、彩旗、招牌、充气物及其他悬挂物的行为。
[0003]乱贴乱画,被称为城市的“牛皮癣”。由于违法成本较低,容易反复发作,给整洁的市容环境带来不小的影响。
[0004][0005]为进一步提升城市精细化管理水平,有效解决乱扯乱挂、乱贴乱画等有碍市容市貌的问题,本专利技术深刻把握任务目标,创新识别,重点检测乱贴乱画墙面目标。
[0006]专利技术目的
[0007]本专利技术的专利技术目的是,提供一种可以自动精准识别乱贴乱画的基于深度学习的乱贴乱画检测方法,包括以下步骤:
[0008]S1通过摄像头采集视频图像数据,删除重复乱贴乱画图像数据,删除没有乱贴乱画的图像数据;
[0009]S2标注数据,标注格式为x、y、w、h、label,x表示标注框的横坐标、 y表示标注框的纵坐标、w表示标注框的框宽、h表示标注框的框高、label 表示框标签,一张图片有一个或多个标注框;
[0010]S3按8:2拆分数据集为训练集和验证集;
[0011]S4数据增强和归一化训练集,调整到预设大小维度;
[0012]S5计算训练集的RGB平均值和方差;
[0013]S6数据通过Darknet

19提取特征,FPN处理后,经IoU损失计算优化 Darknet

19、FPN模型中的权重;
[0014]S7训练和验证模型,导出模型;
[0015]S8使用模型进行实时在线乱贴乱画检测。
[0016]进一步的,Darknet

19计算过程包括,
[0017]3×
3卷积核,步长为1,通道为32的卷积层,输出大小为224
×
224;
[0018]大小为2
×
2,步长为2的最大池化层,输出大小为112
×
112;
[0019]3×
3卷积核,步长为1,通道为64的卷积层,输出大小为112
×
112;
[0020]大小为2
×
2,步长为2的最大池化层,输出大小为56
×
56;
[0021]3×
3卷积核,步长为1,通道为128的卷积层,输出大小为56
×
56;
[0022]1×
1卷积核,步长为1,通道为64的卷积层,输出大小为56
×
56;
[0023]3×
3卷积核,步长为1,通道为128的卷积层,输出大小为56
×
56;
[0024]大小为2
×
2,步长为2的最大池化层,输出大小为28
×
28;
[0025]3×
3卷积核,步长为1,通道为256的卷积层,输出大小为28
×
28;
[0026]1×
1卷积核,步长为1,通道为128的卷积层,输出大小为28
×
28;3
×
3卷积核,步长为1,通道为256的卷积层,输出大小为28
×
28;大小为2
×
2,步长为2的最大池化层,输出大小为14
×
14;
[0027]3×
3卷积核,步长为1,通道为512的卷积层,输出大小为14
×
14; 1
×
1卷积核,步长为1,通道为256的卷积层,输出大小为14
×
14; 3
×
3卷积核,步长为1,通道为512的卷积层,输出大小为14
×
14; 1
×
1卷积核,步长为1,通道为256的卷积层,输出大小为14
×
14; 3
×
3卷积核,步长为1,通道为512的卷积层,输出大小为14
×
14;大小为2
×
2,步长为2的最大池化层,输出大小为7
×
7;
[0028]3×
3卷积核,步长为1,通道为1024的卷积层,输出大小为7
×
7; 1
×
1卷积核,步长为1,通道为512的卷积层,输出大小为7
×
7; 3
×
3卷积核,步长为1,通道为1024的卷积层,输出大小为7
×
7; 1
×
1卷积核,步长为1,通道为512的卷积层,输出大小为7
×
7; 3
×
3卷积核,步长为1,通道为1024的卷积层,输出大小为7
×
7;1
×
1卷积核,步长为1,通道为1000的卷积层,输出大小为7
×
7。进一步的,所述IoU损失计算优化包括,
[0029]真实框:
[0030]预测框:Pre_bbox=(x
t
,x
b
,x
l
,x
r
)
[0031][0032]其中:x
t
,x
b
,x
l
,x
r
表示神经网络输出的目标点到四周的距离信息;表示真实标注的目标点到四周的距离信息;
[0033]IoU Loss层反馈x
t
,x
b
,x
l
,x
r
的偏导数:
[0034][0035][0036]卷积计算公式:
[0037][0038]A为特征矩阵;B为卷积核矩阵,l、m为B的行列索引;C为输出特征, i、j为C的行列索引;其中i<=A的行数、j<=A的列数;
[0039][0040]n
in
:输入特征大小;n
out
:输出特征大小;k:卷积核大小;p:卷积padding 大小;s:卷积步长大小。
[0041]本专利技术还提供一种基于深度学习的乱贴乱画检测存储装置,其中存储有多条指
令,所述指令适于由处理器执行以下步骤,
[0042]S1通过摄像头采集视频图像数据,删除重复乱贴乱画图像数据,删除没有乱贴乱画的图像数据;
[0043]S2响应用户输入,标注数据,标注格式为x、y、w、h、label,x表示标注框的横坐标、y表示标注框的纵坐标、w表示标注框的框宽、h表示标注框的框高、label表示框标签,一张图片有一个或多个标注框;
[0044]S3按8:2拆分数据集为训练集和验证本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的乱贴乱画检测方法,其特征在于,包括以下步骤:S1通过摄像头采集视频图像数据,删除重复乱贴乱画图像数据,删除没有乱贴乱画的图像数据;S2标注数据,标注格式为x、y、w、h、label,x表示标注框的横坐标、y表示标注框的纵坐标、w表示标注框的框宽、h表示标注框的框高、label表示框标签,一张图片有一个或多个标注框;S3按8:2拆分数据集为训练集和验证集;S4数据增强和归一化训练集,调整到预设大小维度;S5计算训练集的RGB平均值和方差;S6数据通过Darknet

19提取特征,FPN处理后,经IoU损失计算优化Darknet

19、FPN模型中的权重;S7训练和验证模型,导出模型;S8使用模型进行实时在线乱贴乱画检测。2.如权力要求1所述的一种基于深度学习的乱贴乱画检测方法,其特征在于,Darknet

19计算过程包括,3
×
3卷积核,步长为1,通道为32的卷积层,输出大小为224
×
224;大小为2
×
2,步长为2的最大池化层,输出大小为112
×
112;3
×
3卷积核,步长为1,通道为64的卷积层,输出大小为112
×
112;大小为2
×
2,步长为2的最大池化层,输出大小为56
×
56;3
×
3卷积核,步长为1,通道为128的卷积层,输出大小为56
×
56;1
×
1卷积核,步长为1,通道为64的卷积层,输出大小为56
×
56;3
×
3卷积核,步长为1,通道为128的卷积层,输出大小为56
×
56;大小为2
×
2,步长为2的最大池化层,输出大小为28
×
28;3
×
3卷积核,步长为1,通道为256的卷积层,输出大小为28
×
28;1
×
1卷积核,步长为1,通道为128的卷积层,输出大小为28
×
28;3
×
3卷积核,步长为1,通道为256的卷积层,输出大小为28
×
28;大小为2
×
2,步长为2的最大池化层,输出大小为14
×
14;3
×
3卷积核,步长为1,通道为512的卷积层,输出大小为14
×
14;1
×
1卷积核,步长为1,通道为256的卷积层,输出大小为14
×
14;3
×
3卷积核,步长为1,通道为512的卷积层,输出大小为14
×
14;1
×
1卷积核,步长为1,通道为256的卷积层,输出大小为14
×
14;3
×
3卷积核,步长为1,通道为512的卷积层,输出大小为14
×
14;大小为2
×
2,步长为2的最大池化层,输出大小为7
×
7;3
×
3卷积核,步长为1,通道为1024的卷积层,输出大小为7
×
7;1
×
1卷积核,步长为1,通道为512的卷积层,输出大小为7
×
7;3
×
3卷积核,步长为1,通道为1024的卷积层,输出大小为7
×
7;1
×
1卷积核,步长为1,通道为512的卷积层,输出大小为7
×
7;3
×
3卷积核,步长为1,通道为1024的卷积层,输出大小为7
×
7;1
×
1卷积核,步长为1,通道为1000的卷积层,输出大小为7
×
7。
3.如权力要求1所述的一种基于深度学习的乱贴乱画检测方法,其特征在于,所述IoU损失计算优化包括,真实框:预测框:Pre_bbox=(x
t
,x
b
,x
l
,x
r
)其中:x
t
,x
b
,x
l
,x
r
表示神经网络输出的目标点到四周的距离信息;表示真实标注的目标点到四周的距离信息;IoU Loss层反馈x
t
,x
b
,x
l
,x
r
的偏导数:的偏导数:卷积计算公式:A为特征矩阵;B为卷积核矩阵,l、m为B的行列索引;C为输出特征,i、j为C的行列索引;其中i<=A的行数、j<=A的列数;n
in
:输入特征大小;n
out
:输出特征大小;k:卷积核大小;p:卷积padding大小;s:卷积步长大小。4.一种基于深度学习的乱贴乱画检测存储装置,其特征在于,其中存储有多条指令,所述指令适于由处理器执行以下步骤,S1通过摄像头采集视频图像数据,删除重复乱贴乱画图像数据,删除没有乱贴乱画的图像数据;S2响应用户输入,标注数据,标注格式为x、y、w、h、label,x表示标注框的横坐标、y表示标注框的纵坐标、w表示标注框的框宽、h表示标注框的框高、label表示框标签,一张图片有一个或多个标注框;S3按8:2拆分数据集为训练集和验证集;S4数据增强和归一化训练集,调整到预设大小维度;S5计算训练集的RGB平均值和方差;S6数据通过Darknet

19提取特征,FPN处理后,经IoU损失计算优化Darknet

19、FPN模型中的权重;S7训练和验证模型,导出模型;S8使用模型进行实时在线乱贴乱画检测。
5.如权力要求4所述的一种基于深度学习的乱贴乱画检测存储装置,其特征在于,Darknet

19计算过程包括,3
×
3卷积核,步长为1,通道为32的卷积层,输出大小为224
×
224;大小为2
×
2,步长为2的最大池化层,输出大小为112
×
112;3
×
3卷积核,步长为1,通道为64的卷积层,输出大小为112
×
112;大小为2
×
2,步长为2的最大池化层,输出大小为56
×
56;3
×
3卷积核,步长为1,通道为128的卷积层,输出大小为56
×
56;1
×
1卷积核,步长为1,通道为64的卷积层,输出大小为56
×
56;3
×
3卷积核,步长为1,通道为128的卷积层,输出大小为56
×
56;大小为2
×
2,步长为2的最大池化层,输出大小为28
×
28;3
×
3卷积核,步长为1,通道为256的卷积层,输出大小为28
×
28;1
×
1卷积核,步长为1,通道为128的卷积层,输出大小为28
×
28;3
×
3卷积核,步长为1,通道为256的卷积层,输出大小为28
×
28;大小为2
×
2,步长为2的最大池化层,输出大小为14
×
14;3
×
3卷...

【专利技术属性】
技术研发人员:孙德亮
申请(专利权)人:中再云图技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1