智能监控环境下基于改进yolov3的实时行人检测方法及装置制造方法及图纸

技术编号:27657335 阅读:25 留言:0更新日期:2021-03-12 14:20
本发明专利技术提供了一种智能监控环境下基于改进yolov3的实时行人检测方法及装置,该方法包括以下步骤:获取监控场景下的行人图像,对图像中的行人目标进行标注,将图像按一定比例随机划分为训练集、测试集和验证集;对训练集、测试集和验证集的图像进行预处理;利用训练集对改进后的yolov3算法进行训练,所述改进后的yolov3算法为在原始yolov3算法的基础上对特征提取网络、特征融合层、预测层进行改进后的算法;通过测试集和验证集来选取改进后yolov3算法的最优模型,并将其用于监控视频下的行人检测。本发明专利技术在保证对输入图像进行丰富细致的特征提取的同时保持了较低的计算量,提高了图像利用率,减小了行人检测计算量,保持低耗时的同时提高对行人的检测效果。

【技术实现步骤摘要】
智能监控环境下基于改进yolov3的实时行人检测方法及装置
本专利技术涉及图像处理
,尤其涉及一种智能监控环境下基于改进yolov3的实时行人检测方法及装置。
技术介绍
行人检测是计算机视觉的一项基本任务,是指通过计算机判断图像或视频帧中是否存在行人并给出行人的精确位置的技术。行人检测结合行人重识别后能广泛应用于智能视频监控和智能安保等领域。由于该技术在以上行业的广泛应用,行人检测技术已成为计算机视觉领域最活跃的研究方向之一。行人检测方法主要分为两种,基于传统手工特征的方法和基于深度学习的方法。前者又称为特征工程方法,侧重于寻找或设计优秀的特征描述子,普遍存在提取的特征单一、计算复杂度高、对行人外观变化缺乏鲁棒性、检测性能不高等问题。随着深度学习在图像任务上的崛起,行人检测领域已经逐渐出现了各种端到端的深度学习检测方法,比较有代表性的有Faster-rcnn,SSD,yolov3,Tiny-yolov3等算法。yolov3系列算法是一种单阶段目标检测算法,在不同的特征层上对特征图上的点预测有无目标的置信度、目标的位置以及目标的类别。相比Faster-rcnn与SSD算法,yolov3算法均衡了速度和准确率两方面指标,是当前目标检测领域最为优秀的算法之一。然而原生yolov3和Tiny-yolov3分别采用具有53层卷积的DarkNet53和一个7层的小型特征提取网络,前者可以保证较高精度但是计算复杂度较高,后者降低了计算复杂度但是同时检测精度也大幅降低。对于智能监控等场景,其对行人检测的精度和实时性均有较高要求,特别是在CPU环境或嵌入式设备中,以上算法未能达到又快精度又高的要求。
技术实现思路
为解决现有技术存在的上述技术问题,本专利技术提供一种智能监控环境下基于改进yolov3的实时行人检测方法及装置。本专利技术是这样实现的:一方面,本专利技术提供一种智能监控环境下基于改进yolov3的实时行人检测方法,包括以下步骤:获取监控场景下的行人图像,对图像中的行人目标进行标注,将图像按一定比例随机划分为训练集、测试集和验证集;对训练集、测试集和验证集的图像进行预处理;利用训练集对改进后的yolov3算法进行训练,所述改进后的yolov3算法为在原始yolov3算法的基础上对特征提取网络、特征融合层、预测层进行改进后的算法;通过测试集和验证集来选取改进后yolov3算法的最优模型,并将其用于监控视频下的行人检测。进一步地,所述对训练集、测试集和验证集的图像进行预处理具体包括:对图像进行水平翻转,颜色、亮度、对比度随机变换,色温变换,随机裁剪的数据扩增操作。进一步地,所述在原始yolov3算法的基础上对特征提取网络进行改进具体包括:采用EfficentNet-B0特征提取网络替换原始yolov3算法的DarkNet53网络。进一步地,所述在原始yolov3算法的基础上对特征融合层进行改进具体包括:将原始yolov3算法的特征融合层卷积系列中的1x1、3x3、1x1、3x3、1x1卷积层减少为1x1、3x3、1x1卷积层。进一步地,所述在原始yolov3算法的基础上对特征融合层进行改进还包括:将原始yolov3算法的特征融合层的3x3普通卷积改进为压缩卷积。进一步地,所述对训练集、测试集和验证集的图像进行预处理具体包括:根据图像的实际长宽比,将原始输入图像的长和宽分别调整到32像素的整数倍,并将网络输入图像尺寸由方形输入调整为固定的矩形输入的形式。进一步地,所述在原始yolov3算法的基础上对预测层进行改进具体包括:改进后的yolov3算法对于矩形图像输入,1/8、1/16、1/32三种尺度预测层中特征图w和h方向的像素数分别为W和H,将三种尺度预测层的输出大小分别改进为WSxHSx3x(1+4+N)、WMxHMx3x(1+4+N)、WLxHLx3x(1+4+N)。进一步地,所述利用训练集对改进后的yolov3算法进行训练具体包括:采用不同训练策略及优化参数多次训练,得到多个模型文件。进一步地,所述通过测试集和验证集来选取改进后yolov3算法的最优模型具体包括:在测试集测试单次训练过程中不同训练阶段保存的模型的map指标中,选择map指标最高的模型文件进行保存;在验证集上测试保存的不同参数下模型的map指标,取map指标最高的模型作为最优模型。另一方面,本专利技术还提供一种智能监控环境下基于改进yolov3的实时行人检测装置,包括:图像标注划分模块,用于获取监控场景下的行人图像,对图像中的行人目标进行标注,将图像按一定比例随机划分为训练集、测试集和验证集;图像预处理模块,用于对训练集、测试集和验证集的图像进行预处理;改进yolov3算法训练模块,用于利用训练集对改进后的yolov3算法进行训练,所述改进后的yolov3算法为在原始yolov3算法的基础上对特征提取网络、特征融合层、预测层进行改进后的算法;模型选取模块,用于通过测试集和验证集来选取改进后yolov3算法的最优模型,并将其用于监控视频下的行人检测。与现有技术相比,本专利技术具有以下有益效果:1、采用了更为高效的特征提取网络,在保证对输入图像进行丰富细致的特征提取的同时保持了较低的计算量;2、针对实际视频帧图像的长宽比,对输入图像尺寸及网络的预测层输出向量进行了调整,有效提高了图像利用率,相对于原yolov3方形图像输入减小了行人检测计算量;3、在各特征融合层减少了卷积层数并采用了计算复杂度较低但感受野更大的缩放卷积机制,保持低耗时的同时提高对行人的检测效果。附图说明图1为本专利技术实施例提供的一种智能监控环境下基于改进yolov3的实时行人检测方法的流程图;图2为本专利技术实施例提供的改进后的yolov3算法的网络结构图;图3为本专利技术实施例提供的特征融合层改进前后对比图;图4为本专利技术实施例提供的普通卷积和压缩卷积结构图;图5为本专利技术实施例提供的一种智能监控环境下基于改进yolov3的实时行人检测装置的方框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。如图1所示,本专利技术实施例提供一种智能监控环境下基于改进yolov3的实时行人检测方法,包括以下步骤:S1、获取监控场景下的行人图像,对图像中的行人目标进行标注,将图像按一定比例随机划分为训练集、测试集和验证集;具体地,可通过采集监控摄像头下的视频然后解析得到多个行人多种状态下的图像,在一个实施例中,可收集约2000个行人不同地点、不同时间、不同角度、不同天气、不同距本文档来自技高网
...

【技术保护点】
1.一种智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,包括以下步骤:/n获取监控场景下的行人图像,对图像中的行人目标进行标注,将图像按一定比例随机划分为训练集、测试集和验证集;/n对训练集、测试集和验证集的图像进行预处理;/n利用训练集对改进后的yolov3算法进行训练,所述改进后的yolov3算法为在原始yolov3算法的基础上对特征提取网络、特征融合层、预测层进行改进后的算法;/n通过测试集和验证集来选取改进后yolov3算法的最优模型,并将其用于监控视频下的行人检测。/n

【技术特征摘要】
1.一种智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,包括以下步骤:
获取监控场景下的行人图像,对图像中的行人目标进行标注,将图像按一定比例随机划分为训练集、测试集和验证集;
对训练集、测试集和验证集的图像进行预处理;
利用训练集对改进后的yolov3算法进行训练,所述改进后的yolov3算法为在原始yolov3算法的基础上对特征提取网络、特征融合层、预测层进行改进后的算法;
通过测试集和验证集来选取改进后yolov3算法的最优模型,并将其用于监控视频下的行人检测。


2.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述对训练集、测试集和验证集的图像进行预处理具体包括:
对图像进行水平翻转,颜色、亮度、对比度随机变换,色温变换,随机裁剪的数据扩增操作。


3.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述在原始yolov3算法的基础上对特征提取网络进行改进具体包括:
采用EfficentNet-B0特征提取网络替换原始yolov3算法的DarkNet53网络。


4.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述在原始yolov3算法的基础上对特征融合层进行改进具体包括:
将原始yolov3算法的特征融合层卷积系列中的1x1、3x3、1x1、3x3、1x1卷积层减少为1x1、3x3、1x1卷积层。


5.如权利要求4所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述在原始yolov3算法的基础上对特征融合层进行改进还包括:
将原始yolov3算法的特征融合层的3x3普通卷积改进为压缩卷积。


6.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述对训练集、测试集和验证集的图像进行预处理具体包括:
根据图像的实...

【专利技术属性】
技术研发人员:查杭杨波
申请(专利权)人:中国信息通信科技集团有限公司武汉烽火众智数字技术有限责任公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1