一种城市行人检测方法技术

技术编号:19964854 阅读:37 留言:0更新日期:2019-01-03 13:08
本发明专利技术公开了一种城市行人检测方法,包括以下步骤:S1、通过图像特征获取模块接收原始图像;S2、将接收的原始图像通过图像处理模块进行处理;S3、特征图扩展;S4、将所述整体特征图像和所述局部特征放大图像依次连接;S5、分类网络训练:利用多种尺度行人在不同特征图中的的分布训练深度神经网络;S6、行人检测标注:将得到的两种规模特征图的候选窗口数目按比例汇总,经过S5中训练好的分类器分类,经过非极大值抑制后框出行人;S7、检测结果显示。本发明专利技术采用整体特征图像与局部放大特征图像配合检测,提高了行人检测的准确性,并且利不同特征图上检测用不同权值加权有效避免了单一特征图检测的误判和漏检。

A Pedestrian Detection Method in City

The invention discloses an urban pedestrian detection method, which comprises the following steps: S1, receiving the original image through the image feature acquisition module; S2, processing the received original image through the image processing module; S3, feature map expansion; S4, sequentially connecting the whole feature image and the local feature enlarged image; S5, classification network training: using a variety of scales pedestrian. Distributed training depth neural networks in different feature maps; S6, pedestrian detection and annotation: the number of candidate windows of the two scale feature maps is aggregated proportionally, classified by the classifier trained in S5, and the travelers are restrained by non-maximum value; S7, detection results show. The pedestrian detection accuracy is improved by combining the whole feature image with the local enlarged feature image, and different weights are used to effectively avoid the misjudgment and omission of single feature image detection.

【技术实现步骤摘要】
一种城市行人检测方法
本专利技术涉及目标检测领域,具体是一种城市行人检测方法。
技术介绍
行人检测(PedestrianDetection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人跟踪,行人重识别等技术结合,应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域。由于行人兼具刚性和柔性物体的特性,外观易受穿着、尺度、遮挡、姿态和视角等影响,使得行人检测成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。现有行人检测方法有三种,分别为基于全局特征的方法、基于人体部位的方法、基于立体视觉的方法。近年来,行人检测技术在智能监控、自动驾驶、机器人视觉等方面具有广泛的应用。实际应用中行人的着装,姿态尤其是视频中捕捉到的行人尺寸多变使得行人检测面临极大的挑战性。行人检测主要有两大方式:一种是基于滑动窗口的传统的行人检测方法,一种是基于深度学习提取特征的行人检测方法。传统的行人检测方法计算量大且没有利用GPU资源检测速度受限,由于计算机性能不断增强并且利用了GPU计算能力,大多基于学习特征的深度学习方法检测速度优于传统方法,但是往往难以解决行人的多尺度问题。
技术实现思路
本专利技术的目的在于提供一种城市行人检测方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种城市行人检测方法,包括以下步骤:S1、通过安装于城市道路旁的摄像头采集行人图像,并将采集的图像上传,通过图像特征获取模块接收原始图像;S2、将接收的原始图像通过图像处理模块进行处理,并提取其中的局部特征,进行放大,其中,所述图像特征图(或者叫地标图)是指利用参数化特征(如点和线)的全局位置来表示环境;S3、特征图扩展:通过图像幂率规则和图像特征金字塔规则计算图像临近规模对应的特征图;S4、将所述整体特征图像和所述局部特征放大图像依次连接,并将整体特征图像和所述局部特征放大图像输送到特征数据库模块进行比对;S5、分类网络训练:利用多种尺度行人在不同特征图中的的分布训练深度神经网络;S6、行人检测标注:将得到的两种规模特征图的候选窗口数目按比例汇总,经过S5中训练好的分类器分类,经过非极大值抑制后框出行人;S7、检测结果显示。作为本专利技术进一步的方案:所述S2中将接收的图像进行提取放大的步骤为:从整体特征图像中,扫面选取行人的明显特征,并通过放大,清晰的处理,将局部特征显现处理,并进行保存。作为本专利技术再进一步的方案:所述S3中扩展的图片规模和扩展次数不设限。作为本专利技术再进一步的方案:所述S3中对特征图扩展的步骤为:通过图像幂率规则和图像特征金字塔规则计算图像I1临近规模对应的特征图,一般利用fm=Cp(S(I1,M)),式中I1代表原图像,M代表缩放规模,S代表将原图缩放,Cp代表卷积池化操作计算特征,现在为减少卷积运算提高运行速度,利用公式:其中:参数m表示当前规模,m’表示缩放后的规模,S代表将特征图缩放m’/m倍,f表示特征,常系数α可以在训练集上通过实验测得,以上公式表明原图Im通过卷积池化操作得到特征,临近缩放规模图像特征由已知特征图近似计算得到,如1/2*I1可以计算得到f1/2,因为图像上采样没有高频损失,上采样图片的信息内容与低分辨率的内容相似,特征计算公式为:fσ=σ*S(f1,σ)(3.2)式中f1代表原图对应特征图,S代表将特征图f1放大σ倍,fσ为上采样图像。作为本专利技术再进一步的方案:所述S5中对分类网络训练包括:选择在有多种行人尺度的KITTI数据集上实验,我们在训练数据集上将行人按高度分为X个尺寸的行人。作为本专利技术再进一步的方案:利用卷积层特征共享训练RPN(regionproposalnetwork)网络和softmax分类器联合网络,采用交叉轮流训练的方式,先训练区域提议网络(RPN),再用提议(proposal)训练基于区域的分类器网络,再用分类器网络训练区域提议网络,损失层(losslayer)是卷积神经网络(CNN)的终点,接受两个值作为输入,其中一个是CNN的预测值,另一个是真实标签。作为本专利技术再进一步的方案:所述损失层则将这两个输入进行一系列运算,得到当前网络的损失函数(LossFunction),一般记做L(W),其中W是当前网络权值构成的向量空间,训练网络的目的是在权值空间中找到让损失函数L(W)最小的权值W(opt),可以采用随机梯度下降(stochasticgradientdescent)的最优化方法逼近权值W(opt),网络中有两个损失函数,一个是分类损失函数一个是回归损失函数。作为本专利技术再进一步的方案:所述S6中对行人检测标注的步骤为:每个规模的候选行人分别与S5中训练得到的权重lx相乘,通过非极大值抑制,除去与最大置信度窗口重叠超过65%的窗口。与现有技术相比,本专利技术的有益效果是:本专利技术采用整体特征图像与局部放大特征图像配合检测,提高了行人检测的准确性,并且利不同特征图上检测用不同权值加权有效避免了单一特征图检测的误判和漏检。附图说明图1为城市行人检测方法的流程框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,本专利技术实施例中,一种城市行人检测方法,包括以下步骤:S1、通过安装于城市道路旁的摄像头采集行人图像,并将采集的图像上传,通过图像特征获取模块接收原始图像;S2、将接收的原始图像通过图像处理模块进行处理,并提取其中的局部特征,进行放大,其中,所述图像特征图(或者叫地标图)是指利用参数化特征(如点和线)的全局位置来表示环境;S3、特征图扩展:通过图像幂率规则和图像特征金字塔规则计算图像临近规模对应的特征图,此处扩展的图片规模和扩展次数不设限;S4、将所述整体特征图像和所述局部特征放大图像依次连接,并将整体特征图像和所述局部特征放大图像输送到特征数据库模块进行比对;S5、分类网络训练:利用多种尺度行人在不同特征图中的的分布训练深度神经网络;S6、行人检测标注:将得到的两种规模特征图的候选窗口数目按比例汇总,经过S5中训练好的分类器分类,经过非极大值抑制后框出行人;S7、检测结果显示。所述S2中将接收的图像进行提取放大的步骤为:从整体特征图像中,扫面选取行人的明显特征,并通过放大,清晰的处理,将局部特征显现处理,并进行保存。所述S3中对特征图扩展的步骤为:通过图像幂率规则和图像特征金字塔规则计算图像I1临近规模对应的特征图,一般利用fm=Cp(S(I1,M)),式中I1代表原图像,M代表缩放规模,S代表将原图缩放,Cp代表卷积池化操作计算特征,现在为减少卷积运算提高运行速度,利用公式:其中:参数m表示当前规模,m`表示缩放后的规模,S代表将特征图缩放m`/m倍,f表示特征,常系数α可以在训练集上通过实验测得,以上公式表明原图Im通过卷积池化操作得到特征,临近缩放规模图像特征由已知特征图近似计算得到,如1/2*I1可以计算得到f1/2,因为图像上采样本文档来自技高网...

【技术保护点】
1.一种城市行人检测方法,其特征在于,包括以下步骤:S1、通过安装于城市道路旁的摄像头采集行人图像,并将采集的图像上传,通过图像特征获取模块接收原始图像;S2、将接收的原始图像通过图像处理模块进行处理,并提取其中的局部特征,进行放大,其中,所述图像特征图(或者叫地标图)是指利用参数化特征(如点和线)的全局位置来表示环境;S3、特征图扩展:通过图像幂率规则和图像特征金字塔规则计算图像临近规模对应的特征图;S4、将所述整体特征图像和所述局部特征放大图像依次连接,并将整体特征图像和所述局部特征放大图像输送到特征数据库模块进行比对;S5、分类网络训练:利用多种尺度行人在不同特征图中的的分布训练深度神经网络;S6、行人检测标注:将得到的两种规模特征图的候选窗口数目按比例汇总,经过S5中训练好的分类器分类,经过非极大值抑制后框出行人;S7、检测结果显示。

【技术特征摘要】
1.一种城市行人检测方法,其特征在于,包括以下步骤:S1、通过安装于城市道路旁的摄像头采集行人图像,并将采集的图像上传,通过图像特征获取模块接收原始图像;S2、将接收的原始图像通过图像处理模块进行处理,并提取其中的局部特征,进行放大,其中,所述图像特征图(或者叫地标图)是指利用参数化特征(如点和线)的全局位置来表示环境;S3、特征图扩展:通过图像幂率规则和图像特征金字塔规则计算图像临近规模对应的特征图;S4、将所述整体特征图像和所述局部特征放大图像依次连接,并将整体特征图像和所述局部特征放大图像输送到特征数据库模块进行比对;S5、分类网络训练:利用多种尺度行人在不同特征图中的的分布训练深度神经网络;S6、行人检测标注:将得到的两种规模特征图的候选窗口数目按比例汇总,经过S5中训练好的分类器分类,经过非极大值抑制后框出行人;S7、检测结果显示。2.根据权利要求1所述的一种城市行人检测方法,其特征在于,所述S2中将接收的图像进行提取放大的步骤为:从整体特征图像中,扫面选取行人的明显特征,并通过放大,清晰的处理,将局部特征显现处理,并进行保存。3.根据权利要求1所述的一种城市行人检测方法,其特征在于,所述S3中扩展的图片规模和扩展次数不设限。4.根据权利要求1所述的一种城市行人检测方法,其特征在于,所述S3中对特征图扩展的步骤为:通过图像幂率规则和图像特征金字塔规则计算图像I1临近规模对应的特征图,一般利用fm=Cp(S(I1,M)),式中I1代表原图像,M代表缩放规模,S代表将原图缩放,Cp代表卷积池化操作计算特征,现在为减少卷积运算提高运行速度,利用公式:其中:参数m表示当前规模,m′表示缩放后的规模,S代表将特征图缩放m′/m倍,f表示特征,常系数α可以在训练集上通过实验测得,以上公式表明原图Im通过卷积池化操作得到特征...

【专利技术属性】
技术研发人员:杨军
申请(专利权)人:广州烽火众智数字技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1