一种密集人群检测方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:34372067 阅读:96 留言:0更新日期:2022-07-31 11:39
本公开提供了一种密集人群检测方法、装置、电子设备以及存储介质,所述方法包括:获取带有密集人群的待检测图像;将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。这样,可以针对密集场所的人群的人数进行精准的检测。数进行精准的检测。数进行精准的检测。

A dense crowd detection method, device, electronic equipment and storage medium

The disclosure provides a dense crowd detection method, device, electronic device and storage medium. The method includes: acquiring an image to be detected with a dense crowd; Inputting the image to be detected into the trained target pedestrian detection model to obtain the image to be detected marked with a plurality of first predicted pedestrian frames; For at least two first predicted pedestrian frames corresponding to any region in the image to be detected, the pedestrians in the at least two first predicted pedestrian frames are de duplicated to obtain the image to be detected marked with at least one second predicted pedestrian frame; Count the target number of the second predicted pedestrian frame in the image to be detected, and determine the target number as the number of pedestrians in the image to be detected. In this way, the number of people in dense places can be accurately detected. Count for accurate detection. Count for accurate detection< br/>

【技术实现步骤摘要】
一种密集人群检测方法、装置、电子设备以及存储介质


[0001]本公开涉及目标检测
,具体而言,涉及一种密集人群检测方法、装置、电子设备以及存储介质。

技术介绍

[0002]目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。尤其是在对目标进行动态实时跟踪定位在智能化交通系统、智能监控系统、军事目标检测等方面具有广泛的应用价值。
[0003]通常,在对某个场所的人群进行目标检测时,主要是采用区域卷积神经网络(Region

Convolutional Neural Networks,R

CNN)来进行目标检测,针对人员较少或人员较分散的场景可以得到很好的识别结果,然而,当在进行密集场所的人员检测时,针对存在全景图像中目标较小、稠密人群、物体遮挡等情况时,很难从重叠的人物中识别出单个的目标人物,导致识别的准确率不高。

技术实现思路

[0004]本公开实施例至少提供一种密集人群检测方法、装置、电子设备以及存储介质。这样,可以针对密集场所的人群的人数进行精准的检测。
[0005]本公开实施例提供了一种密集人群检测方法,所述方法包括:
[0006]获取带有密集人群的待检测图像;
[0007]将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;其中,所述多个第一预测行人框中存在至少一个目标预测行人框;所述目标预测行人框为包含至少两个相互重叠行人的第一预测行人框;
[0008]针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;
[0009]统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。
[0010]一种可选的实施方式中,根据以下步骤生成训练好的所述目标行人检测模型:
[0011]获取多个第一样本图像;其中,所述多个第一样本图像中存在至少一个第一样本图像是由至少两个第二样本图像进行合成得到的,用于合成任一所述第一样本图像的第二样本图像中的行人数量小于该第一样本图像的行人数量;
[0012]基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
[0013]一种可选的实施方式中,根据以下步骤利用至少两个第二样本图像进行合成得到
一个第一样本图像:
[0014]获取多个第二样本图像;
[0015]从所述多个第二样本图像中选取至少两个第二样本图像,将所述两个第二样本图像中的任一第二样本图像中行人进行截取;
[0016]将截取到的行人合成到该两个第二样本图像中的另一个第二样本图像中,合成得到一个第一样本图像。
[0017]一种可选的实施方式中,利用两个第二样本图像进行合成得到一个第一样本图像的计算公式为:
[0018]I
output
=I
foreground
*I
mask
+(1

I
mask
)*I
background
[0019]其中,I
output
是第一样本图像,I
foreground
是两个第二样本图像中的任一第二样本图像,I
mask
是掩膜图像,I
background
是该两个第二样本图像中的另一第二样本图像。
[0020]一种可选的实施方式中,所述对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像,包括:
[0021]针对至少两个第一预测行人框中每个第一预测框进行目标行人检测,得到每个第一预测行人框中目标行人的特征信息;
[0022]基于检测出的至少两个第一预测行人框中的各个第一预测行人框中目标行人的特征信息,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像。
[0023]一种可选的实施方式中,所述基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型,包括:
[0024]针对任一第一样本图像,将所述第一样本图像输入所述初始行人检测模型中,得到预测行人标签;
[0025]基于各个所述第一样本图像对应的所述真实行人标签和所述预测行人标签,确定所述初始行人模型的各个交叉熵损失值;
[0026]当所述初始行人模型的任一交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。
[0027]一种可选的实施方式中,确定所述初始行人模型预测行人标签的公式为:
[0028]Y(p
i
)={y
i
∈y|IoU(p
i
,y
i
)≥ε}
[0029]其中,Y(p
i
)是所有的预测行人标签的集合,y
i
是第i个目标行人的真实行人标签,y是所有目标行人的真实行人标签,p
i
是第i个目标行人的预测行人标签,IoU(p
i
,y
i
)是第i个目标行人的预测行人标签和真实行人标签的交叉熵损失值,ε是一个给定的IoU(p
i
,y
i
)阈值。
[0030]本公开实施例还提供一种密集人群检测装置,所述装置包括:
[0031]获取模块,用于获取带有密集人群的待检测图像;
[0032]得到模块,用于将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;其中,所述多个第一预测行人框中存在至少一个目标预测行人框;所述目标预测行人框为包含至少两个相互重叠行人的第一预测行人框;
[0033]去重模块,用于针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;
[0034]统计模块,用于统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。
[0035]一种可选的实施方式中,所述得到模块还包括训练模块,所述训练模块用于根据以下步骤生成训练好的所述目标行人检测模型:
[0036]获取多个第一样本图像;其中,所述多个第一样本图像中存在至少一个第一样本图像是由至少两个第二样本图像进行合成得到的,用于合成任一所述第一样本图像的第二样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种密集人群检测方法,其特征在于,所述方法包括:获取带有密集人群的待检测图像;将所述待检测图像输入到训练好的目标行人检测模型中,得到标注有多个第一预测行人框的所述待检测图像;其中,所述多个第一预测行人框中存在至少一个目标预测行人框;所述目标预测行人框为包含至少两个相互重叠行人的第一预测行人框;针对所述待检测图像中任一区域对应的至少两个第一预测行人框,对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像;统计所述待检测图像中所述第二预测行人框的目标数量,并将所述目标数量确定为所述待检测图像中行人的行人数量。2.根据权利要求1所述的方法,其特征在于,根据以下步骤生成训练好的所述目标行人检测模型:获取多个第一样本图像;其中,所述多个第一样本图像中存在至少一个第一样本图像是由至少两个第二样本图像进行合成得到的,用于合成任一所述第一样本图像的第二样本图像中的行人数量小于该第一样本图像的行人数量;基于多个第一样本图像和每个第一样本图像的真实行人标签,对初始行人检测模型进行训练,当所述初始行人检测模型的交叉熵损失值小于预设阈值时,生成训练好的所述目标行人检测模型。3.根据权利要求2所述的方法,其特征在于,根据以下步骤利用至少两个第二样本图像进行合成得到一个第一样本图像:获取多个第二样本图像;从所述多个第二样本图像中选取至少两个第二样本图像,将所述两个第二样本图像中的任一第二样本图像中行人进行截取;将截取到的行人合成到该两个第二样本图像中的另一个第二样本图像中,合成得到一个第一样本图像。4.根据权利要求2所述的方法,其特征在于,利用两个第二样本图像进行合成得到一个第一样本图像的计算公式为:I
output
=I
foreground
*I
mask
+(1

I
mask
)*I
background
其中,I
output
是第一样本图像,I
foreground
是两个第二样本图像中的任一第二样本图像,I
mask
是掩膜图像,I
background
是该两个第二样本图像中的另一第二样本图像。5.根据权利要求1所述的方法,其特征在于,所述对所述至少两个第一预测行人框中的行人进行去重处理,得到标注有至少一个第二预测行人框的所述待检测图像,包括:针对至少两个第一预测行人框中每个第一预测框进行目标行人检测,得到每个第一预测行人框中目标行人的特征信息;基于检测出的至少两个第一预测行人框中的各个第一预测行人框中目标行人的特征信息,对所述至少...

【专利技术属性】
技术研发人员:耿龙党婉丽罗谦郑怀宇王朝曹立波陈肇欣潘野文涛张涛秦倩丁新伟牛占云杜茂维黄明王大睿
申请(专利权)人:首都机场集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1