一种行人检测方法、装置、设备及可读存储介质制造方法及图纸

技术编号:32320692 阅读:19 留言:0更新日期:2022-02-16 18:26
本申请公开了一种行人检测方法、装置、设备及可读存储介质。本申请可预先设置行人检测模型。获取待检测图像后进行尺寸转换,得到符合网络输入尺寸的目标图像。在得到目标图像后,可将目标图像输入预设的行人检测模型,得到包含多个行人检测框的目标图像。在得到检测结果后,可去除同一个行人中重复的行人检测框,最后可得到只包含一个行人对应一个检测框的目标图像。由于目标图像的尺寸比所述待检测图像的尺寸小,因此,可缩小行人检测的计算时间,提高检测的速度;且所述目标图像的长度和宽度可被2的整数次幂整除,便于行人检测模型对所述目标图像进行处理;所述目标图像的长宽比与所述待检测图像的长宽比最接近,可提高行人检测的准确度。人检测的准确度。人检测的准确度。

【技术实现步骤摘要】
一种行人检测方法、装置、设备及可读存储介质


[0001]本申请涉及图像处理
,更具体地说,涉及一种行人检测方法、装置、设备及可读存储介质。

技术介绍

[0002]检测网络能够定位多种场景下行人位置,常用的深度学习检测方法,先基于检测模块检测图片中前背景信息,然后再用回归行人的坐标信息,由于需要二个阶段处理,对应的处理时间比较长,导致识别速度变慢。
[0003]因此,亟需提供一种可以快速检测待检测图像中的行人的方法,用于解决行人检测耗时的问题。

技术实现思路

[0004]有鉴于此,本申请提供了一种行人检测方法、装置、设备及可读存储介质,用于解决行人检测耗时的问题。
[0005]一种行人检测的方法,包括:
[0006]获取待检测图像;
[0007]对所述待检测图像进行尺寸转换,得到符合网络输入尺寸的目标图像;其中,所述目标图像的尺寸比待检测图像的尺寸小,所述目标图像的长和宽均可被2的整数次幂整除,且所述目标图像的长宽比与所述待检测图像的长宽比最接近;
[0008]将所述目标图像输入预设的行人检测模型,得到包含多个行人检测框的目标图像,其中,所述行人检测模型以标注有行人检测框的训练图像为训练数据,训练得到;
[0009]基于所述包含多个行人检测框的目标图像,使用NMS算法去除同一个行人中重复的行人检测框,得到只包含一个行人对应一个检测框的目标图像。
[0010]优选地,对所述待检测图像进行尺寸转换,得到符合网络输入尺寸的目标图像,包括:
[0011]基于所述待检测图像的长和宽,依次减去2的整数次幂的整数倍,得到多个长度和多个宽度;
[0012]基于所得到的多个长度和宽度进行完全排列组合,得到多个候选尺寸;
[0013]计算各个候选尺寸的长度和宽度的比值,得到各个候选尺寸的长宽比;
[0014]从多个候选尺寸中选取与所述待检测图像的长宽比最接近的目标尺寸;
[0015]将待检测图像按照所述目标尺寸进行尺寸转换,得到符合网络输入尺寸的目标图像。
[0016]优选地,所述行人检测模型包括第一卷积层、第二卷积层、中间处理层、yolo输出层;
[0017]所述将所述目标图像输入预设的行人检测模型,得到包含多个行人检测框的目标图像,包括:
[0018]将所述目标图像输入所述第一卷积层进行卷积处理,得到第一目标图像;
[0019]将所述第一目标图像输入所述第二卷积层进行卷积处理,得到第二目标图像;
[0020]将所述第二目标图像输入所述中间处理层进行卷积处理和池化处理,得到第三目标图像;
[0021]将所述第三目标图像输入所述yolo输出层,得到包含多个行人检测框的目标图像。
[0022]优选地,所述第一卷积层和第二卷积层的步长为2,pad为一。
[0023]优选地,所述yolo输出层,包括:
[0024]一个yolo层,所述一个yolo层对应有6个锚框anchor。
[0025]优选地,所述待检测图像的尺寸为1920*1080,所述目标图像的尺寸为 448*256。
[0026]一种行人检测装置,包括:
[0027]图像获取单元,用于获取待检测图像;
[0028]转换单元,用于对所述待检测图像进行尺寸转换,得到符合网络输入尺寸的目标图像;其中,所述目标图像的尺寸比待检测图像的尺寸小,所述目标图像的长和宽均可被2的整数次幂整除,且所述目标图像的长宽比与所述待检测图像的长宽比最接近;
[0029]检测单元,用于将所述目标图像输入预设的行人检测模型,得到包含多个行人检测框的目标图像,其中,所述行人检测模型以标注有行人检测框的训练图像为训练数据,训练得到;
[0030]去重单元,用于基于所述包含多个行人检测框的目标图像,使用NMS 算法去除同一个行人中重复的行人检测框,得到只包含一个行人对应一个检测框的目标图像。
[0031]优选地,所述转换单元,包括:
[0032]第一计算单元,用于基于所述待检测图像的长和宽,依次减去2的整数次幂的整数倍,得到多个长度和多个宽度;
[0033]第二计算单元,用于基于所得到的多个长度和宽度进行完全排列组合,得到多个候选尺寸;
[0034]第三计算单元,用于计算各个候选尺寸的长度和宽度的比值,得到各个候选尺寸的长宽比;
[0035]目标尺寸确定单元,用于从多个候选尺寸中选取与所述待检测图像的长宽比最接近的目标尺寸;
[0036]目标图像获取单元,用于将待检测图像按照所述目标尺寸进行尺寸转换,得到符合网络输入尺寸的目标图像。
[0037]一种行人检测设备,包括存储器和处理器;
[0038]所述存储器,用于存储程序;
[0039]所述处理器,用于执行所述程序,实现如前述介绍的行人检测方法的各个步骤。
[0040]一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前述介绍的行人检测方法的各个步骤。
[0041]从上述技术方案可以看出,本申请的行人检测方法,可以预先设置一个行人检测模型,其中,所述行人检测模型以标注有行人检测框的训练图像为训练数据,训练得到。在训练好行人检测模型后,可以获取待检测图像,对所述待检测图像进行尺寸转换,得到符合
网络输入尺寸的目标图像;其中,所述目标图像的尺寸比待检测图像的尺寸小,所述目标图像的长和宽均可被2的整数次幂整除,且所述目标图像的长宽比与所述待检测图像的长宽比最接近;在得到所述目标图像后,可以将所述目标图像输入预设的行人检测模型,得到包含多个行人检测框的目标图像;在得到所述行人检测模型输出的包含多个行人检测框的目标图像后,可以使用NMS算法去除所述包含多个行人检测框的目标图像中同一个行人中重复的行人检测框,得到只包含一个行人对应一个检测框的目标图像。
[0042]本申请可以将待检测图像经过尺寸转换后得到符合网络输入尺寸的目标图像,进一步地,将经过尺寸转换得到的目标图像输入预设的行人检测模型中进行行人检测。经过尺寸变化后的目标图像尺寸比所述待检测图像的尺寸小,由此,可以缩小行人检测模型的计算时间,提高检测的速度;且所述目标图像的长度和宽度可被2的整数次幂整除,便于行人检测模型对所述目标图像进行处理;进一步地,所述目标图像的长宽比与所述待检测图像的长宽比最接近,可以提高行人检测的准确度。
附图说明
[0043]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0044]图1为本申请实施例提供的实现行人检测方法的流程图;
[0045]图2为本申请实施例示例的一种行人检测装置结构示意图;
[0046]图3为本申请实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行人检测的方法,其特征在于,包括:获取待检测图像;对所述待检测图像进行尺寸转换,得到符合网络输入尺寸的目标图像;其中,所述目标图像的尺寸比待检测图像的尺寸小,所述目标图像的长和宽均可被2的整数次幂整除,且所述目标图像的长宽比与所述待检测图像的长宽比最接近;将所述目标图像输入预设的行人检测模型,得到包含多个行人检测框的目标图像,其中,所述行人检测模型以标注有行人检测框的训练图像为训练数据,训练得到;基于所述包含多个行人检测框的目标图像,使用NMS算法去除同一个行人中重复的行人检测框,得到只包含一个行人对应一个检测框的目标图像。2.根据权利要求1所述的行人检测方法,其特征在于,对所述待检测图像进行尺寸转换,得到符合网络输入尺寸的目标图像,包括:基于所述待检测图像的长和宽,依次减去2的整数次幂的整数倍,得到多个长度和多个宽度;基于所得到的多个长度和宽度进行完全排列组合,得到多个候选尺寸;计算各个候选尺寸的长度和宽度的比值,得到各个候选尺寸的长宽比;从多个候选尺寸中选取与所述待检测图像的长宽比最接近的目标尺寸;将待检测图像按照所述目标尺寸进行尺寸转换,得到符合网络输入尺寸的目标图像。3.根据权利要求1所述的行人检测方法,其特征在于,所述行人检测模型包括第一卷积层、第二卷积层、中间处理层、yolo输出层;所述将所述目标图像输入预设的行人检测模型,得到包含多个行人检测框的目标图像,包括:将所述目标图像输入所述第一卷积层进行卷积处理,得到第一目标图像;将所述第一目标图像输入所述第二卷积层进行卷积处理,得到第二目标图像;将所述第二目标图像输入所述中间处理层进行卷积处理和池化处理,得到第三目标图像;将所述第三目标图像输入所述yolo输出层,得到包含多个行人检测框的目标图像。4.根据权利要求3所述的行人检测方法,其特征在于,所述第一卷积层和第二卷积层的步长为2,pad为一。5.根据权利要求3所述的行人检测方法,其特征在于,所述yolo输出层,包括:一个yolo层,所述一个...

【专利技术属性】
技术研发人员:周庆标王忠古川南
申请(专利权)人:熵基科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1