行人检测方法、装置、设备、存储介质及产品制造方法及图纸

技术编号：43877436 阅读：13 留言：0更新日期：2024-12-31 19:00

本申请提供一种行人检测方法、装置、设备、存储介质及产品。该方法包括：获取用于行人检测的预设神经网络模型以及待检测图像，所述预设神经网络模型包括骨干网络、颈部网络和头部网络，所述骨干网络包括可变核卷积；将所述待检测图像输入至所述骨干网络，通过所述可变核卷积以及其他模块对所述待检测图像进行特征提取，得到图像特征信息；通过所述预设神经网络模型中的颈部网络和头部网络基于所述图像特征信息对所述待检测图像进行行人检测，得到行人检测结果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种行人检测方法、装置、设备、存储介质及产品。

技术介绍

1、随着科技的发展，自动驾驶技术逐渐开始进行实际的应用。在自动驾驶技术中，对行人进行检测的响应速度与准确度至关重要，直接关乎道路安全和对应的自动驾驶技术的可靠性和安全性，直接决定了自动驾驶技术能否使用，因此行人检测是自动驾驶系统中的一个关键部分。

2、现有的自动驾驶技术中，通常是通过图像识别来进行行人检测。在进行图像识别的过程中，一般会使用卷积神经网络，而现有技术中卷积神经网络中的卷积操作中卷积核的通常是固定的。然而行人作为一个非固定形状，且会进行不规律移动的目标，目前的卷积核只能捕获局部信息，而无法获取更大范围或者不同位置的信息，这限制了卷积神经网络对行人可能存在的不同形状的适应性，导致行人检测的准确性较低。

技术实现思路

1、本申请实施例提供一种行人检测方法、装置、设备、存储介质及产品，能够提高行人检测的准确性。

2、第一方面，本申请提供一种行人检测方法，包括：

3、获取用于行人检测的预设神经网络模型以及待检测图像，所述预设神经网络模型包括骨干网络、颈部网络和头部网络，所述骨干网络包括可变核卷积；

4、将所述待检测图像输入至所述骨干网络，通过所述骨干网络对所述待检测图像进行特征提取，得到图像的特征信息，其中，骨干网络中使用了可变核卷积；

5、通过所述预设神经网络模型中的颈部网络和头部网络基于所述图像特征信息对所述待检测图像进行行人检测，得到行人检测结果。

6、在一些可能的实现方式中，所述通过所述预设神经网络模型中的颈部网络和头部网络基于所述图像特征信息对所述待检测图像进行行人检测，得到行人检测结果，包括：

7、通过所述颈部网络对所述图像特征信息进行部分卷积和特征融合，得到特征融合后的图像特征信息；

8、通过所述头部网络基于所述特征融合后的图像特征信息对所述待检测图像进行行人检测，得到行人检测结果。

9、在一些可能的实现方式中，所述通过所述颈部网络对所述图像特征信息进行部分卷积和特征融合，得到特征融合后的图像特征信息，包括：

10、根据预设掩码确定所述图像特征信息中的目标数据点；

11、通过所述颈部网络对所述目标数据点进行逐点卷积，得到第一卷积结果；

12、对所述第一卷积结果进行部分卷积和特征融合，得到特征融合后的图像特征信息。

13、在一些可能的实现方式中，在所述获取用于行人检测的预设神经网络模型以及待检测图像之前，所述方法还包括：

14、获取训练样本集；所述训练样本集包括多个训练样本，每个所述训练样本包括样本图像和所述样本图像对应的标注文件，所述标注文件中包括所述样本图像中的行人标识框标签；

15、对每个训练样本，分别执行以下步骤：

16、将所述样本图像输入至预设神经网络模型中，确定对所述样本图像中行人位置进行预测的预测检测结果，所述预测检测结果包括行人预测标识框；

17、根据各个所述训练样本的所述行人预测标识框与对应的行人标识框标签，确定所述预设神经网络模型的损失函数值；

18、在所述预设神经网络模型的损失函数值不满足预设训练停止条件的情况下，调整所述预设神经网络模型的模型参数，返回将所述样本图像输入至预设神经网络模型中，确定对所述样本图像中行人位置进行预测的预测检测结果的步骤；

19、在所述预设神经网络模型的损失函数值满足预设训练停止条件的情况下，停止训练，得到训练后的预设神经网络模型。

20、在一些可能的实现方式中，所述根据各个所述训练样本的所述行人预测标识框与对应的行人标识框标签，确定所述预设神经网络模型的损失函数值，包括：

21、根据所述行人预测标识框与行人标识框标签的位置关系，计算所述行人预测标识框与行人标识框标签的重叠区域的面积，得到第一面积；

22、将所述行人预测标识框与行人标识框标签的面积之和减去所述重叠区域的面积，得到第二面积；

23、计算所述第一面积与所述第二面积的比值，得到第一交并比；

24、基于行人预测标识框的位置与行人标识框标签的位置，确定所述行人预测标识框与所述行人标识框标签之间的位置偏移信息；

25、根据所述第一交并比和所述位置偏移信息，确定diou损失值；

26、根据预设关注因子确定所述第一交并比对应的调整幅度；

27、基于所述第一交并比、diou损失值和所述调整幅度确定所述预设神经网络模型的损失函数值。

28、在一些可能的实现方式中，预设关注度因子包括第一关注度因子与第二关注度因子，所述第一关注度因子小于所述第二关注度因子，所述根据预设关注因子确定所述第一交并比对应的调整幅度，包括：

29、在所述第一交并比小于所述第一关注因子的情况下，将所述交并比对应的调整幅度确定为第一预设值；

30、在所述第一交并比大于所述第二关注因子的情况下，将所述交并比对应的调整幅度确定为第二预设值，所述第一预设值小于第二预设值；

31、在所述第一交并比大于所述第一关注因子的情况下且小于所述第二关注因子的情况下，根据所述第一关注因子与所述第二关注因子的差值与所述第一交并比，确定所述第一交并比对应的调整幅度。

32、在一些可能的实现方式中，所述根据所述第一交并比和所述位置偏移信息，确定损失值，包括：

33、通过以下公式确定损失值：

34、

35、其中，ldiou表示损失值，iou表示第一交并比，d为预测标识框的基准点与标识框标签的基准点之间的距离，c为预测框与真实框最小外接矩形对角线的距离，表示位置偏移信息。

36、在一些可能的实现方式中，所述获取训练样本集，包括：

37、获取初始样本图像和所述初始样本图像对应的标注文件；

38、对所述初始样本图像进行数据扩充，得到所述初始样本图像对应的多个衍生样本图像；

39、分别基于所述初始样本图像与对应的标注文件，以及所述衍生图像与对应的标注文件构建样本；

40、根据所述训练样本，构建训练样本集。

41、在一些可能的实现方式中，所述对所述初始样本图像进行数据扩充，包括：对所述初始样本图像进行翻转、对所述初始样本图像进行颜色空间变换和向所述初始样本图像添加噪声中的至少一项。

42、在一些可能的实现方式中，在所述获取用于行人检测的预设神经网络模型以及待检测图像之后，所述方法还包括：

43、对所述待检测图像进行降噪，并增强所述待检测图像的对比度；

44、计算所述待检测图像的长宽比与目标长宽比的比值，得到缩放比例；

45、按照所述缩放比例对所述待检测图像进行缩放；

46、所述将所述待检测图像输入至所述预设神经网络模型，通过所述骨干网络对所本文档来自技高网...

【技术保护点】

1.一种行人检测方法，其特征在于，包括：

2.根据权利要求1所述的行人检测方法，其特征在于，所述通过所述预设神经网络模型中的颈部网络和头部网络基于所述图像特征信息对所述待检测图像进行行人检测，得到行人检测结果，包括：

3.根据权利要求2所述的行人检测方法，其特征在于，所述通过所述颈部网络对所述图像特征信息进行部分卷积和特征融合，得到特征融合后的图像特征信息，包括：

4.根据权利要求1所述的行人检测方法，其特征在于，在所述获取用于行人检测的预设神经网络模型以及待检测图像之前，所述方法还包括：

5.根据权利要求4所述的行人检测方法，其特征在于，所述根据各个所述训练样本的所述行人预测标识框与对应的行人标识框标签，确定所述预设神经网络模型的损失函数值，包括：

6.根据权利要求5所述的行人检测方法，其特征在于，预设关注度因子包括第一关注度因子与第二关注度因子，所述第一关注度因子小于所述第二关注度因子，所述根据预设关注因子确定所述第一交并比对应的调整幅度，包括：

7.根据权利要求5所述的行人检测方法，其特征在于，所述根据

8.一种行人检测装置，其特征在于，所述装置包括：

9.一种行人检测设备，其特征在于，所述设备包括：处理器，以及存储有计算机程序指令的存储器；所述处理器读取并执行所述计算机程序指令，以实现如权利要求1-7任意一项所述的行人检测方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的行人检测方法。

11.一种计算机程序产品，其特征在于，所述计算机程序产品中的指令由电子设备的处理器执行时，使得所述电子设备执行如权利要求1-7任意一项所述的行人检测方法。

...

【技术特征摘要】

1.一种行人检测方法，其特征在于，包括：

4.根据权利要求1所述的行人检测方法，其特征在于，在所述获取用于行人检测的预设神经网络模型以及待检测图像之前，所述方法还包括：

6.根据权利要求5所述的行人检测方法，其特征在于，预设关注度因子包括第一关注度因子与第二关注度因子，所述第...

【专利技术属性】
技术研发人员：王思思，
申请(专利权)人：沈阳中科创达软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人