【技术实现步骤摘要】
基于一步法的高精度行人检测方法、系统、装置
本专利技术属于图像处理与模式识别
,具体涉及了一种基于一步法的高精度行人检测方法、系统、装置。
技术介绍
行人检测是一种利用计算机视觉技术对图像或视频序列中出现的所有行人使用矩形框进行精准定位的技术,在基于行人的计算机视觉、模式识别等领域有着极为广泛的应用,例如自动驾驶,视频监控和生物特征识别等。并且对于大部分与行人相关的应用,都首先要求对行人进行精确的检测。在实际应用场景中,行人的高效检测问题是目前行人检测算法所面临的最大挑战之一。现有的高精度行人检测算法都是基于二步法检测器FasterR-CNN进行扩展得到的,这类方法虽然拥有较高的检测精度,但算法效率较差,无法满足实际应用的实时性需求。另一方面,一步法检测器如SSD虽然拥有较好的实时性,但单阶段的回归方式无法很好地解决因背景信息复杂而带来的错检、漏检问题,特别是对于存在大量遮挡情况的行人应用场景,检测算法的检测精度更是差强人意。因此针对复杂场景下的行人检测问题,设计出高效且精确的行人检测算法仍是一个核心研究难点,有着极为广泛的研究意义和实用价值。针对该问题,尽管有着一系列研究工作致力于提升行人检测算法在复杂场景下的检测精度,但这些工作的核心重点都是在于提升遮挡场景下的行人检测精度,且模型架构仍然是基于二步法FasterR-CNN,依然没有从本质上解决行人检测算法效率低下的问题。设计出高精度的实时行人检测算法以满足实际的行人应用需求,仍需要更多的探索和研究。总的来说,行人检测方法中基于二步法检测器的检测方法 ...
【技术保护点】
1.一种基于一步法的高精度行人检测方法,其特征在于,该高精度行人检测方法包括:/n步骤A10,通过训练好的行人检测模型对获取的待检测行人图像进行前传计算,获取带行人标注框的图像;/n步骤A20,基于所述带行人标注框的图像,通过基于余弦的非极大值抑制方法滤除重复的冗余行人标注框,获得行人检测标注图像;/n其中,所述行人检测模型基于一步法ALFNet构建,并通过基于软标签的样本训练后进行模型测试,其方法为:/n步骤S10,基于一步法ALFNet构建行人检测模型,定义所述行人检测模型中锚点框尺寸并关联网络层、定义所述行人检测模型中窗口回归目标以及定义所述行人检测模型中锚点框匹配方法;/n步骤S20,依次基于获取的训练样本集合中每一个样本,对所述行人检测模型训练直至模型收敛或达到预设训练次数,获得训练好的行人检测模型。/n
【技术特征摘要】
1.一种基于一步法的高精度行人检测方法,其特征在于,该高精度行人检测方法包括:
步骤A10,通过训练好的行人检测模型对获取的待检测行人图像进行前传计算,获取带行人标注框的图像;
步骤A20,基于所述带行人标注框的图像,通过基于余弦的非极大值抑制方法滤除重复的冗余行人标注框,获得行人检测标注图像;
其中,所述行人检测模型基于一步法ALFNet构建,并通过基于软标签的样本训练后进行模型测试,其方法为:
步骤S10,基于一步法ALFNet构建行人检测模型,定义所述行人检测模型中锚点框尺寸并关联网络层、定义所述行人检测模型中窗口回归目标以及定义所述行人检测模型中锚点框匹配方法;
步骤S20,依次基于获取的训练样本集合中每一个样本,对所述行人检测模型训练直至模型收敛或达到预设训练次数,获得训练好的行人检测模型。
2.根据权利要求1所述的基于一步法的高精度行人检测方法,其特征在于,步骤S10中“定义所述行人检测模型中锚点框尺寸并关联网络层”,其方法为:
定义四个锚点框,并分别将所述锚点框依次与所述行人检测模型的conv4_3层、conv5_3层、conv6_3层、conv7_3特征层关联。
3.根据权利要求2所述的基于一步法的高精度行人检测方法,其特征在于,所述四个锚点框,其尺度分别为:
(16,24)、(32,48)、(64,96)、(128,192)。
4.根据权利要求1所述的基于一步法的高精度行人检测方法,其特征在于,所述行人检测模型中窗口回归目标为集中式IoU回归损失函数;
所述集中式IoU回归损失函数为:
其中,Bgt和Bpred分别为标注和预测的检测窗口,窗口C表示同时包围Bgt和Bpred的最小矩形框,|C\(Bgt∩Bpred)|表示窗口C中去除Bgt和Bpred交集的部分,ti和分别为参数化后的标注和预测窗口的中心点坐标,smoothL1为平滑之后的L1(x)范数。
5.根据权利要求4所述的基于一步法的高精度行人检测方法,其特征在于,所述smoothL1函数为:
其中,σ∈[0,1),为用于调整所述集中式IoU回归损失函数关于边界的敏感性的平滑因子。
6.根据权利要求1所述的基于一步法的高精度行人检测方法,其特征在于,步骤S10中“定义所述行人检测模型中锚点框匹配方法”,其方法为:
对于所述待检测行人图像,获取完整行人矩形标注框、行人可见区域矩形标注框,以所述行人可见区域标注框面积与完整行人矩形标注框面积之比作为行人可见度,并执行:
行人可见度低于0.5时,以其对应的行人可见区域矩形标注框进行锚点框的匹配...
【专利技术属性】
技术研发人员:雷震,庄楚斌,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。