System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种抗遮挡重叠与尺度变化的行人检测方法及装置制造方法及图纸_技高网

一种抗遮挡重叠与尺度变化的行人检测方法及装置制造方法及图纸

技术编号:43514233 阅读:2 留言:0更新日期:2024-11-29 17:16
本发明专利技术涉及计算机视觉技术领域,具体提供一种抗遮挡重叠与尺度变化的行人检测方法及装置,在特征提取环节构建融合注意力机制的循环多尺度特征提取网络,用于提升获取图像特征信息的能力与特征信息的表达能力,提升行人检测器对多尺度行人目标的检测灵敏度;在模型的核心部分设计头部和整体双检测分支进行联合检测,利用头部检测辅助行人检测提升对密集遮挡行人目标的检测能力。在模型后处理环节为行人整体检测框构建抑制判别机制,并构建行人头身匹配策略来对行人头部检测框与整体检测框进行匹配绑定,对于未能匹配成功的头部检测框进行二次匹配校验,用于恢复被错误抑制的整体检测框并剔除误检出的头部检测框,进一步提升行人目标的检测精度。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,具体提供一种抗遮挡重叠与尺度变化的行人检测方法及装置


技术介绍

1、在计算机视觉领域中,行人检测技术是应用广泛的热门研究方向之一。行人检测任务主要指通过计算机视觉相关技术将图像、视频和视频流数据中的行人目标实例精准地检测出来并对其进行定位,该任务本质上是一个分类和回归的过程。在实际生活中,行人检测在自动驾驶、智能监控、智能机器人以及人机交互等领域发挥着重要的作用并具有较高的应用价值。其中,在自动驾驶领域和辅助安全驾驶领域,利用行人检测技术可以实时检测车辆前方是否有行人突然闯入,从而根据实际情况及时做出调整,以此来确保行人安全和行车安全。特别是在拥堵路段和人群密集场景,行人检测技术对自动驾驶安全的辅助作用更加明显。在智能监控领域,现今多数公共场所都会利用摄像头来对整个场景进行监控并且实时统计人群流量数据。特别是在疫情期间,多数大型公共场所都会严格控制行人流量密度,利用行人检测技术可以实时准确地统计场所中的行人流量,并且通过对这些数据进行分析和预测,进而有助于管理者采取相应调整措施。在智能机器人领域,摄像机等传感器为智能机器人传入对应的环境场景信号,行人检测算法作为智能机器人大脑中的重要思维感知网络,可以帮助智能机器人快速准确地感知到行人目标并及时做出相应的决策来进行调整。在人机交互领域,校园和餐饮店中的智能送餐车、智能快递投递车等设备中均融合了行人检测算法等多种功能,并且通过与行人之间进行交互的方式达到利用人工智能技术更好地为人们日常生活服务的目的。

2、基于深度学习的行人检测算法按照检测思路可划分为单阶段行人检测算法和两阶段行人检测算法。其中,单阶段行人检测算法主要以yolo系列网络模型为代表,两阶段行人检测算法则以rcnn系列网络模型为代表。然而,这两类算法均缺乏对特定检测场景的研究与设计,对于较远视角处的小尺度行人目标和遮挡重叠严重的行人目标的检测能力较弱,主要表现在检测精度较低和漏检率较高。因此,设计一种抗遮挡重叠与尺度变化的行人检测方法是非常必要的。

3、针对上述需求,目前,国内外也有很多相关的解决方案。

4、中国专利公布号cn111767882a,公布日2020年10月13日中提出一种基于改进yolo模型的多模态行人检测方法。通过融合cbam注意力机制并对损失函数进行优化,以此来提升行人检测效果。但也存在一些问题如:(1)在特征提取环节对于多尺度行人目标的灵敏度不够高,尤其是对较远视角处的小尺度行人的特征信息学习能力较弱;(2)对于遮挡重叠严重的行人目标的漏检现象仍有一定改进的空间。中国专利申请公布号cn115082855a,公布日2022年09月20日的基于改进yolox 算法的行人遮挡检测方法和公布号cn111767882a,公布号2020年10月13日的一种基于改进yolo模型的多模态行人检测方法类似,也同样存在相同的问题。中国专利公布号cn113989939a,公布日2022年01月28日中提出一种检测小尺度行人目标的方法,但实际检测场景中难免存在行人密集拥挤现象,因而该方法对于遮挡行人目标的检测能力较弱,在实际应用时存在一定的局限性。中国专利申请公布号cn114882527a,公布日2022年08月09日中提出一种基于动态分组卷积的行人检测算法及系统,主要利用分组卷积实现行人检测,但缺乏对行人检测特定场景的考虑,在复杂人群密集场景下的执行效率存在一定的局限性。

5、对于现有行人检测技术而言,更多的方案还是依托经典的目标检测算法来检测场景中的行人目标,依据检测思路可分为以yolo系列网络模型为代表的单阶段检测算法和以faster rcnn网络模型为代表的两阶段检测算法。然而经典的目标检测算法大多缺乏对于检测场景的特定考虑,尤其是复杂人群密集场景下,这些主流检测算法的鲁棒性受到了影响,主要包括以下两点:

6、(1)行人目标尺度不一导致检测器的综合性能受到影响。由于当前行人检测数据集大多数是基于摄像头拍摄并进行标定处理得到的,而摄像头在拍摄时存在“近大远小”的规律,较近视角处的行人目标整体尺度较大,较远视角处的行人目标整体尺度较小。由于小尺度行人目标的分辨率相对较低,因此算法在进行特征提取的过程中容易出现学习到的特征信息有限或者特征表达能力较弱的问题,难以对不同尺度的行人目标均具备较高的灵敏度,进而容易引起漏检或者误检现象。

7、(2)行人目标受遮挡严重导致检测器的综合性能受到影响。在复杂人群密集场景下的行人检测任务中,行人目标往往受到一定的遮挡现象。通过对行人检测数据集中的图像进行分析可知,行人遮挡问题主要包括两种情况:类内遮挡和类间遮挡。其中,类内遮挡是指行人目标之间相互遮挡。类间遮挡是指行人受背景信息干扰,背景信息主要包括建筑物、树木、车辆、行人自身携带的物品和附近其他行人携带的物品等。类内遮挡和类间遮挡导致了行人全身可见区域部分所占比例降低,会对算法的特征提取环节造成困难,并且算法检测模块推理所需的信息也随之减少,此外还会影响行人目标定位的准确性,从而影响行人检测算法的综合性能。


技术实现思路

1、本专利技术为解决上述问题,提供了一种抗遮挡重叠与尺度变化的行人检测方法及装置,可以提升对较远视角处小尺度行人目标与遮挡严重行人目标的检测精度,并降低其漏检率。

2、第一方面,本专利技术提供的一种抗遮挡重叠与尺度变化的行人检测方法,包括:

3、构建faster rcnn网络模型;

4、将所述faster rcnn网络模型的骨干网络融合改进后的特征提取网络,并将待检测图像输入至所述faster rcnn网络模型进行特征提取,得到提取特征图;

5、通过区域建议网络生成行人头部候选框集合,并基于数据集中标定的行人头部区域与所述行人头部区域对应的整体区域组合进行统计计算,得到头身比例关系,并依据该头身比例关系生成行人整体候选框集合;

6、构建行人头部检测分支模块和行人整体检测分支模块,并通过所述行人头部检测分支模块和所述行人整体检测分支模块获得所述待检测图像中的初步目标检测结果;

7、对于得到的所述初步目标检测结果中行人头部检测框和行人整体检测框进行初步后处理得到初步后处理检测结果,筛除冗余检测结果;

8、构建行人头身匹配模块,并将所述初步后处理检测结果输入行人头身匹配模块,对头部检测框和整体检测框进行匹配绑定;

9、构建基于头部抑制与全身召回的二次后处理模块,并利用所述二次后处理模块对所述初步后处理检测结果中未能匹配成功的头部检测框进行二次校验处理,恢复被错误抑制的行人整体框并剔除误检出的行人头部框,进而得到最终的行人检测结果。

10、作为一种优选的方案,所述将所述faster rcnn网络模型的骨干网络融合改进后的特征提取网络,并将待检测图像输入至所述faster rcnn网络模型进行特征提取,得到提取特征图,包括:

11、将resnet50网络作为faster rcnn网络模型的骨干网络;...

【技术保护点】

1.一种抗遮挡重叠与尺度变化的行人检测方法,其特征在于,包括:

2.如权利要求1所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,将所述Faster RCNN网络模型的骨干网络融合改进后的特征提取网络,并将待检测图像输入至所述Faster RCNN网络模型进行特征提取,得到提取特征图,包括:

3.如权利要求2所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,将所述改进后的特征提取网络与Faster RCNN网络模型进行融合,包括:

4.如权利要求3所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,将所述骨干网络ResNet50获取的特征信息进行特征融合,包括:

5.如权利要求1或2所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,构建特征重构模块,所述特征重构模块包括特征尺度缩放模块和特征变换模块,包括:

6.如权利要求2所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,所述构建混合注意力增强模块,通过在通道和空间两个维度上侧重关注小尺度行人目标特征,增加所述小尺度行人目标特征在训练过程中所占的权重,同时抑制背景特征,包括:

7.如权利要求6所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,对于得到的所述初步目标检测结果中头部检测框和行人整体检测框进行初步后处理得到初步后处理检测结果,筛除冗余检测结果,包括:

8.如权利要求7所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,所述构建行人头身匹配模块,并将所述初步后处理检测结果输入行人头身匹配模块,对头部检测框和整体检测框进行匹配绑定,包括:

9.如权利要求8所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,所述构建基于头部抑制与全身召回的二次后处理模块,并利用所述二次后处理模块对所述初步后处理检测结果中未能匹配成功的头部检测框进行二次校验处理,得到最终的行人检测结果,包括:

10.一种抗遮挡重叠与尺度变化的行人检测装置,其特征在于,包括:

...

【技术特征摘要】

1.一种抗遮挡重叠与尺度变化的行人检测方法,其特征在于,包括:

2.如权利要求1所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,将所述faster rcnn网络模型的骨干网络融合改进后的特征提取网络,并将待检测图像输入至所述faster rcnn网络模型进行特征提取,得到提取特征图,包括:

3.如权利要求2所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,将所述改进后的特征提取网络与faster rcnn网络模型进行融合,包括:

4.如权利要求3所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,将所述骨干网络resnet50获取的特征信息进行特征融合,包括:

5.如权利要求1或2所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,构建特征重构模块,所述特征重构模块包括特征尺度缩放模块和特征变换模块,包括:

6.如权利要求2所述的抗遮挡重叠与尺度变化的行人检测方法,其特征在于,所述构建混合注意...

【专利技术属性】
技术研发人员:马晞茗李宁吴迪
申请(专利权)人:中国科学院长春光学精密机械与物理研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1