System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多尺度上下文感知的目标检测方法及装置制造方法及图纸_技高网

基于多尺度上下文感知的目标检测方法及装置制造方法及图纸

技术编号:44053812 阅读:3 留言:0更新日期:2025-01-17 15:57
本发明专利技术涉及一种基于多尺度上下文感知的目标检测方法及装置,属于计算机视觉领域。其包括以下步骤:获取目标检测数据集,将数据集划分为训练集和测试集;构建基于多尺度上下文感知的目标检测模型,所述模型包括多尺度分割编码模块、多尺度上下文感知解码模块、门控多尺度特征融合模块以及预测模块;采用训练集中图像对基于多尺度上下文感知的目标检测模型进行训练;通过损失函数对基于多尺度上下文感知的目标检测模型进行优化,得到训练好的模型;测试集中图像输入到训练好的模型中,得到目标检测结果。本发明专利技术能够显著提升目标检测在复杂场景下的准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,具体涉及一种基于多尺度上下文感知的目标检测方法及装置


技术介绍

1、在现代计算机视觉领域,目标检测是一项基础且至关重要的任务,它被广泛应用于智能监控、自动驾驶、医疗影像分析以及无人机导航等多个关键领域。传统的目标检测方法通常依赖于手工设计的特征提取器和分类器,例如结合方向梯度直方图特征与支持向量机分类器的方法。这类方法虽然在处理简单场景时表现良好,但面对复杂环境或小目标检测时往往性能不佳。随着深度学习技术的发展,基于深度神经网络的目标检测方法逐渐成为主流。这些方法利用强大的表征学习能力,在准确性和速度方面取得了显著进步。尽管如此,现有的目标检测模型仍然面临一些挑战,尤其是在处理具有多尺度变化的目标时。实际应用中,不同大小的目标可能共存于同一图像中,这对检测算法提出了更高的要求,需要能够同时捕捉到全局视图中的大范围信息和局部细节。此外,上下文信息对于正确识别目标同样至关重要。它不仅有助于区分目标与背景,还能帮助识别外观相似的对象。因此,开发一种能够有效融合多尺度特征并充分利用上下文信息的检测方法显得尤为迫切。

2、本专利技术提出的基于多尺度上下文感知的目标检测方法,正是针对上述问题而设计。通过引入多层次特征融合机制和上下文感知模块,该方法旨在增强对复杂场景中小目标的检测精度和鲁棒性,从而为实际应用场景提供更加高效可靠的解决方案。这种方法特别适用于那些需要精确目标定位和识别的领域,比如精细化农业管理、城市交通监测等,为推动智能化系统的进一步发展提供了坚实的技术支撑。


技术实现思路

1、本专利技术为了解决上述问题,提供了一种基于多尺度上下文感知的目标检测方法及装置。

2、本专利技术为实现上述目的,通过以下技术方案实现:

3、第一方面,本专利技术提供一种基于多尺度上下文感知的目标检测方法,包括以下步骤:

4、s1.获取目标检测数据集,将数据集划分为训练集和测试集;

5、s2.构建基于多尺度上下文感知的目标检测模型,所述模型包括多尺度分割编码模块、多尺度上下文感知解码模块、门控多尺度特征融合模块以及预测模块;所述多尺度分割编码模块包括图像特征编码器、第一分割尺度参数、第二分割尺度参数以及第三分割尺度参数,所述多尺度上下文感知解码模块包括双重上文感知解码层、双重下文感知解码层和双重上下文感知聚合层,所述门控多尺度特征融合模块包括门控单元构建单元和门控融合单元,所述预测模块包括分类头网络和回归头网络;采用训练集中图像对基于多尺度上下文感知的目标检测模型进行训练;

6、s3.通过损失函数对基于多尺度上下文感知的目标检测模型进行优化,得到训练好的模型;

7、s4.测试集中图像输入到训练好的模型中,得到目标检测结果。

8、进一步地,步骤s2中,多尺度分割编码模块具体为:

9、训练集中图像经过图像特征编码器进行特征提取,得到全局图像特征,公式表示如下:

10、,

11、其中,表示图像特征编码器;

12、预定义三个分割尺度参数,包括第一分割尺度参数、第二分割尺度参数以及第三分割尺度参数;所述第一分割尺度参数设置为4×4,通过使用一个卷积核大小为4×4、步距为4、卷积核数量为768的卷积层实现;所述第二分割尺度参数设置为8×8,通过使用一个卷积核大小为8×8、步距为8、卷积核数量为768的卷积层实现;所述第三分割尺度参数设置为16×16,通过使用一个卷积核大小为16×16、步距为16、卷积核数量为768的卷积层实现;训练集中图像经过第一分割尺度参数、第二分割尺度参数以及第三分割尺度参数进行处理,分别得到特征、特征以及特征,公式表示如下:

13、,

14、,

15、,

16、其中,表示卷积核大小为4×4、步距为4、卷积核数量为768的卷积层,表示卷积核大小为8×8、步距为8、卷积核数量为768的卷积层,表示卷积核大小为16×16、步距为16、卷积核数量为768的卷积层。

17、进一步地,步骤s2中,所述多尺度上下文感知解码模块包括双重上文感知解码层、双重下文感知解码层和双重上下文感知聚合层,具体为:

18、全局图像特征和特征经过多尺度上下文感知解码模块得到上下文感知表示,过程如下:

19、所述双重上文感知解码层包括left_to_right上文感知解码单元和up_to_down上文感知解码单元;在left_to_right上文感知解码单元中,利用全局图像特征对特征进行解码和预测,基于left上文特征得到left上文感知表示,公式表示如下:

20、,

21、,

22、其中,表示通过对特征中第行从左向右共列的特征求和得到的left上文特征,表示基于全局图像特征和left上文特征解码得到的位置坐标为(i,j)的left上文感知表示,表示left_to_right上文感知解码单元,表示特征垂直方向的索引,范围为,表示训练集中图像在垂直方向上被第一分割尺度参数分割后的块数,其中是图像的高度,表示特征水平方向的索引,范围为,表示训练集中图像在水平方向上被第一分割尺度参数分割后的块数,其中是图像的宽度;在up_to_down上文感知解码单元中,利用全局图像特征对特征进行解码和预测,基于up上文特征得到up上文感知表示,公式表示如下:

23、,

24、,

25、其中,表示通过对特征中第列中从上向下共行的特征求和得到的up上文特征,表示基于全局图像特征和up上文特征解码得到的位置坐标为(i,j)的up上文感知表示,表示up_to_down上文感知解码单元;将left上文感知表示和up上文感知表示通过相加的方式进行特征融合,得到上文感知表示;

26、所述双重下文感知解码层包括right_to_left下文感知解码单元和down_to_up下文感知解码单元;在right_to_left下文感知解码单元中,利用全局图像特征对特征进行解码和预测,基于right下文特征得到right下文感知表示,公式表示如下:

27、

28、,

29、其中,表示通过对特征第行中从右向左共列的特征求和得到的right下文特征,表示基于全局图像特征和right下文特征解码得到的位置坐标为(i,j)的right下文感知表示,表示right_to_left下文感知解码单元;在down_to_up下文感知解码单元中,利用全局图像特征对特征进行解码和预测,基于down下文特征得到down下文感知表示,公式表示如下:

30、

31、,

32、其中,表示对特征第列中从下向上共行的特征求和得到的down下文特征,表示基于全局图像特征和down下文特征解码得到位置坐标为(i,j)的down下文感知表示,表示down_to_up下文感知解码单元;将right下文感知表示和down下文感知表示通过相加的方式进行特征本文档来自技高网...

【技术保护点】

1.一种基于多尺度上下文感知的目标检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤S2中,多尺度分割编码模块具体为:

3.根据权利要求2所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤S2中,所述多尺度上下文感知解码模块包括双重上文感知解码层、双重下文感知解码层和双重上下文感知聚合层,具体为:

4.根据权利要求3所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤S2中,门控多尺度特征融合模块具体为:

5.根据权利要求4所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤S2中,预测模块具体为:

6.根据权利要求5所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤S3具体为:

7.一种基于多尺度上下文感知的目标检测装置,其特征在于,包括:

8.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6中任一项所述的基于多尺度上下文感知的目标检测方法。

9.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6中任一项所述的基于多尺度上下文感知的目标检测方法。

...

【技术特征摘要】

1.一种基于多尺度上下文感知的目标检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤s2中,多尺度分割编码模块具体为:

3.根据权利要求2所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤s2中,所述多尺度上下文感知解码模块包括双重上文感知解码层、双重下文感知解码层和双重上下文感知聚合层,具体为:

4.根据权利要求3所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤s2中,门控多尺度特征融合模块具体为:

5.根据权利要求4所述的基于多尺度上下文感知的目标检测方法,其特征在于,步骤s2中,预测模块具体为:

...

【专利技术属性】
技术研发人员:高天雷谢小云魏诺杨媛媛胡春雨徐鹏摇
申请(专利权)人:山东省人工智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1