System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及图像处理,尤其涉及一种基于视觉显著性模型的场景目标检测方法及装置。
技术介绍
1、在复杂多变的模拟训练战场的场景中,高效、准确地提取并识别出场景图像中的关键目标已成为智能化装备的重要基础。
2、传统的显著性检测算法主要依赖于图像的颜色、亮度、纹理等底层特征,通过模拟人类视觉系统的注意机制来检测图像中的显著区域。模拟训练战场的场景是一个动态变化的环境,目标的位置、形态乃至存在状态都可能随时发生变化,要求算法具备高度的实时性和适应性。
3、然而,在复杂多变的模拟训练战场的场景中,传统算法往往存在误检率高、鲁棒性差等问题。特别是在目标被遮挡、背景与目标相似度高、光照条件变化大等情况下,传统算法的检测性能会大幅下降,导致传统显著性检测算法在复杂图像中显著值低,不能适应不同的环境和场景变化。
技术实现思路
1、在本申请实施例中,通过提供一种基于视觉显著性模型的场景目标检测方法,解决了在复杂多变的模拟训练战场的场景中,传统算法往往存在误检率高、鲁棒性差,特别是在目标被遮挡、背景与目标相似度高、光照条件变化大等情况下,传统算法的检测性能会大幅下降,导致传统显著性检测算法在复杂图像中显著值低,不能适应不同的环境和场景变化的问题。
2、第一方面,本申请实施例提供了一种基于视觉显著性模型的场景目标检测方法,该方法包括:收集场景中的图像,对图像中的目标进行位置和类别的标注,构建数据集;定义检测目标并设定约束条件;根据检测目标和约束条件,在卷积神经网络和多层感
3、在一种可能的实现方式中,所述根据检测目标和约束条件,在卷积神经网络和多层感知机之间构建残差块,以引入残差连接,包括:定义主路径函数和捷径函数;将主路径函数的输出与捷径函数的输出相加,获得残差块的输出数据,以引入残差连接。
4、在一种可能的实现方式中,所述主路径函数用于接收输入数据,并将输入数据经过多个操作后输出特征映射图;多个操作包括卷积操作、批归一化操作和非线性激活函数操作。
5、在一种可能的实现方式中,所述捷径函数的输入数据与所述主路径函数的输入数据相同;引入权重矩阵,将输入数据与权重矩阵进行乘法操作,从而获得捷径函数的输出。
6、在一种可能的实现方式中,还包括:在残差块中引入多尺度特征融合步骤。
7、在一种可能的实现方式中,所述多尺度特征融合步骤,包括:在主路径函数中使用多个不同尺度的卷积核对输入数据进行卷积操作,生成多个尺度的特征图;对生成的每个尺度的特征图进行非均匀分割操作,将其分割成多个不同尺度和形状的兴趣区域,使得每个特征图上都有多个兴趣区域;确定每个兴趣区域在同一尺度特征图上的相对位置,并将其映射至各自所在的特征图上;以每个兴趣区域在特征图上的中心点为中心,围绕中心点提取一个小区域作为映射后的特征图;对每个映射后的特征图进行卷积操作,生成与兴趣区域数量相同的新的特征图;对多个新的特征图进行融合操作,生成最终的特征图;将所述最终的特征图作为多层感知机的输入数据;通过多层感知机的输出层输出初始显著性模型的第二预测结果;其中,所述第二预测结果用于区分图像的显著区域和非显著区域。
8、在一种可能的实现方式中,所述在验证集上对所述初始显著性模型的性能进行评估与优化,从而获得最终显著性模型,包括:在装备智能算法实验工具中,设计评估指标并构建具有代表性的场景作为仿真模拟场景;其中,所述评估指标包括检测准确率、检测误报率、检测漏报率和处理速度,所述具有代表性的场景包括能够覆盖不同环境条件、不同目标类型和不同检测难度的场景;在虚拟独立运行环境中加载仿真模拟场景和初始显著性模型,进行仿真试验,实时收集并存储试验数据;试验结束后,对收集到的试验数据进行评估分析,并根据评估分析结果对初始显著性模型进行调整和优化,从而获得最终显著性模型。
9、第二方面,本申请实施例提供了一种基于视觉显著性模型的场景目标检测装置,该装置包括:收集模块,用于收集场景中的图像,对图像中的目标进行位置和类别的标注,构建数据集;定义模块,用于定义检测目标并设定约束条件;构建模块,用于根据检测目标和约束条件,在卷积神经网络和多层感知机之间构建残差块,以引入残差连接,构建初始显著性模型;获取模块,用于获取所述残差块的输出数据作为多层感知机的输入数据;输出模块,用于通过多层感知机的输出层输出初始显著性模型的第一预测结果;其中,所述第一预测结果用于区分图像的显著区域和非显著区域;优化模块,用于使用数据集对所述初始显著性模型进行训练,在验证集上对所述初始显著性模型的性能进行评估与优化,从而获得最终显著性模型。
10、第三方面,本申请实施例提供了一种基于视觉显著性模型的场景目标检测服务器,包括存储器和处理器;所述存储器用于存储计算机可执行指令;所述处理器用于执行所述计算机可执行指令,以实现第一方面或第一方面任一种可能的实现方式所述的方法。
11、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时能够实现第一方面或第一方面任一种可能的实现方式所述的方法。
12、本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果:
13、本申请实施例提供了一种基于视觉显著性模型的场景目标检测方法,通过明确检测目标和设定约束条件,使得模型在训练过程中更加聚焦于场景中的关键目标。有助于提升模型对关键目标的识别精度,减少误检和漏检的情况,从而提高整体检测的准确性。利用包含丰富图像数据及其精确位置和类别标注的数据集进行训练,使得模型能够学习到更多样化的特征表示,使其在不同场景和复杂环境下依然能够保持较高的检测性能。在卷积神经网络和多层感知机之间引入残差块,通过残差连接有效缓解了深层网络训练中的梯度消失或爆炸问题,不仅加快了模型的训练速度,还使得模型在推理阶段能够更快地处理图像数据,提高了检测效率。通过多层感知机的输出层区分图像的显著区域和非显著区域,使得模型能够自动学习并识别出图像中最具代表性的区域,为后续的目标检测提供了更加准确的先验信息,进一步优化了目标检测的效果。构建的模型框架具有良好的灵活性和可扩展性。可以根据实际需求调整残差块的数量、卷积层的配置以及多层感知机的结构,以适应不同复杂度和规模的目标检测任务。解决了在复杂多变的模拟训练战场的场景中,传统算法往往存在误检率高、鲁棒性差,特别是在目标被遮挡、背景与目标相似度高、光照条件变化大等情况下,传统算法的检测性能会大幅下降,导致传统显著性检测算法在复杂图像中显著值低,不能适应不同的环境和场景变化的问题。
...【技术保护点】
1.一种基于视觉显著性模型的场景目标检测方法,其特征在于,包括:
2.根据权利要求1所述的基于视觉显著性模型的场景目标检测方法,其特征在于,所述根据检测目标和约束条件,在卷积神经网络和多层感知机之间构建残差块,以引入残差连接,包括:
3.根据权利要求2所述的基于视觉显著性模型的场景目标检测方法,其特征在于,所述主路径函数用于接收输入数据,并将输入数据经过多个操作后输出特征映射图;
4.根据权利要求3所述的基于视觉显著性模型的场景目标检测方法,其特征在于,所述捷径函数的输入数据与所述主路径函数的输入数据相同;
5.根据权利要求1所述的基于视觉显著性模型的场景目标检测方法,其特征在于,还包括:在残差块中引入多尺度特征融合步骤。
6.根据权利要求5所述的基于视觉显著性模型的场景目标检测方法,其特征在于,所述多尺度特征融合步骤,包括:
7.根据权利要求1所述的基于视觉显著性模型的场景目标检测方法,其特征在于,所述在验证集上对所述初始显著性模型的性能进行评估与优化,从而获得最终显著性模型,包括:
8.一种基
9.一种基于视觉显著性模型的场景目标检测服务器,其特征在于,包括存储器和处理器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时能够实现如权利要求1-7任一项所述的方法。
...【技术特征摘要】
1.一种基于视觉显著性模型的场景目标检测方法,其特征在于,包括:
2.根据权利要求1所述的基于视觉显著性模型的场景目标检测方法,其特征在于,所述根据检测目标和约束条件,在卷积神经网络和多层感知机之间构建残差块,以引入残差连接,包括:
3.根据权利要求2所述的基于视觉显著性模型的场景目标检测方法,其特征在于,所述主路径函数用于接收输入数据,并将输入数据经过多个操作后输出特征映射图;
4.根据权利要求3所述的基于视觉显著性模型的场景目标检测方法,其特征在于,所述捷径函数的输入数据与所述主路径函数的输入数据相同;
5.根据权利要求1所述的基于视觉显著性模型的场景目标检测方法,其特征在于,还包括:在残差块中...
【专利技术属性】
技术研发人员:李瑞隆,刘科检,李晓朋,何宇,王宬,田建升,
申请(专利权)人:西安羚控电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。