【技术实现步骤摘要】
显著性物体检测模型的训练方法、装置以及设备
[0001]本公开涉及人工智能
,具体涉及图像处理、计算机视觉和深度学习等
,尤其涉及智慧城市、智能交通等场景。
技术介绍
[0002]在交通场景中,显著性物体检测能够检测交通场景内的显著区域和显著区域内的重要目标物体,同时忽略大部分无关的场景信息。
[0003]现有的无监督显著性物体检测方法通常采用自监督形式的迭代学习方式,也即模型自己生成伪标签监督自己训练。对于基于深度学习的方法,现有方法通常使用传统机器学习方法作为起始伪标签生成器来训练深度神经网络。为了获得更好的显著性物体检测性能,通常需要输入多个传统机器学习算法生成的伪标签,并对这些伪标签监督生成的模型进行集成学习,从而稳定模型训练和获得较好的效果。
技术实现思路
[0004]本公开实施例提出了一种显著性物体检测模型的训练方法、装置、设备、存储介质以及程序产品。
[0005]第一方面,本公开实施例提出了一种显著性物体检测模型的训练方法,包括:获取样本图像集中的样本图像的至少两个层次的特征张量;基于样本图像的至少两个层次的特征张量,生成样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合;基于样本图像的视觉对比度信息和样本图像集的视觉对比度信息混杂集合,生成视觉对比度融合信息;基于视觉对比度融合信息和样本图像的视觉对比度信息进行训练,得到显著性物体检测模型。
[0006]第二方面,本公开实施例提出了一种显著性物体检测方法,包括:获取待检测图像;将待检测图像输 ...
【技术保护点】
【技术特征摘要】
1.一种显著性物体检测模型的训练方法,包括:获取样本图像集中的样本图像的至少两个层次的特征张量;基于所述样本图像的至少两个层次的特征张量,生成所述样本图像的视觉对比度信息和所述样本图像集的视觉对比度信息混杂集合;基于所述样本图像的视觉对比度信息和所述样本图像集的视觉对比度信息混杂集合,生成视觉对比度融合信息;基于所述视觉对比度融合信息和所述样本图像的视觉对比度信息进行训练,得到显著性物体检测模型。2.根据权利要求1所述的方法,其中,所述基于所述样本图像的至少两个层次的特征张量,生成所述样本图像的视觉对比度信息和所述样本图像集的视觉对比度信息混杂集合,包括:将所述样本图像的至少两个层次的特征张量输入至对比度预训练网络,得到所述样本图像的视觉对比度信息;对所述样本图像的视觉对比度信息进行聚类,以及将聚类中心的视觉对比度信息组合成向量字典,作为所述样本图像集的视觉对比度信息混杂集合。3.根据权利要求2所述的方法,其中,所述将所述样本图像的至少两个层次的特征张量输入至对比度预训练网络,得到所述样本图像的视觉对比度信息,包括:基于所述样本图像的至少两个层次的特征张量,计算所述样本图像的至少两个层次的特征对比度,其中,一个特征张量对应一个特征对比度;合并所述样本图像的至少两个层次的特征对比度,得到所述样本图像的视觉对比度信息。4.根据权利要求1所述的方法,其中,所述基于所述样本图像的至少两个层次的特征张量,生成所述样本图像的视觉对比度信息和所述样本图像集的视觉对比度信息混杂集合,包括:基于所述样本图像的至少两个层次的特征张量,计算所述样本图像的至少两个层次的特征对比度,其中,一个特征张量对应一个特征对比度;将所述样本图像的至少两个层次的特征对比度对比融合,得到所述样本图像的视觉对比度信息;分别对所述样本图像的至少两个层次的特征张量进行全局平均,得到所述样本图像集的至少两个层次的特征张量;分别对所述样本图像集的至少两个层次的特征张量进行聚类,以及将聚类中心的特征张量组合成至少两个层次的向量字典;将所述至少两个层次的向量字典交叉拼接,生成所述样本图像集的视觉对比度信息混杂集合。5.根据权利要求1
‑
4中任一项所述的方法,其中,所述基于所述样本图像的视觉对比度信息和所述样本图像集的视觉对比度信息混杂集合,生成视觉对比度融合信息,包括:将所述样本图像的视觉对比度信息与所述样本图像集的视觉对比度信息混杂集合进行自注意力机制融合,生成所述视觉对比度融合信息。6.根据权利要求1
‑
5中任一项所述的方法,其中,所述基于所述视觉对比度融合信息和
所述样本图像的视觉对比度信息进行训练,得到显著性物体检测模型,包括:将所述视觉对比度融合信息与所述样本图像的视觉对比度信息进行拼接,得到拼接对比度信息;将所述拼接对比度信息输入至融合卷积层进行显著性物体检测,得到所述样本图像的显著性物体预测图像;基于所述样本图像的显著性物体标注图像与显著性物体预测图像的差异,调整融合卷积层的参数,得到所述显著性物体检测模型。7.根据权利要求6所述的方法,其中,所述基于所述样本图像的显著性物体标注图像与显著性物体预测图像的差异,调整融合卷积层的参数,得到所述显著性物体检测模型,包括:基于所述样本图像的显著性物体预测图像,计算所述样本图像集的显著性物体预测均值图像;基于所述样本图像的显著性物体预测图像与对应权重的乘积,以及所述样本图像集的显著性物体预测均值图像,计算损失函数;基于所述损失函数,调整所述融合卷积层的参数,得到所述显著性物体检测模型。8.根据权利要求1
‑
7中任一项所述的方法,其中,所述获取样本图像集中的样本图像的至少两个层次的特征张量,包括:将所述样本图像输入至骨干网络,提取所述样本图像的至少两个层次的特征张量。9.一种显著性物体检测方法,包括:获取待检测图像;将所述待检测图像输入至显著性物体检测模型,得到所述待检测图像的显著性物体检测结果,其中,所述显著性物体检测模型是采用权利要求1
‑
8中任一项所述的方法训练得到的。10.一种显著性物体检测模型的训练装置,包括:获取模块,被配置成获取样本图像集中的样本图像的至少两个层次的特征张量;第一生成模块,被配置成基于所述样本图像的至少两个层次的特征张量,生成所述样本图像的视觉对比度信息和所述样本图像集的视觉对比度信...
【专利技术属性】
技术研发人员:林相如,张伟,谭啸,韩钧宇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。