一种图像处理方法、装置、设备及可读存储介质制造方法及图纸

技术编号:35033355 阅读:14 留言:0更新日期:2022-09-24 23:08
本申请公开了一种图像处理方法、装置、设备及可读存储介质,该方法获取待处理的目标图像;利用训练好的图像处理模型,对目标图像进行处理,得到处理结果;在自监督学习框架中的上支路网络增加图像相互融合输入分支,得到训练模型;利用训练图像,并结合目标损失函数对训练模型进行训练;目标损失函数包括对比损失学习函数和融合损失函数;训练结束后,保留训练过程中编码器的网络结构和相对应的训练权重,得到图像处理模型。将融合策略运用在自监督学习过程中,将不同输入图像进行融合,增加了模型区别正负样本图像的难度,从而能够有效提升模型训练过程中对图像特征的抽象表示。因而,在训练完成后,所得的图像处理模型能够体现更好的泛化性。现更好的泛化性。现更好的泛化性。

【技术实现步骤摘要】
一种图像处理方法、装置、设备及可读存储介质


[0001]本申请涉及计算机视频
,特别是涉及一种图像处理方法、装置、设备及可读存储介质。

技术介绍

[0002]在计算机视觉领域,自监督预训练模型的泛化性与适用性仍然面临诸多挑战与困难。
[0003]对比学习是计算机视觉领域中的一种主流自监督学习方法,对比学习中所涉及到的代理任务是实例判别(Instance discrimination)。其主要思想是在学习的过程中使得来自同一张图像的不同增强样本对(正样本对)在特征表示空间中的距离尽可能近,而对于来自不同图像的增强样本对(负样本对)在特征表示空间中的距离尽可能远,从而达到区分不同实例的目的。当表示空间的高维特征达到预训练预期的效果之后,这些特征将被直接被应用于视觉领域不同的下游任务,比如目标检测、语义分割等任务。但是,在实际应用中可发现,对比学习,其泛化性能有限,难以适应实际应用需求。
[0004]综上所述,如何有效地提升视觉表示泛化性等问题,是目前本领域技术人员急需解决的技术问题。

技术实现思路

[0005]本申请的目的是提供一种图像处理方法、装置、设备及可读存储介质,能够有效提升视觉表示泛化性。
[0006]为解决上述技术问题,本申请提供如下技术方案:
[0007]一种图像处理方法,包括:
[0008]获取待处理的目标图像;
[0009]利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果;
[0010]其中,训练所述图像处理模型,包括:
[0011]在自监督学习框架中的上支路网络增加图像相互融合输入分支,得到训练模型;
[0012]利用训练图像,并结合目标损失函数对所述训练模型进行训练;所述目标损失函数包括对比损失学习函数和融合损失函数;
[0013]训练结束后,保留训练过程中编码器的网络结构和相对应的训练权重,得到所述图像处理模型。
[0014]优选地,利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果,包括:
[0015]将所述目标图像输入至所述图像处理模型进行内容识别,得到图像内容信息。
[0016]优选地,利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果,包括:
[0017]将所述目标图像输入至所述图像处理模型进行目标识别检测,得到检测结果。
[0018]优选地,利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果,包括:
[0019]将所述目标图像输入至所述图像处理模型进行语义分割,得到分割结果。
[0020]优选地,所述利用训练图像,并结合目标损失函数对所述训练模型进行训练,包括:
[0021]对所述训练图像进行两两融合,得到融合图像;
[0022]将所述训练图像和所述融合图像输入至所述训练模型进行训练;
[0023]利用所述目标损失函数计算所述训练模型的损失值。
[0024]优选地,在对所述训练图像进行两两融合之前,还包括:
[0025]对所述训练图像进行图像增强处理。
[0026]优选地,对所述训练图像进行两两融合,得到融合图像,包括:
[0027]获取随机的二值掩模图像;
[0028]利用所述二值掩膜图像,确定第一训练图像的第一丢弃图像块和第一保留图像块;
[0029]利用取反后的所述二值掩膜图像,确定第二训练图像的第二丢弃图像块和第二保留图像块;
[0030]合并所述第一保留图像块与所述第二保留图像块,得到所述融合图像。
[0031]一种图像处理装置,包括:
[0032]图像获取模块,用于获取待处理的目标图像;
[0033]图像处理模块,用于利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果;
[0034]模型训练模块,用于在自监督学习框架中的上支路网络增加图像相互融合输入分支,得到训练模型;利用训练图像,并结合目标损失函数对所述训练模型进行训练;所述目标损失函数包括对比损失学习函数和融合损失函数;训练结束后,保留训练过程中编码器的网络结构和相对应的训练权重,得到所述图像处理模型。
[0035]一种电子设备,包括:
[0036]存储器,用于存储计算机程序;
[0037]处理器,用于执行所述计算机程序时实现上述图像处理方法的步骤。
[0038]一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述图像处理方法的步骤。
[0039]应用本申请实施例所提供的方法,获取待处理的目标图像;利用训练好的图像处理模型,对目标图像进行处理,得到处理结果;其中,训练图像处理模型,包括:在自监督学习框架中的上支路网络增加图像相互融合输入分支,得到训练模型;利用训练图像,并结合目标损失函数对训练模型进行训练;目标损失函数包括对比损失学习函数和融合损失函数;训练结束后,保留训练过程中编码器的网络结构和相对应的训练权重,得到图像处理模型。
[0040]在本申请中,对图像处理模型进行训练时,针对训练图像进行融合,将融合所得的融合图像和训练图像并结合包括了对比损失学习函数和融合损失函数的目标损失函数。即将融合策略运用在自监督学习过程中,将不同输入图像进行融合,增加了模型区别正负样
本图像的难度,从而能够有效提升模型训练过程中对图像特征的抽象表示。因而,在训练完成后,所得的图像处理模型对目标图像进行处理,能够体现更好的泛化性。即,能够更好地对目标图像进行处理,得到更加精准的处理结果。
[0041]相应地,本申请实施例还提供了与上述图像处理方法相对应的图像处理装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
[0042]为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0043]图1为本申请实施例中一种图像处理方法的实施流程图;
[0044]图2为本申请实施例中一种训练模型的示意图;
[0045]图3为本申请实施例中一种图像融合示意图;
[0046]图4为本申请实施例中一种图像处理装置的结构示意图;
[0047]图5为本申请实施例中一种电子设备的结构示意图;
[0048]图6为本申请实施例中一种电子设备的具体结构示意图。
具体实施方式
[0049]为了使本
的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:获取待处理的目标图像;利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果;其中,训练所述图像处理模型,包括:在自监督学习框架中的上支路网络增加图像相互融合输入分支,得到训练模型;利用训练图像,并结合目标损失函数对所述训练模型进行训练;所述目标损失函数包括对比损失学习函数和融合损失函数;训练结束后,保留训练过程中编码器的网络结构和相对应的训练权重,得到所述图像处理模型。2.根据权利要求1所述的图像处理方法,其特征在于,利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果,包括:将所述目标图像输入至所述图像处理模型进行内容识别,得到图像内容信息。3.根据权利要求1所述的图像处理方法,其特征在于,利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果,包括:将所述目标图像输入至所述图像处理模型进行目标识别检测,得到检测结果。4.根据权利要求1所述的图像处理方法,其特征在于,利用训练好的图像处理模型,对所述目标图像进行处理,得到处理结果,包括:将所述目标图像输入至所述图像处理模型进行语义分割,得到分割结果。5.根据权利要求1至4任一项所述的图像处理方法,其特征在于,所述利用训练图像,并结合目标损失函数对所述训练模型进行训练,包括:对所述训练图像进行两两融合,得到融合图像;将所述训练图像和所述融合图像输入至所述训练模型进行训练;利用所述目标损失函数计算所述训练...

【专利技术属性】
技术研发人员:李军
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1