图像处理模型的训练方法和装置及预测方法和装置制造方法及图纸

技术编号:30445486 阅读:14 留言:0更新日期:2021-10-24 18:37
本公开关于一种图像处理模型的训练方法和装置及预测方法和装置,训练方法包括:使用训练数据集对图像处理模型执行多次训练周期的训练,针对每次训练周期,执行以下操作:获取当前训练周期的训练数据集;将当前训练周期的训练数据集输入图像处理模型,得到当前训练周期的预测结果;基于当前训练周期的预测结果,确定当前训练周期的第一损失函数和当前训练周期的第二损失函数,并基于对应的权重分别对当前训练周期的第一损失函数和第二损失函数加权,并基于加权后的当前训练周期的第一损失函数和第二损失函数确定当前训练周期的图像处理模型的损失函数;通过根据当前训练周期的图像处理模型的损失函数调整当前训练周期的图像处理模型的参数。图像处理模型的参数。图像处理模型的参数。

【技术实现步骤摘要】
图像处理模型的训练方法和装置及预测方法和装置


[0001]本公开涉及计算机
,更具体地说,涉及一种图像处理模型的训练方法和装置及预测方法和装置。

技术介绍

[0002]随着计算机技术的高速发展,在进行业务采集数据处理的时候,常常涉及到不同的数据域。不同的数据域之间是存在差异的,数据域的差异体现在其中的采集到的数据的差异。例如两个相机分别采集到的两批图像上的数据,就属于两个不同的数据域,这两批数据之间就存在差异。如果将在第一数据域上训练的神经网络模型应用到第二数据域上,就会带来神经网络模型的性能下降。

技术实现思路

[0003]本公开提供一种图像处理模型的训练方法和装置及预测方法和装置,以至少解决上述相关技术中的问题,也可不解决任何上述问题。
[0004]根据本公开实施例的第一方面,提供一种图像处理模型的训练方法,包括:使用训练数据集对所述图像处理模型执行多次训练周期的训练,其中,针对每次训练周期,执行以下操作:获取当前训练周期的训练数据集,其中,所述当前训练周期的训练数据集包括源数据域图像数据和目标数据域图像数据中的至少一个,其中,源数据域图像数据和目标数据域图像数据的图像数据特征信息不完全相同;将所述当前训练周期的训练数据集输入所述图像处理模型,得到当前训练周期的预测结果;基于所述当前训练周期的预测结果,确定当前训练周期的第一损失函数和当前训练周期的第二损失函数,并基于当前训练周期的第一动态权重和当前训练周期的第二动态权重分别对所述当前训练周期的第一损失函数和所述当前训练周期的第二损失函数加权,并基于加权后的当前训练周期的第一损失函数和当前训练周期的第二损失函数确定所述当前训练周期的图像处理模型的损失函数,其中,所述第一损失函数为基于所述源数据域图像数据得到的损失函数,所述第二损失函数为基于所述目标数据域图像数据得到的损失函数;通过根据所述当前训练周期的图像处理模型的损失函数调整所述当前训练周期的图像处理模型的参数。
[0005]可选地,在所述多次训练周期中,第一动态权重按训练周期的增序从1递减至0,第二动态权重按训练周期的增序从0递增至1,且在每次训练周期中第一动态权重和第二动态权重的总和为1。
[0006]可选地,第一动态权重根据阶梯函数按训练周期的增序从1递减至0,第二动态权重根据阶梯函数按训练周期的增序从0递增至1。
[0007]可选地,所述多次训练周期按时序划分为多个区间,每个区间包括至少一次训练周期,为每个区间分配一个第一动态权重和一个第二动态权重,作为执行该区间中的至少一次训练周期的训练所使用的第一动态权重和第二动态权重。
[0008]可选地,所述训练数据集包括源数据域图像数据的标签信息和目标数据域图像数
据的伪标签信息,所述标签信息的准确程度高于伪标签信息的准确程度;当前训练周期的第一损失函数是根据源数据域图像数据的标签信息和当前训练周期的预测结果获得的;当前训练周期的第二损失函数是根据目标数据域图像数据的伪标签信息和当前训练周期的预测结果获得的。
[0009]可选地,所述目标数据域图像数据的伪标签信息是通过对所述目标数据域图像数据进行聚类获得的。
[0010]可选地,在所述训练方法执行前,所述图像处理模型是预训练的应用于分类的神经网络模型。
[0011]可选地,所述当前训练周期的图像处理模型的损失函数,被表示为:
[0012][0013]其中,为当前训练周期的图像处理模型的损失函数,θ为当前训练周期的图像处理模型的损失函数的参数,λ
s
(e)为当前训练周期的第一动态权重,s代表源数据域,e代表当前训练周期,为当前训练周期的第一损失函数,λ
t
(e)为当前训练周期的第二动态权重,t代表目标数据域,为当前训练周期的第二损失函数。
[0014]可选地,所述当前训练周期的第一损失函数和所述当前训练周期的第二损失函数均为交叉熵损失函数。
[0015]根据本公开实施例的第二方面,提供一种预测方法,包括:获取待处理图像数据;将所述待处理图像数据输入经由本公开的训练方法训练好的图像处理模型中,得到预测结果。
[0016]根据本公开实施例的第三方面,提供一种图像处理模型的训练装置,包括:数据获取单元、模型估计单元、函数计算单元和参数调节单元,其中,数据获取单元、模型估计单元、函数计算单元和参数调节单元使用训练数据集对所述图像处理模型执行多次训练周期的训练,其中,针对每次训练周期:数据获取单元被配置为:获取当前训练周期的训练数据集,其中,所述当前训练周期的训练数据集包括源数据域图像数据和目标数据域图像数据中的至少一个,其中,源数据域图像数据和目标数据域图像数据的图像数据特征信息不完全相同;模型估计单元被配置为:将所述当前训练周期的训练数据集输入所述图像处理模型,得到当前训练周期的预测结果;函数计算单元被配置为:基于所述当前训练周期的预测结果,确定当前训练周期的第一损失函数和当前训练周期的第二损失函数,并基于当前训练周期的第一动态权重和当前训练周期的第二动态权重分别对所述当前训练周期的第一损失函数和所述当前训练周期的第二损失函数加权,并基于加权后的当前训练周期的第一损失函数和当前训练周期的第二损失函数确定所述当前训练周期的图像处理模型的损失函数,其中,所述第一损失函数为基于所述源数据域图像数据得到的损失函数,所述第二损失函数为基于所述目标数据域图像数据得到的损失函数;参数调节单元被配置为:通过根据所述当前训练周期的图像处理模型的损失函数调整所述当前训练周期的图像处理模型的参数。
[0017]可选地,在所述多次训练周期中,第一动态权重按训练周期的增序从1递减至0,第二动态权重按训练周期的增序从0递增至1,且在每次训练周期中第一动态权重和第二动态权重的总和为1。
[0018]可选地,第一动态权重根据阶梯函数按训练周期的增序从1递减至0,第二动态权重根据阶梯函数按训练周期的增序从0递增至1。
[0019]可选地,所述多次训练周期按时序划分为多个区间,每个区间包括至少一次训练周期,为每个区间分配一个第一动态权重和一个第二动态权重,作为执行该区间中的至少一次训练周期的训练所使用的第一动态权重和第二动态权重。
[0020]可选地,所述训练数据集包括源数据域图像数据的标签信息和目标数据域图像数据的伪标签信息,所述标签信息的准确程度高于伪标签信息的准确程度;当前训练周期的第一损失函数是根据源数据域图像数据的标签信息和当前训练周期的预测结果获得的;当前训练周期的第二损失函数是根据目标数据域图像数据的伪标签信息和当前训练周期的预测结果获得的。
[0021]可选地,所述目标数据域图像数据的伪标签信息是通过对所述目标数据域图像数据进行聚类获得的。
[0022]可选地,所述图像处理模型是应用于分类的神经网络模型。
[0023]可选地,所述当前训练周期的图像处理模型的损失函数,被表示为:
[0024][0025]其中,为当前训练周期的图像处理模型的损失函数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理模型的训练方法,其特征在于,包括:使用训练数据集对所述图像处理模型执行多次训练周期的训练,其中,针对每次训练周期,执行以下操作:获取当前训练周期的训练数据集,其中,所述当前训练周期的训练数据集包括源数据域图像数据和目标数据域图像数据中的至少一个,其中,源数据域图像数据和目标数据域图像数据的图像数据特征信息不完全相同;将所述当前训练周期的训练数据集输入所述图像处理模型,得到当前训练周期的预测结果;基于所述当前训练周期的预测结果,确定当前训练周期的第一损失函数和当前训练周期的第二损失函数,并基于当前训练周期的第一动态权重和当前训练周期的第二动态权重分别对所述当前训练周期的第一损失函数和所述当前训练周期的第二损失函数加权,并基于加权后的当前训练周期的第一损失函数和当前训练周期的第二损失函数确定所述当前训练周期的图像处理模型的损失函数,其中,所述第一损失函数为基于所述源数据域图像数据得到的损失函数,所述第二损失函数为基于所述目标数据域图像数据得到的损失函数;通过根据所述当前训练周期的图像处理模型的损失函数调整所述当前训练周期的图像处理模型的参数。2.如权利要求1所述的训练方法,其特征在于,在所述多次训练周期中,第一动态权重按训练周期的增序从1递减至0,第二动态权重按训练周期的增序从0递增至1,且在每次训练周期中第一动态权重和第二动态权重的总和为1。3.如权利要求2所述的训练方法,其特征在于,第一动态权重根据阶梯函数按训练周期的增序从1递减至0,第二动态权重根据阶梯函数按训练周期的增序从0递增至1。4.如权利要求3所述的训练方法,其特征在于,所述多次训练周期按时序划分为多个区间,每个区间包括至少一次训练周期,为每个区间分配一个第一动态权重和一个第二动态权重,作为执行该区间中的至少一次训练周期的训练所使用的第一动态权重和第二动态权重。5.一种预测方法,其特征在于,包括:获取待处理图像数据;将所述待处理图像数据输入经由如权利要求1到4中的任一权利要求所述的图像处理模型的训练方法训练好的图像处理模型中,得到预测结果。6.一种图像处理模型的训练装置,其特征在于,包括:数据获取单元模型估计单元、函数计算单元和参数调节单元,其中,数据获取单元、模型估计单元、函数计算单元和参数调...

【专利技术属性】
技术研发人员:磯部駿陶鑫章佳杰戴宇荣
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1