System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 风格图像生成模型训练方法、装置、电子设备和存储介质制造方法及图纸_技高网

风格图像生成模型训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:44588155 阅读:1 留言:0更新日期:2025-03-14 12:47
本公开提供一种风格图像生成模型训练方法、装置、电子设备和存储介质。该方法包括:获取原始图像集合,对该原始图像进行图像内容识别,得到无风格图像内容识别文本,基于无风格图像内容识别文本,生成无风格生成图像集合,基于目标风格关键词和无风格图像内容识别文本确定风格图像内容文本,基于无风格图像内容识别文本和无风格生成图像,确定无风格训练样本中的训练文本和图像监督信息,以及基于风格图像内容文本和该原始图像,确定风格训练样本中的训练文本和图像监督信息,基于至少一个无风格训练样本和至少一个风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格图像生成模型,可以使图像内容和图像风格更好地解耦。

【技术实现步骤摘要】

本公开的实施例涉及计算机,具体涉及一种风格图像生成模型训练方法、装置、电子设备和存储介质


技术介绍

1、风格图像生成模型用于学习图像的风格并生成该风格的图像,具体地,将包含图像风格的文本输入至风格图像生成模型,输出与该风格对应的风格图像。

2、然而,现有的风格图像生成模型容易学习到图像内容,使得图像内容和图像风格很难解耦,导致风格图像生成模型输出的图像可能不是与该风格对应的图像。


技术实现思路

1、本公开的实施例提出了一种风格图像生成模型训练方法、装置、电子设备和存储介质。

2、第一方面,本公开提供了一种风格图像生成模型训练方法,包括:

3、获取原始图像集合,其中,原始图像符合目标风格关键词所指示的目标风格;

4、对于原始图像集合中的原始图像,执行以下训练样本生成操作:对该原始图像进行图像内容识别,得到无风格图像内容识别文本;基于无风格图像内容识别文本,生成无风格生成图像集合;基于目标风格关键词和无风格图像内容识别文本确定风格图像内容文本;基于无风格图像内容识别文本和无风格生成图像,确定无风格训练样本中的训练文本和图像监督信息,以及基于风格图像内容文本和该原始图像,确定风格训练样本中的训练文本和图像监督信息;

5、基于至少一个无风格训练样本和至少一个风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格图像生成模型。

6、在一些可选的实施方式中,基于目标风格关键词和无风格图像内容识别文本确定风格图像内容文本,包括:

7、拼接目标风格关键词和无风格图像内容识别文本,得到风格图像内容文本。

8、在一些可选的实施方式中,基于无风格图像内容识别文本,生成无风格生成图像集合,包括:

9、将无风格图像内容识别文本输入无风格图像生成模型,得到无风格生成图像集合。

10、在一些可选的实施方式中,基于至少一个无风格训练样本和至少一个风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格图像生成模型,包括:

11、对于至少一个无风格训练样本和至少一个风格训练样本,执行以下模型参数调整操作:将至少一个无风格训练样本和至少一个风格训练样本中的训练文本输入待训练目标风格图像生成模型,得到实际生成图像;基于实际生成图像与至少一个无风格训练样本和至少一个风格训练样本中的图像监督信息之间的差异调整待训练目标风格图像生成模型的模型参数;

12、将模型参数调整后的待训练目标风格图像生成模型确定为训练后的目标风格图像生成模型。

13、在一些可选的实施方式中,基于至少一个无风格训练样本和至少一个风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格图像生成模型,包括:

14、对于至少一个无风格训练样本和至少一个风格训练样本中的训练样本,执行以下模型参数调整操作:将至少一个无风格训练样本和至少一个风格训练样本中的训练文本输入待训练目标风格图像生成模型,得到实际生成图像;基于至少一个无风格训练样本和至少一个风格训练样本中的图像监督信息之间的差异调整待训练目标风格图像生成模型的模型参数;

15、将目标风格文本集合中的目标风格文本输入模型参数调整后的目标风格图像生成模型,得到训练后的目标风格图像生成模型。

16、在一些可选的实施方式中,将目标风格文本集合中的目标风格文本输入模型参数调整后的目标风格图像生成模型,得到训练后的目标风格图像生成模型,包括:

17、将目标风格文本集合中的目标风格文本输入模型参数调整后的目标风格图像生成模型,得到目标风格生成图像集合;

18、确定目标风格生成图像集合中符合目标风格的图像数量占比是否大于等于预设占比阈值;

19、响应于确定是,将参数调整后的目标风格图像生成模型确定为训练后的目标风格图像生成模型;

20、响应于确定否,将目标风格生成图像集合中符合目标风格的图像添加到原始图像集合中,以及将参数调整后的目标风格图像生成模型确定为待训练目标风格图像生成模型,继续执行风格图像生成模型训练方法。

21、在一些可选的实施方式中,对该原始图像进行图像内容识别,得到无风格图像内容识别文本,包括:

22、将该原始图像输入预先训练的图像内容识别模型,得到无风格图像内容识别文本。

23、第二方面,本公开提供了一种风格图像生成方法,包括:

24、获取待生成图像的图像内容描述文本及风格描述文本,其中,风格描述文本关联目标风格关键词;

25、基于图像内容描述文本及风格描述文本,通过与目标风格关键词对应的目标风格图像生成模型,生成与图像内容描述文本及风格描述文本对应的图像,其中,目标风格图像生成模型是采用如本公开第一方面中任一的方法预先训练得到的。

26、第三方面,本公开提供了一种风格图像生成模型训练装置,包括:

27、原始图像集合获取单元,用于获取原始图像集合,其中,原始图像符合目标风格关键词所指示的目标风格;

28、训练样本生成单元,用于对于原始图像集合中的原始图像,执行以下训练样本生成操作:对该原始图像进行图像内容识别,得到无风格图像内容识别文本;基于无风格图像内容识别文本,生成无风格生成图像集合;基于目标风格关键词和无风格图像内容识别文本确定风格图像内容文本;基于无风格图像内容识别文本和无风格生成图像,确定无风格训练样本中的训练文本和图像监督信息,以及基于风格图像内容文本和该原始图像,确定风格训练样本中的训练文本和图像监督信息;

29、目标风格图像生成模型训练单元,用于基于至少一个无风格训练样本和至少一个风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格图像生成模型。

30、第四方面,本公开提供了一种风格图像生成装置,包括:

31、图像内容描述文本及风格描述文本获取单元,用于获取待生成图像的图像内容描述文本及风格描述文本,其中,风格描述文本关联目标风格关键词;

32、图像生成单元,用于基于图像内容描述文本及风格描述文本,通过与目标风格关键词对应的目标风格图像生成模型,生成与图像内容描述文本及风格描述文本对应的图像,其中,目标风格图像生成模型是采用如本公开第一方面中任一的方法预先训练得到的。

33、第五方面,本公开提供了一种电子设备,包括:

34、一个或多个处理器;

35、存储装置,其上存储有一个或多个程序,

36、当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如本公开第一方面和/或第二方面任一实施方式描述的方法。

37、第六方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,上述计算机程序被一个或多个处理器执行时实现如本公开第一方面和/或第二方面任一实施方式描述的方法。

...

【技术保护点】

1.一种风格图像生成模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述目标风格关键词和所述无风格图像内容识别文本确定风格图像内容文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述无风格图像内容识别文本,生成无风格生成图像集合,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于至少一个所述无风格训练样本和至少一个所述风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格图像生成模型,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于至少一个所述无风格训练样本和至少一个所述风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格图像生成模型,包括:

6.根据权利要求5所述的方法,其特征在于,所述将目标风格文本集合中的目标风格文本输入模型参数调整后的所述目标风格图像生成模型,得到训练后的目标风格图像生成模型,包括:

7.根据权利要求1所述的方法,其特征在于,所述对该原始图像进行图像内容识别,得到无风格图像内容识别文本,包括:

8.一种风格图像生成方法,其特征在于,所述方法包括:

9.一种风格图像生成模型训练装置,包括:

10.一种风格图像生成装置,包括:

11.一种电子设备,包括:

12.一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被一个或多个处理器执行时实现如权利要求1-7和/或8中任一项所述的方法。

...

【技术特征摘要】

1.一种风格图像生成模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述目标风格关键词和所述无风格图像内容识别文本确定风格图像内容文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述无风格图像内容识别文本,生成无风格生成图像集合,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于至少一个所述无风格训练样本和至少一个所述风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格图像生成模型,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于至少一个所述无风格训练样本和至少一个所述风格训练样本,对待训练目标风格图像生成模型进行训练,得到训练后的目标风格...

【专利技术属性】
技术研发人员:吴捷
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1