图像生成方法以及装置制造方法及图纸

技术编号：43195686 阅读：23 留言：0更新日期：2024-11-01 20:16

本说明书实施例提供图像生成方法以及装置，其中所述图像生成方法包括：获取目标文本；将所述目标文本输入图像生成模型，基于所述图像生成模型学习得到的实体信息与神经元的对应关系，获得所述目标文本对应的目标图像，其中，所述图像生成模型基于包含至少两类实体信息的样本文本对预训练图像生成模型进行训练得到，在所述训练的每次迭代中基于目标阈值对所述预训练图像生成模型中的神经元进行掩码处理，所述目标阈值基于所述预训练图像生成模型的网络参数蒸馏损失值确定。通过在对图像处理模型进行训练的过程，对预训练图像生成模型中的神经元进行掩码处理，从而实现网络参数的选择性使用，提升了图像生成模型的生成准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书实施例涉及计算机，特别涉及一种图像生成方法。

技术介绍

1、随着图像处理技术的不断发展，基于训练完成的扩散模型，实现根据文本生成图像的方式，较大的提升了图像的生成效率，节约了用户生成图像所耗费的时间。

2、目前，基于扩散模型生成单概念图像的效果较好，如，基于文本“一只狗”生成包含狗的图像；但在文本包含多概念的情况下，如，生成包含猫和狗的图像的情况下，扩散模型输出的图像可能存在混淆的情况，导致生成的图像不符合用户需求。

3、因此，需要提供更可靠的图像生成方法，从而提升模型输出的图像的准确度。

技术实现思路

1、有鉴于此，本说明书实施例提供了一种图像生成方法。本说明书一个或者多个实施例同时涉及一种图像生成装置，一种图像生成模型训练方法，一种目标图像生成方法，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面，提供了一种图像生成方法，包括：

3、获取目标文本；

4、将所述目标文本输入图像生成模型，基于所述图像生成模型学习得到的实体信息与神经元的对应关系，获得所述目标文本对应的目标图像，其中，所述图像生成模型基于包含至少两类实体信息的样本文本对预训练图像生成模型进行训练得到，在所述训练的每次迭代中基于目标阈值对所述预训练图像生成模型中的神经元进行掩码处理，所述目标阈值基于所述预训练图像生成模型的网络参数蒸馏损失值确定。

5、根据本说明书实施

6、获取模块，被配置为获取目标文本；

7、输入模块，被配置为将所述目标文本输入图像生成模型，基于所述图像生成模型学习得到的实体信息与神经元的对应关系，获得所述目标文本对应的目标图像，其中，所述图像生成模型基于包含至少两类实体信息的样本文本对预训练图像生成模型进行训练得到，在所述训练的每次迭代中基于目标阈值对所述预训练图像生成模型中的神经元进行掩码处理，所述目标阈值基于所述预训练图像生成模型的网络参数蒸馏损失值确定。

8、根据本说明书实施例的第三方面，提供了一种图像生成模型训练方法，应用于云侧设备，包括：

9、获取样本对，其中，所述样本对包含样本文本和样本标签，所述样本文本包含至少两类实体信息，所述样本标签为样本图像；

10、将所述样本对输入预训练图像生成模型，获得预测图像，其中，所述预测图像中包含基于各类实体信息生成的实体对象；

11、获取所述预训练图像生成模型对应的初始网络参数和目标网络参数，并基于所述样本图像、所述预测图像、所述初始网络参数和所述目标网络参数计算模型损失值；

12、基于所述模型损失值对所述预训练图像生成模型的网络参数进行调整，直至获得训练完成的图像生成模型；

13、响应于端侧设备发送的模型获取请求，将所述图像生成模型的模型参数返回至所述端侧设备。

14、根据本说明书实施例的第四方面，提供了另一种图像生成方法，应用于云侧设备，包括：

15、接收端侧设备发送的目标文本；

16、将所述目标文本输入图像生成模型，基于所述图像生成模型学习得到的实体信息与神经元的对应关系，获得所述目标文本对应的目标图像，其中，所述图像生成模型基于包含至少两类实体信息的样本文本对预训练图像生成模型进行训练得到，在所述训练的每次迭代中基于目标阈值对所述预训练图像生成模型中的神经元进行掩码处理，所述目标阈值基于所述预训练图像生成模型的网络参数蒸馏损失值确定；

17、将所述目标图像返回至所述端侧设备。

18、根据本说明书实施例的第五方面，提供了一种目标图像生成方法，包括：

19、获取目标文本，其中，所述目标文本中包含至少两类实体信息；

20、将所述目标文本输入图像生成模型，基于所述图像生成模型学习得到的实体信息与神经元的对应关系，获得所述目标文本对应的目标图像，其中，所述目标图像中包含至少两类实体对象；所述图像生成模型基于包含至少两类实体信息的样本文本对预训练图像生成模型进行训练得到，在所述训练的每次迭代中基于目标阈值对所述预训练图像生成模型中的神经元进行掩码处理，所述目标阈值基于所述预训练图像生成模型的网络参数蒸馏损失确定。

21、根据本说明书实施例的第六方面，提供了一种计算设备，包括：

22、存储器和处理器；

23、所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现上述图像生成方法的步骤。

24、根据本说明书实施例的第七方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现上述图像生成方法的步骤。

25、根据本说明书实施例的第八方面，提供了一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述图像生成方法的步骤。

26、本说明书一个实施例实现了获取目标文本；将所述目标文本输入图像生成模型，基于所述图像生成模型学习得到的实体信息与神经元的对应关系，获得所述目标文本对应的目标图像，其中，所述图像生成模型基于包含至少两类实体信息的样本文本对预训练图像生成模型进行训练得到，在所述训练的每次迭代中基于目标阈值对所述预训练图像生成模型中的神经元进行掩码处理，所述目标阈值基于所述预训练图像生成模型的网络参数蒸馏损失值确定。

27、通过在对图像处理模型进行训练的过程，对预训练图像生成模型中的神经元进行掩码处理，从而实现网络参数的选择性使用，降低图像特征生成的稀疏性，提升了图像生成模型的生成准确度；将目标文本输入训练得到的图像生成模型，从而获得准确度更高的目标图像。

本文档来自技高网...

【技术保护点】

1.一种图像生成方法，包括：

2.如权利要求1所述的方法，将所述目标文本输入图像生成模型之前，还包括：

3.如权利要求2所述的方法，基于所述样本图像、所述预测图像、所述初始网络参数和所述目标网络参数计算模型损失值之前，还包括：

4.如权利要求3所述的方法，基于所述样本图像、所述预测图像、所述初始网络参数和所述目标网络参数计算模型损失值之前，还包括：

5.如权利要求2所述的方法，将所述样本图像输入预训练图像生成模型之前，还包括：

6.如权利要求5所述的方法，基于所述模型损失值对所述预训练图像生成模型的网络参数进行调整，包括：

7.一种图像生成模型训练方法，应用于云侧设备，包括：

8.一种图像生成方法，应用于云侧设备，包括：

9.一种目标图像生成方法，包括：

10.如权利要求9所述的方法，获得所述目标文本对应的目标图像之后，还包括：

11.一种图像生成装置，包括：

12.一种计算设备，包括：

13.一种计算机可读存储介质，其存储有计算机可执行

...

【技术特征摘要】

1.一种图像生成方法，包括：

2.如权利要求1所述的方法，将所述目标文本输入图像生成模型之前，还包括：

3.如权利要求2所述的方法，基于所述样本图像、所述预测图像、所述初始网络参数和所述目标网络参数计算模型损失值之前，还包括：

4.如权利要求3所述的方法，基于所述样本图像、所述预测图像、所述初始网络参数和所述目标网络参数计算模型损失值之前，还包括：

5.如权利要求2所述的方法，将所述样本图像输入预训练图像生成模型之前，还包括：

6.如权利要求5所述的方法，基于所述模型损失值...

【专利技术属性】
技术研发人员：刘志恒，冯睿蠡，朱凯，张轶飞，郑可成，刘宇，赵德丽，周靖人，
申请(专利权)人：阿里巴巴达摩院杭州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人