一种图像生成方法、装置、设备、存储介质以及程序产品制造方法及图纸

技术编号：41300666 阅读：14 留言：0更新日期：2024-05-13 14:48

本公开提供了一种图像生成方法、装置、设备、存储介质以及程序产品，该方法包括：通过标签提取模型分别从智能体图像和/或智能体人设中获取智能体的标签信息；获取主题信息；通过语言模型根据所述标签信息和所述主题信息生成场景描述；通过文生图模型根据所述场景描述生成一帧人工智能图像，所述人工智能图像中包含所述智能体。通过本公开提供的方法，能够生成质量较好的AI图形。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及文生图，尤其涉及一种图像生成方法、装置、设备、存储介质以及程序产品。

技术介绍

1、生成式人工智能(artificial intelligence generated content, aigc)是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术。aigc技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习，aigc可以根据用户输入的文字描述，生成与之相关的内容。然而，用户输入的文字描述通常比较单薄，导致所生成的ai图像的质量较差。

技术实现思路

1、本说明书实施例提供了一种图像生成方法、装置、设备和计算可读存储介质、计算机程序产品，能够生成质量较好的ai图形。

2、第一方面，本说明书一个或多个实施例提供一种图像生成方法，该方法包括：通过标签提取模型分别从智能体图像和/或智能体人设中获取所述智能体的标签信息；获取主题信息；通过语言模型根据所述标签信息和所述主题信息生成场景描述；通过文生图模型根据所述场景描述生成一帧人工智能图像，所述人工智能图像中包含所述智能体。

3、根据本说明书一些实施例提供的图像生成方法，所述获取主题信息包括：获取预先设定的主题信息；或者，随机生成所述主题信息；或者，根据所述智能体的标签信息获取所述主题信息。

4、根据本说明书一些实施例提供的图像生成方法，所述主题信息包括以下至少一项：日常场景主题、节日主题、职业主题、兴趣主题。

5、根据本说明书一些实施例提供的图像生成方法，所述主题信息包括至少两类主题信息，且不同类主题信息的等级不同。

6、根据本说明书一些实施例提供的图像生成方法，还包括：通过所述语言模型根据所述标签信息和所述不同类主题信息分别生成不同的场景描述；通过所述文生图模型分别根据所述不同的场景描述生成对应每一类主题信息的多帧ai图像；其中，不同等级的主题信息所对应的所述ai图像的数量不同，等级越高的主题类型对应的所述ai图像的数量越少。

7、根据本说明书一些实施例提供的图像生成方法，所述标签信息包括所述智能体的以下至少一种标签信息：年龄、职业、性格、兴趣、身材、衣服、动作、表情。

8、根据本说明书一些实施例提供的图像生成方法，所述通过语言模型根据所述标签信息和所述主题信息生成场景描述，包括：根据所述标签信息和所述主题信息生成至少一项以下补充信息：场景信息、构图信息、智能体的姿态信息、服装配饰信息，所述场景描述包括所述补充信息。

9、根据本说明书一些实施例提供的图像生成方法，还包括：通过风格提取模型从所述智能体图像获取图像风格信息；所述通过文生图模型根据所述场景描述生成一帧人工智能图像，包括：通过所述文生图模型，根据所述场景描述和所述图像风格信息生成一帧人工智能图像。

10、根据本说明书一些实施例提供的图像生成方法，所述风格信息包括以下至少一项：配色信息、局部纹理信息、材质信息、笔触信息、光照信息、构图信息。

11、根据本说明书一些实施例提供的图像生成方法，还包括：从所述智能体图像获取所述智能体的面部特征，所述通过文生图模型根据所述场景描述生成一帧人工智能图像，包括：通过所述文生图模型，根据所述场景描述和所述面部特征生成一帧人工智能图像。

12、根据本说明书一些实施例提供的图像生成方法，所述分别从智能体图像和/或智能体人设中获取智能体的标签信息，之前还包括：通过面部提取模型从参考图像中提取目标角色的面部特征；获取用户输入的文字描述；根据所述目标角色的面部特征和所述文字描述生成所述智能体图像。

13、第二方面，本说明书一个或多个实施例提供了一种图像生成装置，包括：标签提取模型，用于分别从智能体图像和/或智能体人设中获取智能体的标签信息；第一获取模块，用于获取主题信息；语言模型，用于根据所述标签信息和所述主题信息生成场景描述；文生图模型，用于根据所述场景描述生成一帧人工智能图像，所述人工智能图像中包含所述智能体。

14、第三方面，本说明书一个或多个实施例提供了一种图像生成设备，包括：处理器和存储器，所述存储器上存储有可执行代码，当所述可执行代码被所述处理器处理时，可以使所述处理器执行任意一项所述的方法。

15、第四方面，本说明书一个或多个实施例提供了一种计算机可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述电子设备执行任意一项所述的方法。

16、第五方面，本说明书一个或多个实施例提供了一种计算机程序产品，包括计算机程序或计算机可执行指令，所述计算机程序或计算机可执行指令被处理器执行时，实现任一项所述的方法。

17、本说明书实施例提供的一种图像生成方法以及相关装置、设备、计算机可读存储介质和计算机程序产品，通过从智能体图像和/或智能体人设中获取智能体的标签信息，将该标签信息和主题信息先输入到语言模型中以进行场景描述扩写，再根据该场景描述利用文生图模型来生成具有该主题和该智能体的人工智能图像。相比用户直接针对智能体图像撰写场景描述再生成人工智能图像而导致的撰写时长长且撰写质量不稳定导致的生成的人工智能图像质量不稳定，本说明书实施例能够高效快速生成高质量的人工智能图像。

本文档来自技高网...

【技术保护点】

1.一种图像生成方法，其特征在于，包括：

2.根据权利要求1所述的图像生成方法，其特征在于，所述获取主题信息包括：

3.根据权利要求1所述的图像生成方法，其特征在于，所述主题信息包括以下至少一项：日常场景主题、节日主题、职业主题、兴趣主题。

4.根据权利要求1所述的图像生成方法，其特征在于，所述主题信息包括至少两类主题信息，且不同类主题信息的等级不同；

5.根据权利要求1所述的图像生成方法，其特征在于，所述标签信息包括所述智能体的以下至少一种标签信息：年龄、职业、性格、兴趣、身材、衣服、动作、表情。

6.根据权利要求1所述的图像生成方法，其特征在于，所述通过语言模型根据所述标签信息和所述主题信息生成场景描述，包括：

7.根据权利要求1所述的图像生成方法，其特征在于，所述方法还包括：

8.根据权利要求7所述的图像生成方法，其特征在于，所述风格信息包括以下至少一项：

9.根据权利要求1所述的图像生成方法，其特征在于，所述方法还包括：

10.根据权利要求1所述的图像生成方法，其特

11.一种图像生成装置，其特征在于，包括：

12.一种图像生成设备，其特征在于，包括：

13.一种计算机可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述电子设备执行如权利要求1至10中任意一项所述的方法。

14.一种计算机程序产品，包括计算机程序或计算机可执行指令，其特征在于，所述计算机程序或计算机可执行指令被处理器执行时，实现权利要求1至10任一项所述的方法。

...

【技术特征摘要】

1.一种图像生成方法，其特征在于，包括：

2.根据权利要求1所述的图像生成方法，其特征在于，所述获取主题信息包括：

3.根据权利要求1所述的图像生成方法，其特征在于，所述主题信息包括以下至少一项：日常场景主题、节日主题、职业主题、兴趣主题。

4.根据权利要求1所述的图像生成方法，其特征在于，所述主题信息包括至少两类主题信息，且不同类主题信息的等级不同；

6.根据权利要求1所述的图像生成方法，其特征在于，所述通过语言模型根据所述标签信息和所述主题信息生成场景描述，包括：

7.根据权利要求1所述的图像生成方法，其特征在于，所述方法还包括：...

【专利技术属性】
技术研发人员：王志浩，周彧聪，杨斌，
申请(专利权)人：北京稀宇极智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人