一种图片生成方法、电子设备、介质技术

技术编号：42971897 阅读：22 留言：0更新日期：2024-10-15 13:13

本发明专利技术公开了一种图片生成方法、电子设备、介质，所述方法包括以下步骤：获取原始文本、第一概念以及与第一概念含义相反的第二概念；对原始文本、第一概念、第二概念进行编码，得到原始文本向量、第一概念向量、第二概念向量；将第一概念向量、第二概念向量相减，得到概念渲染向量；将概念渲染向量经缩放后与原始文本向量相加，得到渲染文本向量；在原始文本前拼接可学习前缀，得到目标文本；对目标文本进行编码，得到目标文本向量；通过最大化渲染文本向量与目标文本向量之间的余弦相似度，得到与渲染文本最相近的最优目标文本；将原始文本与最优目标文本分别输入至文生图模型，得到原始图片以及目标图片。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习，尤其涉及一种图片生成方法、电子设备、介质。

技术介绍

1、文生图模型(如stablediffusion)由于其出色的生成能力而受到广泛关注。文生图模型可以根据用户输入的文本创作出效果惊人的艺术作品。应用范围涉及场景设计、动画创作、3维场景生成等。然而，由于生成的图片和文本是一对一的关系，用户生成图片之后很难对自己生成的图片进行二度创作或进行自定义风格的图片风格迁移。因此，如何让用户对自己的创作作品完成自定义的风格修改变成了一个厄待解决的问题。

2、现有的工作(如diffusion inversion或dreambooth)可以实现用户自定义的风格修改，然而，他们需要对整个网络进行微调，来将用户原始文本中的实体保存下来以复用到风格迁移任务。但这种微调是耗时且消耗额外的训练资源的。

技术实现思路

1、针对现有技术不足，本专利技术实施例提供了一种图片生成方法、电子设备、介质。

2、第一方面，本专利技术实施例提供了一种图片生成方法，所述方法包括以下步骤：

3、获取原始文本、第一概念以及与第一概念含义相反的第二概念；对原始文本、第一概念、第二概念进行编码，得到原始文本向量、第一概念向量、第二概念向量；

4、将第一概念向量、第二概念向量相减，得到概念渲染向量；将概念渲染向量经缩放后与原始文本向量相加，得到渲染文本向量；

5、在原始文本前拼接可学习前缀，得到目标文本；对目标文本进行编码，得到目标文本向量；

...

【技术保护点】

1.一种图片生成方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的一种图片生成方法，其特征在于，将概念渲染向量经缩放后与原始文本向量相加，得到渲染文本向量包括：

3.根据权利要求1所述的一种图片生成方法，其特征在于，在原始文本前拼接可学习前缀，得到目标文本包括：

4.根据权利要求1所述的一种图片生成方法，其特征在于，通过最大化渲染文本向量与目标文本向量之间的余弦相似度，得到与渲染文本最相近的最优目标文本包括：

5.根据权利要求3所述的一种图片生成方法，其特征在于，得到与渲染文本最相近的最优目标文本的过程还包括：

6.一种电子设备，包括存储器和处理器，其特征在于，所述存储器与所述处理器耦接；其中，所述存储器用于存储程序数据，所述处理器用于执行所述程序数据以实现上述权利要求1-5任一项所述的图片生成方法。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-5中任一所述的图片生成方法。

8.一种计算机程序产品，包括计算机程序/指令，其特

...

【技术特征摘要】

1.一种图片生成方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的一种图片生成方法，其特征在于，将概念渲染向量经缩放后与原始文本向量相加，得到渲染文本向量包括：

3.根据权利要求1所述的一种图片生成方法，其特征在于，在原始文本前拼接可学习前缀，得到目标文本包括：

5.根据权利要求3所述的一种图片生成方法，其特征在于，得到与渲...

【专利技术属性】
技术研发人员：马嘉晨，赵俊博，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人