一种图像生成方法及相关装置制造方法及图纸

技术编号：39586935 阅读：6 留言：0更新日期：2023-12-03 19:38

本申请实施例公开了一种人工智能领域的图像生成方法及相关装置

全部详细技术资料下载

【技术实现步骤摘要】
一种图像生成方法及相关装置

[0001]本申请涉及人工智能
，尤其涉及一种图像生成方法及相关装置
。

技术介绍

[0002]生成式人工智能
(Artificial Intelligence Generated Content
，
AIGC)
是采用人工智能技术自动生成内容的一种方法，是继专业生产内容
、
用户生产内容之后的一种新型内容创作方式
。
[0003]在一些应用场景中，可以采用
AIGC
技术生成满足用户需求的图片，如相关技术中的
Stable
‑
diffusion
‑
webui
工具平台
、
秋叶训练脚本均可利用
AIGC
技术生成用户所需的图片
。
但是相关技术目前无法实现图片生成的全自动化，即无论是
Stable
‑
diffusion
‑
webui
工具平台，还是秋叶训练脚本，均需通过多个彼此割裂的功能模块来完成图片生成过程，在生成图片的过程中，需要用户手动设置功能模块的工作参数，且需要用户手动将各个功能模块的输出结果串联起来，对于用户来说，操作繁琐复杂
。

技术实现思路

[0004]本申请实施例提供了一种图像生成方法及相关装置，无需用户手动执行繁琐的图像生成步骤，而是能够自动化生成图像，对于用户来说，操作简单，使用体验大大提升
...

【技术保护点】

【技术特征摘要】
1.
一种图像生成方法，其特征在于，所述方法包括：获取所输入的基础参考数据；所述基础参考数据对应于目标风格；根据所述基础参考数据包括的基础参考图像数据，生成训练样本；所述训练样本中包括基于所述基础参考图像数据确定的训练图像
、
以及所述训练图像对应的训练标签；利用所述训练样本对基础图像生成模型进行训练，得到目标图像生成模型；所述基础图像生成模型是预先训练的，其用于执行普适性图像生成任务；所述目标图像生成模型用于生成具有所述目标风格的图像；通过所述目标图像生成模型，根据参考文本库中包括的参考文本，生成具有所述目标风格的目标图像
。2.
根据权利要求1所述的方法，其特征在于，所述根据所述基础参考数据包括的基础参考图像数据，生成训练样本，包括：当所述基础参考图像数据为多张基础参考图片时，对每张所述基础参考图片进行目标预处理操作，得到所述训练图像；当所述基础参考图像数据为基础参考视频时，从所述基础参考视频中抽取多张基础参考视频帧，对每张所述基础参考视频帧进行所述目标预处理操作，得到所述训练图像；针对每张所述训练图像，采用图片逆向标签算法，根据所述训练图像，确定所述训练图像对应的训练标签
。3.
根据权利要求2所述的方法，其特征在于，所述目标预处理操作包括：当基础参考图像的尺寸不满足预设尺寸比例时，通过人脸识别算法识别所述基础参考图像中的角色面部区域；所述基础参考图像包括所述基础参考图片
、
或者所述基础参考视频帧；基于所述角色面部区域，对所述基础参考图像进行裁剪处理，得到满足所述预设尺寸比例的基础参考角色图像
。4.
根据权利要求2或3所述的方法，其特征在于，所述目标预处理操作包括：当基础参考图像的分辨率低于目标分辨率阈值时，采用图片超分辨率算法，按照目标分辨率倍数对所述基础参考图像的分辨率进行放大处理；所述目标分辨率倍数根据所述目标分辨率阈值和所述基础参考图像的分辨率确定；所述基础参考图像包括所述基础参考图片
、
或者所述基础参考视频帧
、
或者基于所述基础参考图片或所述基础参考视频帧中的角色面部区域确定的基础参考角色图像
。5.
根据权利要求2所述的方法，其特征在于，所述采用图片逆向标签算法，根据所述训练图像，确定所述训练图像对应的训练标签，包括：采用所述图片逆向标签算法，根据所述训练图像，生成所述训练图像对应的描述文本标签；根据所述训练图像包括的虚拟角色，确定所述训练图像对应的角色标识标签；利用所述训练图像对应的所述角色标识标签和所述描述文本标签，确定所述训练图像对应的训练标签
。6.
根据权利要求1所述的方法，其特征在于，所述基础图像生成模型中包括第一冻结结构和第二冻结结构，所述第一冻结结构原始的高维模型参数通过对应的低维模型参数表示；所述利用所述训练样本对基础图像生成模型进行训练，得到目标图像生成模型，包括：
利用所述训练样本对所述...

【专利技术属性】
技术研发人员：王双坤，刘文双，刘赣，罗鑫骥，付锦华，尹存祥，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人