【技术实现步骤摘要】
图像生成方法及装置
[0001]本说明书的一个或多个实施例涉及人工智能领域,特别的涉及一种图像生成方法及装置
。
技术介绍
[0002]随着互联网的发展,基于扩散模型的图像生成方法在
AIGC
领域取得了重大突破,推动了
AIGC
技术从学术界向工业界迈进
。
[0003]但是,目前
AIGC
图像生成方面,主要有两种不同的技术路径,包括基于隐空间扩散的
AIGC
图像生成方法和直接在图像空间进行扩散的
AIGC
图像生成方法,两者各有优点但无法兼顾,比如前者无法对一些图像细节进行较好的控制,而后者往往需要耗费大量的计算资源和时间
。
技术实现思路
[0004]针对现有技术中存在的问题,本专利技术实施例提供一种图像生成方法及装置
。
[0005]第一方面,本说明书实施例提供了一种图像生成方法,包括:
[0006]构建图像训练的初级模型,所述初级模型包含图像空间的扩散模型和隐空间的扩散模型;
[0007]将
prompt
输入所述初级模型,获取所述初级模型训练过程中的第一损失函数,并以所述第一损失函数作为收敛函数进行训练,得到关联的初级模型;
[0008]对关联的初级模型进行联合训练,得到双重扩散模型;
[0009]将所述
prompt
输入双重扩散模型,获取所述双重扩散模型训练过程中的第二损失函数,并以所述第二损 ...
【技术保护点】
【技术特征摘要】
1.
一种图像生成方法,其中,包括:构建图像训练的初级模型,所述初级模型包含图像空间的扩散模型和隐空间的扩散模型;将
prompt
输入所述初级模型,获取所述初级模型训练过程中的第一损失函数,并以所述第一损失函数作为收敛函数进行训练,得到关联的初级模型;对关联的初级模型进行联合训练,得到双重扩散模型;将所述
prompt
输入双重扩散模型,获取所述双重扩散模型训练过程中的第二损失函数,并以所述第二损失函数作为收敛函数进行训练,得到输出的标准图像;获取资源信息,结合所述标准图像,资源信息计算所述双重扩散模型的层权重,并以所述层权重对所述双重扩散模型训练过程进行优化,得到优化后的双重扩散模型输出的目标图像
。2.
根据权利要求1所述的方法,其中,所述方法还包括:所述初级模型包括大规模模型
、
基础模型
、
关联映射模块,所述大规模模型
、
基础模型分别包括图像空间的扩散模型和隐空间的扩散模型
。3.
根据权利要求2所述的方法,其中,所述初级模型训练过程,包括:将
prompt
输入大规模模型中的图像空间的扩散模型和隐空间的扩散模型,输出对应的大规模图像;将
prompt
输入基础模型中的图像空间的扩散模型和隐空间的扩散模型,输出对应的基础图像;将所述大规模图像和基础图像中的隐空间输入所述关联映射模块,输出初级图像
。4.
根据权利要求3所述的方法,其中,所述将所述大规模图像和基础图像中的隐空间输入所述关联映射模块,输出初级第一图像,包括:将所述大规模图像和基础图像中的隐空间输出作为所述关联映射模块的输入数据,所述大规模图像和基础图像中的图像空间输出作为拟合对象,输出拟合后的初级图像
。5.
根据权利要求3所述的方法,其中,所述第一损失函数,包括:获取所述初级模型训练过程中产生的扩散损失
、
蒸馏损失
、
关联损失,生成对应的第一损失函数
。6.
根据权利要求1所述的方法,其中,所述方法还包括:所述双重扩散模型包括图像空间的基础扩散模型
、
隐空间的基础扩散模型
、
路径交互模型
、
融合输出模型
。7.
根据权利要求6所述的方法,其中,所述双重扩散模型训练过程,包括:将
prompt
输入所述图像空间的基础扩散模型和隐空间的基础扩散模型进行训练,获取所述图像空间的基础扩散模型和隐空间的基础扩散模型的中间层特征;将所述中间层特征输入所述路径交互模型,输出交互后的中间层特征,并以交互后对的中间层特征替换原中间层特征;获取所述图像空间的基础扩散模型和隐空间的基础扩散模型输出的过程图像,并将所述过程图像输入融合输出模型,得到对应的标准图像
。8.
根据权利要求1所述的方法,其中,所述结合所述标准图像,资源信息计算所述双重扩散模型的层权重,并以所述层权重对所述双重扩散模型训练过程进行优化,包括:
将所述标准图像输入所述双重扩散模型,输出训练后的标准图像,并获取产生的第二损失函数;将所述资源信息输入路径权重优化模块,输出层权重,并获取产生的权重稀疏损失;以所述第二损失函数和权重稀疏损失作为收敛函数进行训练,直至收敛函数收敛,得到优化后的双重扩散模型
。9.
一种图像生成装置,其中,包括:初级模型构建模块,配置为构建图像训练的初级模型,所述初级模型包含图像空间的扩散模型和隐空间的扩散模型;初级模型训练模块,配置为将
prompt
输入所述初级模型,获取所述初级模型训练过程中的第一损失函数,并以所述第一损失函数作为收敛函数进行训练,得到关联的初级模型;联合训练模块,配置为对关联的初级模...
【专利技术属性】
技术研发人员:曹佳炯,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。