System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图像风格迁移领域,尤其涉及一种基于文本反演的内容语义分离图像风格表征学习方法及装置。
技术介绍
1、近年来,大规模预训练文生图扩散模型在文本到图像生成领域取得了进展,能够在文本的驱动下生成逼真的、多样化的图像内容。目前有一类基于文生图扩散模型的风格迁移方法,通常首先基于文本反演(textual inversion)技术,学习风格文本表示来表征参考风格图像的风格。在学习微调后,再使用该风格文本表示为条件控制图像生成过程以实现风格迁移。但现有方法学习到的风格文本表示中常常包含参考风格图像的内容语义信息,使得其引导生成的风格化图像容易混有参考风格图像的内容语义干扰。该问题被称为风格表征学习中的内容泄露问题。因此,如何在基于文本反演的风格文本表示学习过程中将内容语义信息从风格文本表示中分离出来,是解决这个问题的关键。
技术实现思路
1、本专利技术目的在于针对现有技术的不足,提出一种基于文本反演的内容语义分离图像风格表征学习方法及装置,以解决图像风格表征学习过程中内容语义泄露的问题。
2、本专利技术的目的是通过以下技术方案来实现的:第一方面,本专利技术提供了一种基于文本反演的内容语义分离图像风格表征学习方法,该方法包括以下步骤:
3、(1)获取原始的参考风格图像,基于图像风格编码器网络和图像内容编码器网络分别提取风格特征和内容特征;
4、(2)对原始的参考风格图像进行保留风格特征而破坏内容语义的数据增强,基于图像风格编码器网络提取风格特征;<
...【技术保护点】
1.一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,步骤(2)中,对原始的参考风格图像进行数据增强包括如下步骤:
3.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,步骤(3)中,对原始的参考风格图像进行数据增强得到一组保留原始的参考风格图像的内容语义信息而改变原始的参考风格图像的风格信息图像,具体包括以下方法:
4.根据权利要求2或3所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,风格信息包括全局颜色分布和局部纹理细节。
5.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,基于图像风格编码器网络提取原始的参考风格图像的风格特征,并将风格特征经过一个风格适配器网络得到最终的风格文本表示,该风格文本表示排除了原始的参考风格图像中的内容语义干扰。
6.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格
7.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,步骤(5)中,使用参考风格图像得到的风格文本表示为条件进行文本到图像风格迁移;具体的,构建文本提示描述想要生成的内容,并将附在文本提示后,构造文本提示=“, ”或“ in the style of ”,将送入预训练文生图扩散模型以进行文本到图像生成;或将参考内容图像通过DDIM inversion后得到对应的反转噪声,使用此反转噪声为初始噪声,并提供风格文本表示作为条件进行图像风格迁移。
8.一种基于文本反演的内容语义分离图像风格表征学习装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,其特征在于,所述处理器执行所述可执行代码时,实现如权利要求1-7中任一项所述的一种基于文本反演的内容语义分离图像风格表征学习方法。
9.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时,实现如权利要求1-7中任一项所述的一种基于文本反演的内容语义分离图像风格表征学习方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7任一项所述的一种基于文本反演的内容语义分离图像风格表征学习方法。
...【技术特征摘要】
1.一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,步骤(2)中,对原始的参考风格图像进行数据增强包括如下步骤:
3.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,步骤(3)中,对原始的参考风格图像进行数据增强得到一组保留原始的参考风格图像的内容语义信息而改变原始的参考风格图像的风格信息图像,具体包括以下方法:
4.根据权利要求2或3所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,风格信息包括全局颜色分布和局部纹理细节。
5.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,基于图像风格编码器网络提取原始的参考风格图像的风格特征,并将风格特征经过一个风格适配器网络得到最终的风格文本表示,该风格文本表示排除了原始的参考风格图像中的内容语义干扰。
6.根据权利要求1所述的一种基于文本反演的内容语义分离图像风格表征学习方法,其特征在于,步骤(4)中,训练过程和损失函数设计如下:
7.根据权利...
【专利技术属性】
技术研发人员:左智文,王璇,王勋,张荣,金小刚,
申请(专利权)人:浙江工商大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。