【技术实现步骤摘要】
图像实时风格迁移方法、装置、计算机设备和存储介质
[0001]本申请涉及图像处理
,特别是涉及一种图像实时风格迁移方法、装置、计算机设备和存储介质。
技术介绍
[0002]自Gatys等人在2015年首次将深度学习技术应用到图像风格迁移领域后,风格迁移开始吸引学术界和工业界日益增长的兴趣。该领域的一个核心问题是将一幅任意给定的风格图像的艺术风格迁移到另一张目标内容图像上,这称为任意风格迁移。通过利用预先训练的深度卷积神经网络(如VGG)的显著特征表达能力,现有的任意风格迁移算法已经能够在任意图像上实现令人满意的风格化效果。然而,大型的预训练深度神经网络产生了高昂的计算成本,这阻碍了当前的任意风格迁移方法在实际场景中的应用,如处理超高分辨率/超高清(如4096
×
2160像素,或“4K”)的图像。
[0003]一些方法为解决这一困境做出了宝贵的努力,一种做法是在不损失太多性能的情况下压缩大型的预训练深度神经网络模型。Wang等人在2020年提出使用协同蒸馏技术减少VGG网络的卷积滤波器,成功地在单个12GB显存的GPU显卡上渲染超高分辨率图像。虽然内存消耗显著减少,但压缩后的模型往往速度不够快。另一种解决方案是将超高分辨率的图像划分成若干小块(Patch),然后再对各个小块单独进行风格迁移。该方法虽然可以实现任意分辨率的风格迁移,但仍然存在效率问题。另外,还有一些方法设计了用于风格转换的轻量级网络,然而,由于它们的风格特征仍然是从大型的预训练VGG中提取的,因此它们本质上很难处理超高分辨
【技术保护点】
【技术特征摘要】
1.图像实时风格迁移方法,其特征在于,包括:步骤1,利用微型内容编码器提取内容图像的内容特征f
c
;步骤2,利用微型风格编码器提取风格图像的风格特征f
s
;步骤3,利用风格调制器将风格特征f
s
转换成风格调制信号m
s
;步骤4,利用微型解码器处理所述内容特征f
c
和风格调制信号m
s
,得到风格迁移后的图像。2.根据权利要求1所述的图像实时风格迁移方法,其特征在于,所述微型内容编码器包括:一个步长为1,卷积核大小为9
×
9的标准卷积层;两个步长为2,卷积核大小为3
×
3的深度可分离卷积层;两个步长为1的残差块;所述标准卷积层、深度可分离卷积层以及残差块串联连接,最后一个残差块的输出即为所提取的内容特征。3.根据权利要求1所述的图像实时风格迁移方法,其特征在于,所述微型风格编码器包括:一个步长为1,卷积核大小为9
×
9的标准卷积层;两个步长为2,卷积核大小为3
×
3的深度可分离卷积层;两个步长为1的残差块;所述标准卷积层、深度可分离卷积层以及残差块串联连接,最后一个残差块的输出即为所提取的风格特征。4.根据权利要求1所述的图像实时风格迁移方法,其特征在于,所述风格调制器包括:权重子网络ξ
w
和偏置子网络ξ
b
;所述权重子网络ξ
w
包括:一个步长为1,卷积核大小为1
×
1的标准卷积层;一个全局池化层;所述偏置子网络ξ
b
包括:一个步长为1,卷积核大小为1
×
1的标准卷积层;一个全局池化层;所述风格调制器利用如下算法将风格特征f
s
转换成风格调制信号m
s
:m
s
=(μ(f
s
),σ(f
s
),ξ
w
(f
s
),ξ
b
(f
s
))式中:μ(f
s
)为所述风格特征f
s
的均值;σ(f
s
)为所述风格特征f
s
的标准差;ξ
w
(f
s
)为利用所述权重子网络ξ
w
提取出的权重参数;ξ
b
(f
s
)为利用所述偏置子网络ξ
b
提取出的偏置参数。5.根据权利要求1所述的图像实时风格迁移方法,其特征在于,所述微型解码器包括:两个步长为1的残差块;两个带上采样操作的卷积核大小为3
×
3的深度可分离卷积层;一个步长为1,卷积核大小为9
×
9的标准卷积层;
所述残差块、深度可分离卷积层以及标准卷积层串联连接,最后一个标准卷积层的输出即为所述风格迁移后的图像。6.根据权利要求5所述...
【专利技术属性】
技术研发人员:赵磊,王志忠,仇礼鸿,张惠铭,莫启航,林思寰,陈海博,李艾琳,左智文,邢卫,鲁东明,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。