一种基于语义分割和深度学习的图片背景风格迁移方法技术

技术编号：24412899 阅读：36 留言：0更新日期：2020-06-06 10:03

本发明专利技术提供一种基于语义分割和深度学习的图片背景风格迁移方法。本发明专利技术首先选择内容图片和风格图片并进行图片预处理；然后通过ResNet网络由内容图片和风格图片直接计算的到一张相对比较接近结果的图片；然后通过VGG‑19网络获得风格约束和内容约束，根据损失函数进行梯度下降，通过多次迭代的方式获得背景风格迁移结果，最后将迁移结果放回图片上。本发明专利技术速度提高了上百倍，可扩展性强，对局部区域进行风格迁移，保留了图像主体内容，以达到突出主体，增强图像艺术表现力的效果，代码易读性和可移植性强。

An image background style transfer method based on semantic segmentation and deep learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语义分割和深度学习的图片背景风格迁移方法
本专利技术涉及深度学习领域，具体涉及一种基于语义分割和深度学习的图片背景风格迁移方法。
技术介绍
基于神经网络的图像风格迁移在2015年由Gatysetal.提出。Gatys当时的论文创新点只有一个，但是对于风格迁移和图像纹理生成这个领域又具有非常重大的意义：论文提出了一种用深度学习来给纹理建模的方法。在这之前的科学家一直希望能找到一个使得纹理能够通过局部统计模型来描述的方法，而手动建模过于复杂且泛用性极差。Gatys从物体识别相关领域的论文得到启发，发现VGG19网络可以被认为是许多局部特征识别器，并且经过实验验证之后发现这些特征识别器在风格迁移领域表现也非常好。但是Gatys的方法也有显而易见的问题和一些不足之处，最主要的就是原始方法的迁移速度非常慢，即使用2019年最顶级的GPU运行也需要将近二十分钟，在普通的CPU上甚至需要超过十二小时才能完成一张512*512大小的图片的风格迁移。还有一点比较不足的地方在于Gatys的方法进行迁移的时候就只能对整张图片进行迁移，无法做到对某个特征的目标进行风格迁移而保持其他对象不变。
技术实现思路
针对现有技术中存在的不足，本专利技术提供一种基于语义分割和深度学习的图片背景风格迁移方法。本专利技术的目的是在进行图像风格迁移时只对图像背景进行迁移，用以突出主体，增强图像的艺术表现力。为了实现上述技术目的，本专利技术的技术方案是，一种基于语义分割和深度学习的图片背景风格迁移方法，包括以...

【技术保护点】
1.一种基于语义分割和深度学习的图片背景风格迁移方法，其特征在于，包括以下步骤：/n步骤(1)、选择内容图片和风格图片并进行图片预处理；/n步骤(2)、将预处理后的内容图片和风格图片分别输入至ResNet-50网络中，并且在最后一层池化层输出之后将内容图片和风格图片输出结果

【技术特征摘要】
1.一种基于语义分割和深度学习的图片背景风格迁移方法，其特征在于，包括以下步骤：
步骤(1)、选择内容图片和风格图片并进行图片预处理；
步骤(2)、将预处理后的内容图片和风格图片分别输入至ResNet-50网络中，并且在最后一层池化层输出之后将内容图片和风格图片输出结果和进行加权相加，公式为

将输入到ResNet-50进行上采样，得到跟输入的图片大小相同的图片
步骤(3)、将风格图片输入至VGG-19网络中，获得风格约束；
步骤(4)、将内容图片输入至VGG-19网络中，获得内容约束；
步骤(5)、为了将风格图片的风格迁移到内容图片上，采用步骤(2)得到的输出图片作为待合成的图像，该图像同时匹配的内容表示和的风格表示，将其输入VGG-19网络中，使用损失函数计算步骤(3)得到的风格约束与步骤(2)得到的输出图片的损失和步骤(4)得到的内容约束与步骤(2)得到的输出图片的损失再将两者乘以系数之后相加；使用梯度下降算法来对该损失函数进行优化；总体的风格迁移通过共同最小化三者之间的欧式距离来进行；总的损失函数如下：

其中α和β分别是内容和风格重建的权重因子；
步骤(6)、重复步骤(5)进行10次迭代计算，使得步骤(2)得到的输出图片经过迭代之后的输出在内容上尽可能相似于内容图片而在风格上相似于风格图片；
步骤(7)、最后将分割的到的主体放回经过风格迁移的背景上。

2.根据权利要求1所述的一种基于语义分割和深度学习的图片背景风格迁移方法，其特征在于，步骤(1)具体方法如下：
选取一张主体明确的图片作为内容图片，采用U-Net网络对内容图片进行语义分割，其中U-Net的骨干网络选择为ResNet-18；将网络的输出类别数设置为2，定义分类所需要的softmax函数：

式中，ak(x)表示每个像素点对应特征通道的得分，K为类的数量，pk(x)是对类k的对像素点分类的结果，softmax函数用于在神经网络计算完成之后对计算结果进行分类输出，在通过softmax之前，数据的表现为一个一维的激活数据体，经过softmax之后输出的结果将会映射到相应的类别上，并形成主体和背景的不同标记；分割出主体后使用全图减去主体，得到一张去除主体而仅留下背景的内容图片；
选取需要获得其背景风格的风格图片，为了使得效果比较好，一...

【专利技术属性】
技术研发人员：颜成钢，郑鑫磊，孙垚棋，张继勇，张勇东，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人