一种基于生成对抗网络的目标域导向的无监督图像转换方法技术

技术编号：22309291 阅读：32 留言：0更新日期：2019-10-16 09:18

本发明专利技术提供一种基于生成对抗网络的目标域导向的无监督图像转换方法，属于计算机视觉领域。本发明专利技术用来实现无监督的跨领域图像到图像的转换任务，属于计算机视觉领域。本方法设计了一个自编码重构网络，通过最小化源域图像的重构损失来提取源域图像的分层表征。同时，通过权值共享策略，共享网络模型中的两组生成对抗网络中编码和解码高层语义信息的网络层的权值，以保证输出图像能够保留输入图像的基本结构和特征。然后，两个判别器分别用来区分输入图像是各自领域的真实图像还是生成的图像。本方法能够有效进行无监督的跨域图像转换，生成高质量的图像。实验证明所提方法在CelebA等标准数据集上取得了很好的结果。

An unsupervised image transformation method based on the target domain guidance of the generation countermeasure network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络的目标域导向的无监督图像转换方法
本专利技术属于计算机视觉领域，涉及一种基于生成对抗网络的无监督图像转换方法。
技术介绍
随着移动设备的普及以及互联网带宽的快速增长，图形图像数据呈现爆炸式地增长，它们承载着海量待挖掘的信息。近年来，计算机视觉领域的研究迅速发展，特别是随着生成对抗网络的发展，图像转换问题也引起了广泛的关注。图像转换是指将图像从一种表示场景转换到另一种表示场景，同时保持图像的内容不发生改变。很多计算机视觉、计算机图形学和图像处理领域的问题其实都可以理解为是图像转换问题，例如，图像着色可以看做是将灰度图转换为其对应的彩色图；图像修复可以看做是将有缺失的图像补全到其对应的完整图像；图像高分辨率可以看做是将低分辨率的图像转换为其相对应的高分辨率的图像，图像风格转换则可以看做是在保留原图像基本特征的情况下，将图像转化为另一种风格的图像等等，诸如此类的工作还有很多。而这些任务，在我们的生产生活中都是广泛存在的。传统的算法大多是针对特定的问题而设计，并且只能用于特定的应用场景。后来，随着卷积神经网络(ConvolutionalNeuralNetworks，CNNs)的发展，越来越多的图像转换问题得以解决。但由于不同任务的建模方式以及其优化设计都不尽相同，这使得图像转换问题的任务负担仍十分巨大。一种解决图像转换任务的方法是训练一个有监督的前向卷积神经网络，通过使用像素损失函数来测量输出图像与真实图像之间的差异，这也是最直观的方法之一。例如Dong等人提出了一种深度卷积神经网络模型来学习低分辨率图像和高分辨率图像之间的一个端到端映射，从而...

【技术保护点】
1.一种基于生成对抗网络的目标域导向的无监督图像转换方法，其特征在于，包括如下步骤：步骤一图像的预处理：从真实的源域数据分布pdata(x)中采样得到真实的源域图像x，从真实的目标域数据分布pdata(y)中采样得到真实的目标域图像y，对真实的源域图像x和真实的目标域图像y进行统一的处理，把它们缩放为统一的像素大小，同时对图像像素值进行归一化处理；步骤二生成图像：将归一化处理好的真实的源域图像x分别输入到两个生成器中，两个生成器为自编码重构网络Gr和转换网络Gt；其中，Gr通过重构输入的真实的源域图像x，来获得源域图像的分层表征；Gt则将输入的真实的源域图像x转换为目标域的图像；通过共享Gr与Gt中与高层语义信息相关的层级的参数，以保证源域图像和目标域图像的语义信息一致；

【技术特征摘要】
1.一种基于生成对抗网络的目标域导向的无监督图像转换方法，其特征在于，包括如下步骤：步骤一图像的预处理：从真实的源域数据分布pdata(x)中采样得到真实的源域图像x，从真实的目标域数据分布pdata(y)中采样得到真实的目标域图像y，对真实的源域图像x和真实的目标域图像y进行统一的处理，把它们缩放为统一的像素大小，同时对图像像素值进行归一化处理；步骤二生成图像：将归一化处理好的真实的源域图像x分别输入到两个生成器中，两个生成器为自编码重构网络Gr和转换网络Gt；其中，Gr通过重构输入的真实的源域图像x，来获得源域图像的分层表征；Gt则将输入的真实的源域图像x转换为目标域的图像；通过共享Gr与Gt中与高层语义信息相关的层级的参数，以保证源域图像和目标域图像的语义信息一致；其中，pdata(x)表示真实的源域数据分布，x表示真实的源域图像...

【专利技术属性】
技术研发人员：葛宏伟，姚瑶，周东清，张强，郭枫，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人