一种基于对抗训练的图像语义分割方法技术

技术编号：17408749 阅读：23 留言：0更新日期：2018-03-07 06:00

本发明专利技术属于计算机视觉技术领域，公开了一种基于对抗训练的图像语义分割方法，用于解决现有语义分割方法不能实现图像全局信息和局部信息的有意义融合以及不能进行学习图像中的高阶势能的问题。本发明专利技术由于基于对抗训练网络来定义整个网络的损失函数，作为通用函数逼近器的对抗网络，不仅可以学习如何组合不同层的信息，而且还可以“迫使”生成网络学习到分割图片中的单点、配对、高阶势能等信息，实现图像局部台特征和全部特征的有机融合，得到效果更加逼真的分割图像；同时逐层训练的方法，避免了复杂的网络初始化参数过程，使得整个网络可以使用随机初始化的方法。

A method of image semantic segmentation based on confrontation training

The invention belongs to the technical field of computer vision, discloses an image segmentation method based on semantic confrontation training, used to solve the image of global information and local information methods fail to segment the existing semantic meaningful fusion and cannot learn the higher-order potential problem in image. Due to the loss of function of network confrontation training based on the definition of the whole network, as a general function approximator against the network, not only can learn how to combine different layers of information, but also can be \forced\ to generate network learning in the image segmentation, single point matching, high order potential information, realize the organic integration between the local image the characteristics and all of the characteristics, get the segmentation effect more vivid image; at the same time, the training method of layer by layer, avoids the network initialization parameters of the complex process of the whole network can use the method of random initialization.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于对抗训练的图像语义分割方法
本专利技术属于计算机视觉
，涉及图像语义分割和对抗训练，具体涉及一种基于对抗训练的图像语义分割方法。
技术介绍
随着人工智能的发展及普及，图像语义分割在计算机视觉领域的重要地位日渐凸显。许多应用都需要精确、高效的分割技术，如自动驾驶，室内导航，人机交互等等。近五年来，深度学习方法在计算机视觉领域取得巨大成功，各种网络结构被相继提出用以解决该领域的不同问题，如图像分类、定位等。然而，计算机视觉领域最成功的网络结构卷积神经网络(ConvolutionalNeuralNetwork，CNN)对于图像语义分割来说，有一个重大的缺点：由于网络结构中大量的最大池化层堆叠，CNN最后获取的特征是整张图片的信息，而忽略了图片的局部特征，如图片中物体的边缘、位置等信息。诚然，CNN的特征不变性正是分类定位任务所要求的，然而图像语义分割指的是将图片中每个像素点归为一个类别，这就要求在获取全局特征的同时，保留局部特征。所以，当CNN直接运用到图像语义分割时，往往不能取得特别好的效果。并且CNN最后的分割结果，各像素之间的预测值往往是相互独立的，这也使得最后的分割结果很难保留原始图片的细节信息。在现有的比较常见的解决上述问题的方法中，大致可归于以下三类；跨层连接：这是指从卷积神经网络的中间层获取图片局部特征，与网络的高层的全局特征进行融合，这样最后生成的分割图像会保留一部分细节信息。条件随机场：这是一种概率图模型，它利用CNN的分割结果来定义单点势能以及配对势能，接着进行推断来得到模型参数，这种方法迫使CNN的分割结果具有空间上的连续性，...
一种基于对抗训练的图像语义分割方法

【技术保护点】
一种基于对抗训练的图像语义分割方法，其特征在于，包括如下步骤：步骤1：将原始图像输入到卷积神经网络进行前向传递，得到低分辨率分割图像；步骤2：将步骤1中得到的低分辨率分割图像进行上采样，然后将该上采样与卷积神经网络的中间特征层连接得到连接特征层，再将连接特征层进行1×1卷积操作得到新的分割结果；然后将得到的新的分割结果与真实图像下采样分割结果进行对抗训练，对抗训练包括生成网络G和判别网络D，利用梯度下降算法分别更新生成网络G的参数及判别网络D的参数，直至对抗训练的网络损失函数收敛；步骤3：根据步骤2中的选取的上采样次数确定对抗训练中网络的层数，根据网络的层数确定步骤2重复的次数。

【技术特征摘要】
1.一种基于对抗训练的图像语义分割方法，其特征在于，包括如下步骤：步骤1：将原始图像输入到卷积神经网络进行前向传递，得到低分辨率分割图像；步骤2：将步骤1中得到的低分辨率分割图像进行上采样，然后将该上采样与卷积神经网络的中间特征层连接得到连接特征层，再将连接特征层进行1×1卷积操作得到新的分割结果；然后将得到的新的分割结果与真实图像下采样分割结果进行对抗训练，对抗训练包括生成网络G和判别网络D，利用梯度下降算法分别更新生成网络G的参数及判别网络D的参数，直至对抗训练的网络损失函数收敛；步骤3：根据步骤2中的选取的上采样次数确定对抗训练中网络的层数，根据网络的层数确定步骤2重复的次数。2.根据权利要求1所述的基于对抗训练的图像语义分割方法，其特征在于，对抗训练的网络损失函数定义如下：其中x代表的真实数据，G(z)表示生成网络生成的数据；D(·)指的是将数据x或G(z)输入判别网络D，判别网络D输出结果取值为[0，1]，判别网络D输出结果取值表示输入是真实数据的可能性；生成...

【专利技术属性】
技术研发人员：高建彬，邓泽露，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人