本发明专利技术公开了用于图像分类的基于角度正则化对齐的域适应方法。首先提取源域和目标域图像特征,将源域和目标域图像特征输入分类器;分别计算源域和目标域的分类损失和对抗损失:再对源域和目标域分类结果向量进行角度正则化并计算均方差损失;最后计算总损失函数并对网络进行参数更新。本发明专利技术采取伪标签技术,利用目标域中的伪标签信息,进一步挖掘目标域中隐含的语义信息,使目标域中的信息语义信息参与网络的训练过程,从而提升域适应的效果。从而提升域适应的效果。从而提升域适应的效果。
【技术实现步骤摘要】
用于图像分类的基于角度正则化对齐的域适应方法
[0001]本专利技术属于计算机视觉和图像处理领域,涉及用于图像分类的基于角度正则化对齐的无监督域适应方法,可以使无监督信息的目标域学习到源域中的有监督信息,提高网络在目标域样本上的识别准确率。
技术介绍
[0002]近些年来,基于深度神经网络的有监督学习已在许多方面有了成熟的应用,被广泛地应用于图像分类、目标检测、语义分割、自然语言处理等领域,极大地促进了人工智能技术与现实生活的结合。通常而言,有监督的学习方式分为训练阶段和测试阶段,即先利用训练数据集来对网络进行有监督的训练,再利用测试数据集来验证训练后的网络性能。因此,许多有监督学习方法往往假设训练集样本和测试集样本的概率分布服从同一分布,此外,有监督学习方式为了使网络具有较好的泛化性能,避免过拟合问题,在训练阶段往往需要大量有标注的训练样本。然而随着大数据时代的到来,数据规模日益增大,不同数据集合间统计特性差异、数据标注的人工成本较高等问题逐渐显现,使得有监督的学习方式难以满足上述两个相对严苛的条件。
[0003]为了放宽有监督学习需要的这两个条件,现有的工作多聚焦于利用迁移学习方法来提高网络在测试数据集上的性能。迁移学习是一种解决训练数据集(源域)和测试数据集(目标域)之间分布差异的方法,其通过学习源域中的某些可以泛化的知识,并将其应用于目标域上的任务来提高网络在目标域上的表现。其中域适应是迁移学习的一个特例,它通常假设源域和目标域具有不同的数据分布,但在两域上的任务相同,即源域和目标域共享相同的标签空间。典型的无监督域适应方法有基于域间距离和基于对抗判别的方法。基于域间距离的方法主要是对特征空间中不同域样本的分布进行显式度量,通过减小这个度量,来达到学习域不变特征的目的。基于对抗判别的方法是通过域判别器尽可能准确地判别样本特征所属的域,而提取器尽可能地生成使判别器混淆的特征来达到学习域不变特征的目的。为了进一步地提升域间的迁移效果,现有方法多采用伪标签技术。伪标签技术即为无标签的目标域样本赋予非真实标签来进行有监督方式地训练,从而尽可能地挖掘出目标域中的语义信息。然而,由于伪标签包含一定的错误标签信息,直接利用伪标签在目标域上进行有监督训练往往会导致误差累积问题,从而导致较差的域适应效果。为了缓解伪标签带来的误差累积问题,可以通过角度正则化对齐的方式来将源域信息迁移至目标域中,间接地利用伪标签信息,从而使网络对源域和目标域的参数更新方向趋向一致以达到更好的域适应效果,并在无标签的数据中获得更好的图像分类效果。
技术实现思路
[0004]针对现有技术中存在的不足,本专利技术提出用于图像分类的基于角度正则化对齐的域适应方法。
[0005]本专利技术方法是基于目标域伪标签和角度正则化对齐的域适应方法,首先分类器对
源域和目标域图像特征进行分类并得到对应的分类结果向量,其次对分类结果预测值一致的源域和目标域特征的分类结果向量进行角度正则化并计算两域分类结果向量的均方差损失,使得网络对目标域图像的参数更新方向与网络对源域图像的参数更新方向趋于一致,并以间接地方式利用目标域伪标签信息来减少目标域伪标签导致的错误累积问题,从而实现源域和目标域间更好的域适应,提高目标域上进行图像分类的准确率。
[0006]用于图像分类的基于角度正则化对齐的域适应方法,步骤如下:
[0007]步骤1,提取源域和目标域图像特征:
[0008]将源域图像和目标域图像输入到特征提取网络得到源域图像和目标域图像的特征向量。
[0009]步骤2,将源域和目标域图像特征输入分类器:
[0010]对于步骤1中得到的源域图像和目标域图像的特征向量,将其输入到两个不同的分类器中,得到源域和目标域特征的分类结果向量。
[0011]步骤3,分别计算源域和目标域的分类损失和对抗损失:
[0012]对于步骤2得到的两个源域分类结果向量,利用源域的真实标签计算两个源域分类结果向量的交叉熵损失;对于步骤2中两个分类器得到的两个目标域分类结果向量,计算两个目标域分类结果向量对抗损失。
[0013]步骤4,对源域和目标域分类结果向量进行角度正则化并计算均方差损失:
[0014]对于步骤2中得到的源域和目标域分类结果向量,首先判断源域和目标域分类结果预测值是否一致,如果一致则对源域和目标域的分类结果向量进行角度正则化并计算均方差损失。
[0015]步骤5,计算总损失函数并对网络进行参数更新:
[0016]利用步骤3和步骤4计算得到的各种总损失函数从而更新特征提取网络和分类器网络的网络参数。
[0017]本专利技术有益效果如下:
[0018](1)采取伪标签技术,利用目标域中的伪标签信息,进一步挖掘目标域中隐含的语义信息,使目标域中的信息语义信息参与网络的训练过程,从而提升域适应的效果。
[0019](2)对于伪标签技术中存在的误差累积问题,采取角度归一化对齐的方式来间接地利用目标域中的伪标签信息,从而缓解目标域伪标签中的错误语义信息导致的误差累积问题,进一步提升了网络在目标域上的迁移性能,从而在目标域上实现更好的图像分类效果。
附图说明
[0020]图1为本专利技术实施例方法流程图;
[0021]图2为本专利技术实施例方法网络示意图。
具体实施方式
[0022]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0023]如图1所示,用于图像分类的基于角度正则化对齐的域适应方法,步骤如下:
[0024]步骤1,提取源域和目标域图像特征:如图2所示,对于数据量较小的数据集,特征提取网络采用预训练的ResNet
‑
50网络,对于数据量较大的数据集,特征提取网络采用预训练的ResNet
‑
101网络。源域图像和目标域图像分别以64张为一批输入特征提取网络得到源域图像和目标域图像特征。
[0025]步骤2,将源域和目标域图像特征输入分类器:如图2所示,分类器分别为分类器1和分类器2,分类器由3层卷积层和1层全连接层组成,两个分类器的结构一致参数不同。对于步骤1中得到的源域和目标域特征,两个分类器对其进行分类并输出分类结果向量。
[0026]步骤3,分别计算源域和目标域的分类损失和对抗损失:对于两个分类器得到的源域和目标域分类结果向量,分别计算源域分类结果向量的交叉熵损失和目标域分类结果向量的对抗损失。
[0027]其中源域分类结果向量的交叉熵损失为:
[0028][0029]其中,N
s
为源域样本个数,为64,k为源域中第k个样本,为源域样本真实标签,为源域样本预测结果向量C1和C2分别为分类器1和分类器2。
[0030]目标域对抗损失为:
[0031][0032]其中d(
·
)为L1范数,X
t
为目标域特征,G为特征提取网络,为目标域样本预测结果本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.用于图像分类的基于角度正则化对齐的域适应方法,其特征在于,步骤如下:步骤1,提取源域和目标域图像特征:将源域图像和目标域图像输入到特征提取网络得到源域图像和目标域图像的特征向量;步骤2,将源域和目标域图像特征输入分类器:对于步骤1中得到的源域图像和目标域图像的特征向量,将其输入到两个不同的分类器中,得到源域和目标域特征的分类结果向量;步骤3,分别计算源域和目标域的分类损失和对抗损失:对于步骤2得到的两个源域分类结果向量,利用源域的真实标签计算两个源域分类结果向量的交叉熵损失;对于步骤2中两个分类器得到的两个目标域分类结果向量,计算两个目标域分类结果向量对抗损失;步骤4,对源域和目标域分类结果向量进行角度正则化并计算均方差损失:对于步骤2中得到的源域和目标域分类结果向量,首先判断源域和目标域分类结果预测值是否一致,如果一致则对源域和目标域的分类结果向量进行角度正则化并计算均方差损失;步骤5,计算总损失函数并对网络进行参数更新:利用步骤3和步骤4计算得到的各种总损失函数从而更新特征提取网络和分类器网络的网络参数。2.根据权利要求1所述的用于图像分类的基于角度正则化对齐的域适应方法,其特征在于,源域图像和目标域图像分别以64张为一批输入特征提取网络得到源域图像和目标域图像特征。3.根据权利要求1所述的用于图像分类的基于角度正则化对齐的域适应方法,其特征在于,分类器分别为分类器1和分类器2,分类器由3层卷积层和1层全连接层组成,两个分类器的结构一致参数不同;对于步...
【专利技术属性】
技术研发人员:颜成钢,路统宇,吕坤,王廷宇,高宇涵,孙垚棋,陈楚翘,王鸿奎,胡冀,朱尊杰,殷海兵,张继勇,李宗鹏,赵治栋,
申请(专利权)人:杭电丽水研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。