一种无监督的两阶段领域自适应方法技术

技术编号：33636372 阅读：10 留言：0更新日期：2022-06-02 01:49

本发明专利技术提出了一种无监督的两阶段领域自适应方法。该方法利用不断更新的目标域投影子空间增强伪标签的准确度，同时将精确化后的伪标签反馈至目标域投影子空间，两个阶段交替更新，能够得到一个对分类性能最优的判别子空间。具体地，在第一阶段使用两个投影子空间将源域和目标域数据映射到相应地低维子空间内，同时利用基于MMD的特征对齐损失函数聚类来自跨域类别空间中同类别的样本，进一步减少条件分布差异，并在目标域投影子空间内根据所有样本的语义信息(源域为标签信息，目标域为伪标签信息)和两个样本点之间的距离信息构建图正则项，保持原始数据的邻近信息。第二阶段利用第一阶段得到的子空间投影训练SVM分类器，计算目标域样本的伪标签，并将精确化后的伪标签反馈至第一阶段。本发明专利技术的优点是考虑了知识迁移过程中的几何结构信息和先验标签信息，能够有效提升图像分类的准确度。有效提升图像分类的准确度。有效提升图像分类的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种无监督的两阶段领域自适应方法

[0001]一种无监督的两阶段领域自适应方法。

技术介绍

[0002]基于传统机器学习的图像分类假设测试样本和训练样本需要满足独立同分布，同时需要大量与测试数据同分布的有标记样本保证模型的泛化性能，这两个条件在现实应用中很难实现。领域自适应能够突破传统机器学习的隐式假设，期望利用有标签的源域数据和无标签的目标域数据构建跨领域学习模型，能够解决机器学习中训练样本标签稀缺以及难以真正满足独立同分布条件的问题。

技术实现思路

[0003]本专利技术针对目前基于低秩子空间学习的领域自适应方法中学习一个投影子空间导致域间分布差异减少不足的问题，提出两阶段伪标签精确化的领域自适应方法，利用对分类有意义的类别先验信息和局部结构信息，探索隐含在数据底层的内在规律，提升跨域图像分类模型的鲁棒性、泛化性和高效性。
[0004]为实现上述目的，本专利技术是通过的这样的技术方案实现的，方法概述如下：
[0005]该方法主要分为两个阶段，阶段一将源域和目标域投影到各自的子空间内，联合自适应概率图结构增强类间独立性和类内依赖性，同时使用条件分布对齐特征在类别空间中使得来自两个域的同类样本距离减少，进一步减少子空间内的条件分布差异。阶段二在训练伪标签时使用了不断优化的子空间进行引导，并将更新后的伪标签反馈至第一阶段。尽管刚开始训练的伪标签准确度较低，但是随着伪标签和子空间的不断交替更新，最终能够得到一个判别的、领域共享的子空间，从而获得一个对目标域分类性能最优的分类器。
[...

【技术保护点】

【技术特征摘要】
1.一种无监督的两阶段领域自适应方法，包括以下步骤：第一阶段：步骤1：最小化流形空间中两个特定域的投影之间的距离，实现子空间对齐。步骤2：假设目标数据由公共子空间中的源域数据线性表示，并且通过对重建矩阵施加低秩约束，实现数据对齐。步骤3：利用源域的标签信息和目标域的伪标签信息将子空间拟合到标签矩阵中，同时使用语义引导的最大平均距离相似性特征对齐损失度量跨域条件分布的差异性，实现标签对齐；步骤4：在判别的目标域投影子空间中建立图结构，实现图结构对齐。第二阶段：利用第一阶段得到的目标域子空间训练SVM分类器，提高伪标签的准确度，并将其反馈至第一阶段。两个阶段交替更新，提高目标域分类器的性能。2.如权利要求1所述的一种无监督的两阶段领域自适应方法，其特征在于：在步骤1中实现子空间对齐，P
s
和P
t
分别定义为源域子空间投影和目标域子空间投影，最小化流形空间中两个特定域的投影之间的距离，能够减少域偏移。3.如权利要求1所述的一种无监督的两阶段领域自适应方法，其特征在于：在步骤2中实现数据对齐，为了缩小源域和目标域之间的分布差异，利用数据的内在信息学习一个最优的目标投影P
t
。假设目标数据由公共子空间中的源域数据线性表示，并且通过对重建矩阵施加低秩约束，使...

【专利技术属性】
技术研发人员：陶洋，杨娜，田家旺，王一强，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人