基于对抗学习的深度学习模型域适应方法技术

技术编号：42089588 阅读：26 留言：0更新日期：2024-07-19 17:04

本发明专利技术公开了一种基于对抗学习的深度学习模型域适应方法，包括S1、引入了一个域判别器D；S2、使用Vision Transfomer作为共享的特征提取器F；S3、搭建具有域判别器的Transformer网络模型，Transformer网络模型由特征提取器F，分类器C和域判别器D组成，特征提取器F与域判别器D之间形成对抗性训练的关系，并进行Transformer网络模型的优化；S4、设计渐进式平滑训练策略，对Transformer网络模型训练过程中的域混淆损失函数项梯度进行逐渐放宽的约束。本发明专利技术旨在填补针对Vision Transformer域适应研究的空白，针对Vision Transformer结构特点，基于对抗训练理论制定了Vision Transformer域适应方法。同时，基于渐进迭代的平滑训练策略与基于栅格搜索的域判别器结构搜寻。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及域适应，尤其涉及一种基于对抗学习的深度学习模型域适应方法。

技术介绍

1、transformer模型最初于2017年被google研究团队提出，最初被设计用于机器翻译任务。最近，在大尺寸图像使用全局自注意力的transformer工作已经被提出。深度视觉域适应的目标是在标注数据丰富的源域和缺乏标注的目标域上联合学习得到一个鲁棒的深度学习模型，而学习过程是用的域适应方法。源域和目标域的分布差异较大，而学习目标是使得深度学习模型能在目标域上有很好的效果。

2、与此同时，随着近几年的不断发展，transformer模型对深度学习领域的影响力已经从最初的自然语言处理领域拓展到计算机视觉领域中来。同样地，transformer模型也会在实践过程中面临域偏移的问题。然而，当前已有的域适应方法主要针对的是以cnn为代表的经典神经网络模型，对transformer模型在域偏移情况下的性质以及针对性的域适应方法都缺乏关注，属于
空白，而且直接将用于cnn的域适应方法应用于transformer，并不能起到很好的效果。因此，如何提供一种基于对抗学习的深度学习模型域适应方法是本领域技术人员亟需解决的问题。

技术实现思路

1、本专利技术的一个目的在于提出一种基于对抗学习的深度学习模型域适应方法，本专利技术旨在填补针对vision transformer域适应研究的空白，针对vision transformer结构特点，基于对抗训练理论制定了vision transforme

2、根据本专利技术实施例的一种基于对抗学习的深度学习模型域适应方法，包括如下步骤：

3、s1、引入了一个域判别器d，基于栅格搜索域判别器d结构，通过预置的搜索空间多层感知机层数{2,4,6}与隐层维度{512,1024,2048}，进行9个组合的训练与验证，从多层感知机层数与隐层维度两方面进行最佳架构搜索，最终域判别器结构定为了四层与1024的维度；

4、s2、使用vision transfomer作为共享的特征提取器f；

5、s3、搭建具有域判别器的transformer网络模型，transformer网络模型由特征提取器f，分类器c和域判别器d组成，特征提取器f与域判别器d之间形成对抗性训练的关系，并进行transformer网络模型的优化；

6、s4、设计渐进式平滑训练策略，对transformer网络模型训练过程中的域混淆损失函数项梯度进行逐渐放宽的约束。

7、可选的，所述特征提取器f由deit主体结构实现。

8、可选的，所述分类器c是将cls token映射到logit的线性层，输入为源域与目标域的图片，特征提取器f在同时最小化源域与目标域上的域混淆损失函数项以及有标注的源域上的类别预测损失函数项，域判别器d通过梯度反转层最大化域混淆损失函数项。

9、可选的，所述类别预测损失函数项具体为：

10、；

11、其中，x是指的一张图片，y是图片的物体类别标签，是源域数据集的集合，是特征提取器，是分类器，表示softmax函数，表示交叉熵；

12、所述域混淆损失函数项具体为：

13、；

14、其中，代表目标源域数据集的集合，是域类别标签。

15、可选的，所述深度学习模型的优化包括：

16、；

17、；

18、其中，、和分别表示特征提取器、分类器和域判别器的参数，是一个迭代变换的平衡系数，、和分别表示特征提取器、分类器和域判别器求得的最优值。

19、可选的，所述s5在训练过程中，当域混淆损失函数项梯度经过域判别器后，添加一个由0逐渐增加到0.1的系数，系数的平滑迭代方式为：

20、；

21、其中，表示当前的迭代轮次。

22、可选的，所述特征提取器f与分类器c和域判别器d分别直接连接，所述特征提取器f产生的输出特征将被分别输入到分类器c和域判别器d中，分类器c和域判别器d经过各自的损失计算进行反传，特征提取器f、分类器c和域判别器d的参数获得共同优化。

23、本专利技术的有益效果是：

24、本专利技术旨在填补针对vision transformer域适应研究的空白，针对visiontransformer结构特点，基于对抗训练理论制定了vision transformer域适应方法。同时，基于渐进迭代的平滑训练策略与基于栅格搜索的域判别器结构搜寻。

本文档来自技高网...

【技术保护点】

1.一种基于对抗学习的深度学习模型域适应方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于对抗学习的深度学习模型域适应方法，其特征在于，所述特征提取器F由DeiT主体结构实现。

3.根据权利要求1所述的一种基于对抗学习的深度学习模型域适应方法，其特征在于，所述分类器C是将CLS Token映射到logit的线性层，输入为源域与目标域的图片，特征提取器F在同时最小化源域与目标域上的域混淆损失函数项以及有标注的源域上的类别预测损失函数项，域判别器D通过梯度反转层最大化域混淆损失函数项。

4.根据权利要求3所述的一种基于对抗学习的深度学习模型域适应方法，其特征在于，所述类别预测损失函数项具体为：

5.根据权利要求4所述的一种基于对抗学习的深度学习模型域适应方法，其特征在于，所述深度学习模型的优化包括：

6.根据权利要求5所述的一种基于对抗学习的深度学习模型域适应方法，其特征在于，所述S5在训练过程中，当域混淆损失函数项梯度经过域判别器后，添加一个由0逐渐增加到0.1的系数，系数的平滑迭代方式为：

...

【技术特征摘要】

1.一种基于对抗学习的深度学习模型域适应方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于对抗学习的深度学习模型域适应方法，其特征在于，所述特征提取器f由deit主体结构实现。

3.根据权利要求1所述的一种基于对抗学习的深度学习模型域适应方法，其特征在于，所述分类器c是将cls token映射到logit的线性层，输入为源域与目标域的图片，特征提取器f在同时最小化源域与目标域上的域混淆损失函数项以及有标注的源域上的类别预测损失函数项，域判别器d通过梯度反转层最大化域混淆损失函数项。

4.根据权利要求3所述的一种基于对抗学习的深度学习模型域适应方法，其特征在于，所述类别预测损失函数项具体为...

【专利技术属性】
技术研发人员：李海南，方书艳，申景欣，尚文龙，朱智磊，
申请(专利权)人：数据空间研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人