【技术实现步骤摘要】
基于对抗蒸馏的鲁棒无监督域自适应图像分类方法及装置
[0001]本专利技术属于计算机图像分类的
,具体涉及一种基于对抗蒸馏的鲁棒无监督域自适应图像分类方法及装置。
技术介绍
[0002]无监督域自适应学习能将知识从标记的源域转移到未标记的目标域,在标签稀缺或注释繁琐的场景中推进模型转移。然而,由于数据隐私和安全问题,在域适应阶段可能无法访问源域数据,并且同时使用目标域数据与大规模源数据训练目标域上模型,在计算上也很棘手。因此,无源域数据无监督域自适应学习应运而生,如一种无源域数据的无监督域自适应学习模型(SHOT模型)。尽管现有研究取得了显著的进展,但大多数现有的无监督域自适应或无源域数据无监督域自适应方法都忽略了深度学习模型的鲁棒性,这些模型对输入图片中难以察觉的扰动很敏感并且在对抗样本面前表现十分脆弱;特别地,由于它们是在没有对目标域进行精确监督的情况下进行的乐观训练,因此(无源域数据的)无监督域自适应模型可能对这种扰动更加敏感,加剧了模型的脆弱性并对安全敏感的应用程序构成巨大威胁。
[0003]现有研究中,一方面通过从鲁棒的源域模型或鲁棒的预训练模型转移鲁棒性来训练鲁棒的无监督域自适应模型,以此提高鲁棒性;但在许多实际应用中,假设鲁棒源域模型或鲁棒预训练的可用性是不切实际的,因此很难直接应用到分类任务中。另一方面提高模型鲁棒性的方法是进行对抗训练,但是对抗训练会导致严重的过拟合现象,极大地影响了分类结果有效性。
技术实现思路
[0004]本专利技术的主要目的在于克服现有技术的缺点与 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.基于对抗蒸馏的鲁棒无监督域自适应图像分类方法,其特征在于,包括下述步骤:获取无监督目标域自然样本集;构建鲁棒无监督域自适应图像分类框架;所述鲁棒无监督域自适应图像分类框架包括非鲁棒目标域教师模型和鲁棒目标域学生模型;使用预训练的非鲁棒源域模型对非鲁棒目标域教师模型的参数进行初始化,在无监督目标域自然样本集上进行端到端的迭代训练,得到训练好的非鲁棒目标域教师模型;基于训练好的非鲁棒目标域教师模型构造鲁棒目标域学生模型,在无监督目标域自然样本集上进行对抗蒸馏训练,得到训练好的鲁棒目标域学生模型并输出图像分类结果。2.根据权利要求1所述的基于对抗蒸馏的鲁棒无监督域自适应图像分类方法,其特征在于,所述鲁棒无监督域自适应图像分类框架的目标函数是基于间隔差异散度在无源域数据条件下进行推导而得,具体为:根据间隔学习理论可得,对于任意一个得分函数f,都满足:其中是一个理想间隔损失,是得分函数f在目标对抗域上基于0
‑
1损失的分类误差,是得分函数f在源域上以常数ρ为间隔的分类误差,是以常数ρ为间隔的源域和目标域的间隔差异散度,是以常数ρ为间隔的目标域和目标对抗域的间隔差异散度;令在目标对抗域上基于0
‑
1损失的分类误差达到最小的最优得分函数f,故根据(1)式的右端项得:在源域数据完全缺失的条件下可知,得分函数f在源域上以常数ρ为间隔的分类误差是常数,故根据(2)式推导出鲁棒无监督域自适应图像分类框架的目标函数为:其中,为非鲁棒目标域教师模型的目标函数,为鲁棒目标域学生模型的目标函数。3.根据权利要求2所述的基于对抗蒸馏的鲁棒无监督域自适应图像分类方法,其特征在于,所述得到训练好的非鲁棒目标域教师模型,具体为:采用不使用源域数据的无监督域自适应学习模型进行标准的无监督域自适应学习,获得非鲁棒目标域教师模型;使用预训练的非鲁棒源域模型的参数对非鲁棒目标域教师模型的参数进行初始化;将无监督目标域自然样本集输入非鲁棒目标域教师模型中进行端到端的迭代训练,得到训练好的非鲁棒目标域教师模型。4.根据权利要求3所述的基于对抗蒸馏的鲁棒无监督域自适应图像分类方法,其特征在于,所述得到训练好的鲁棒目标域学生模型,具体为:
采用和非鲁棒目标域教师模型相同的结构构造鲁棒目标域学生模型;根据鲁棒目标域学生模型的参数信息,对无监督目标域自然样本集中每个自然样本生成对应的对抗样本;进行对抗蒸馏训练,每次迭代训练过程中,将非鲁棒目标域教师模型的参数固定,对鲁棒目标域学生模型进行端到端的训练,得到训练好的鲁棒目标域学生模型并输出图像分类结果。5.根据权利要求4所述的基于对抗蒸馏的鲁棒无监督域自适应图像分类方法,其特征在于,基于面向鲁棒性与准确性权衡的对抗训练方法TRADES进行对抗蒸馏训练;所述对抗样本的生成公式为:所述对抗蒸馏损失函数根据非鲁棒目标域教师模型的输出和鲁棒目标域学生模型的输出进行建立,表示为:其中φ表示鲁棒目标域学生模型,φ
技术研发人员:肖遥,罗彬,陈宇恒,魏朋旭,林倞,
申请(专利权)人:中山大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。