System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种辐射源个体识别模型快速修正方法技术_技高网
当前位置: 首页 > 专利查询>东南大学专利>正文

一种辐射源个体识别模型快速修正方法技术

技术编号:43430413 阅读:8 留言:0更新日期:2024-11-27 12:40
本发明专利技术涉及一种辐射源个体识别模型快速修正方法,所述方法包括以下步骤:步骤1:提出损失最大化的噪声注入机制,步骤2:多阶段模型修复与性能优化,步骤3:双重教师模型的知识蒸馏策略,步骤4:优化目标函数。该方案通过生成损失最大化的噪声干扰原始模型,该方法能够有效地忘记被投毒的类别,并通过知识蒸馏技术从有能和无能教师模型中传递知识,修复并优化模型在剩余数据集上的性能。

【技术实现步骤摘要】

本专利技术涉及机器遗忘学习与辐射源个体识别领域,具体涉及一种基于双教师-学生遗忘框架的模型更新方法,用于在遭受数据污染时快速修正辐射源个体识别模型。


技术介绍

1、辐射源个体识别技术是利用无线电信号指纹来识别不同发射源的一种技术。指纹特征通常由发射器组件中的硬件缺陷产生,这些特征可用于区分不同的设备。随着深度学习技术的发展,基于深度学习的辐射源个体识别方法已经能够自动从输入数据中提取指纹特征,并识别出不同的发射器,相较于传统方法,展现出了更高的性能和鲁棒性。

2、然而,深度学习模型在面对数据安全问题时存在一定的脆弱性。例如,在广播式自动相关监视(ads-b)系统中,飞机识别信息可能被篡改,导致潜在的安全风险。同样,在自动识别系统(ais)中,信号所携带的信息也可能受到敌意行为的破坏。深度学习方法在系统安全性方面常常未能充分考虑,因此容易受到精心设计的攻击技术,例如对抗性攻击、后门攻击和数据混淆等。

3、这些安全威胁对辐射源个体识别系统构成了潜在的挑战。攻击者可能使用触发器执行后门攻击,导致模型在被投毒的样本上进行训练,进而严重影响模型性能。虽然通过在清除了投毒数据的干净数据集上重新训练模型是有效的,但由于计算成本高昂,这种方法在实践中往往不切实际。


技术实现思路

1、为了解决上述存在的问题,本文提出了一种双重教师-学生遗忘学习框架,旨在解决辐射源个体识别任务中因数据被投毒而导致的模型性能下降问题。通过生成损失最大化的噪声干扰原始模型,该方法能够有效地忘记被投毒的类别,并通过知识蒸馏技术从有能和无能教师模型中传递知识,修复并优化模型在剩余数据集上的性能。实验结果表明,该方法不仅在保留集上实现了高准确度,而且在遗忘集上达到了极低的准确度,并且显著提升了模型更新速度,在不同的数据集和网络结构上均表现出良好的适应性和稳定性,为辐射源个体识别任务中的数据安全问题提供了一种有效的解决方案。

2、本专利技术的技术方案如下:一种辐射源个体识别模型快速修正方法,包括以下步骤:

3、步骤1:提出损失最大化的噪声注入机制,提出了一种针对被投毒类别的噪声注入方法,通过优化问题寻找最大化分类损失的噪声,迫使模型忘记被投毒数据。为遗忘集生成噪声矩阵,原始模型使用噪声矩阵来忽略cf遗忘类别对应的信息。考虑到辐射源个体的特性,学习到的噪声是自适应的输入信号具有各种调制方式和其他参数。具体来说,用正态分布初始化噪声矩阵,

4、具体如下:,

5、步骤1-1数据准备:收集并准备完整的训练数据集dc,包含n个样本和m个类别,识别并分离出被投毒的样本集df及其对应的类别cf、遗忘的类别总数nf,保留未被投毒的样本集dr,

6、步骤1-2噪声矩阵初始化:对于被投毒类别cf,初始化噪声矩阵wnoise,每个元素从标准正态分布中抽取,

7、步骤1-3损失最大化噪声生成:

8、利用原始模型对被投毒样本集df进行训练,通过以下优化问题生成噪声矩阵:

9、

10、其中,pi(y)是第i个被遗忘类别的真实标签概率,qi(ui)是原模型对第i个被遗忘类别的输出概率,wnoise是噪声的参数,λ为用于平衡优化问题参数。目的是找到使原始模型的在cf上分类损失最大化的l2范数有界噪声。

11、目前,深度神经网络模型都是基于最小化损失函数进行设计的。然而,本专利技术在该步骤采用最大化损失函数,建立了一个可用的基于损失最大化噪声生成的遗忘噪声矩阵模块。显然,最大化一个仅针对被投毒类别cf的噪声矩阵在接下来的步骤中有助于遗忘相关指定知识,并且产生的噪声可以被视为破坏先前学习的知识的反样本,在接下来的步骤中用于实现消除被投毒的样本集df的信息。

12、步骤2:多阶段模型修复与性能优化,具体如下,

13、在噪声注入后,通过多阶段的模型修复过程,逐步恢复模型在保留集上的性能,同时保持对被投毒数据的遗忘状态。

14、将获得的噪声添加到从保留集的一个随机选择的子集中,形成扰动集dn。

15、在扰动集dn上训练模型一个历元,以损害模型对被投毒集df的识别能力:

16、

17、在保留集的子集上进行多次修复训练,以恢复模型性能:

18、

19、其中,表示原模型,为噪声损伤后的模型;mu(x;θu)是噪声损伤和多次修复后的模型,观察到即使单个历元的损伤也足以破坏模型关于保留集dr的权重。

20、在该步骤中,基于损失最大化的噪声,本专利技术提出多阶段模型修复与性能优化,其目的在于诱导模型被投毒类别cf相关模型参数并逐渐恢复模型在保留集dr上性能。值得注意的是,在正常情况下,这个过程通常只需要执行少量历元,并且是在少量样本上执行相关操作。因此,相较于在较大样本数量的保留集dr重新训练,本步骤大大缩短了遗忘相关样本的时间。

21、步骤3:双重教师模型的知识蒸馏策略,具体如下,

22、执行了多次修复,模型在保留集dr上的性能仍然很弱。本专利技术提出了一种基于师生互动的知识蒸馏方法来解决这一问题。

23、引入了两个教师模型:一个经过噪声注入处理的无能教师模型,用于遗忘被投毒数据;另一个是有能教师模型,包含完整数据集的知识。通过这种策略,学生模型能够在遗忘和学习之间达到平衡。

24、知识蒸馏方法:

25、定义无能教师模型ti(x;θu)和有能教师模型tc(x;φt),以及学生模型fs(x;φt)。

26、通过kullback-leibler(kl)散度计算无能教师和学生模型之间的知识转移:

27、

28、式中:τ为蒸馏温度;其中和分别表示对类别i无能教师和学生模型的输出概率分布。gi(x)和gs(x)分别为无能力教师和学生的分类器。

29、通过kl散度计算有能教师和学生模型之间的知识转移:

30、

31、式中:其中表示对类别i有能教师的输出概率分布。gc(x)为有能教师的分类器。

32、步骤4:优化目标函数,具体如下,

33、通过kl散度计算有能教师和学生模型之间的知识转移,并优化学生模型以最小化与有能教师的kl散度,同时最大化与无能教师的kl散度。训练学生模型,通过优化以下目标函数来获得关于保留集dr的准确知识,并遗忘关于被投毒集df的错误知识:

34、

35、其中,λ是平衡两种教师模型对知识蒸馏过程贡献的超参数。

36、优化的目的是通过最小化学生和有能教师之间的kl散度来获得关于保留集dr的准确知识。类似地,我们最小化了学生和无能教师之间的kl散度,以获得关于被投毒集df的错误知识。学生模型fs(x;φt)具有关于被投毒集df的专门知识,但无能教师ti却经历了最大化噪声的损伤过程,这将严重破坏关于被投毒集df的权重。由于两类教师超参数平衡的影响,学生模型在保留集dr信息的同时,舍弃了关于本文档来自技高网...

【技术保护点】

1.一种辐射源个体识别模型快速修正方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的辐射源个体识别模型快速修正方法,其特征在于,步骤1提出损失最大化的噪声注入机制,具体如下:,

3.根据权利要求2所述的辐射源个体识别模型快速修正方法,其特征在于,所述步骤2:多阶段模型修复与性能优化,具体如下,

4.根据权利要求3所述的辐射源个体识别模型快速修正方法,其特征在于,所述步骤3:双重教师模型的知识蒸馏策略,具体如下,

5.根据权利要求2所述的辐射源个体识别模型快速修正方法,其特征在于,步骤4:优化目标函数,具体如下,

【技术特征摘要】

1.一种辐射源个体识别模型快速修正方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的辐射源个体识别模型快速修正方法,其特征在于,步骤1提出损失最大化的噪声注入机制,具体如下:,

3.根据权利要求2所述的辐射源个体识别模型快速修正方法,其特征在于,所述...

【专利技术属性】
技术研发人员:李煊鹏孙森刘昌霖周子楠
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1