System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于机器学习,特别是涉及一种基于数据多样性增强的无监督领域泛化方法及设备。
技术介绍
1、随着数据驱动的机器学习技术的快速发展,深度神经网络已在图像分类、目标检测、语音识别和自然语言处理等多个任务中取得了显著进展。这些成就主要归功于深度神经网络的强大表征能力,它能够从大规模的标记数据中自动学习多层次的特征。然而,深度神经网络的成功在很大程度上依赖于训练数据与测试数据的独立同分布假设。即,模型在训练时假设源数据(即训练数据)和目标数据(即测试数据)具有相同的分布。在这一假设下,深度神经网络能够在源数据上学习到准确的表征,并在测试时推广至目标数据。然而,在现实世界中,数据分布通常受到多种因素影响,可能因数据获取条件、采集设备、环境变化等原因发生显著偏移。这种分布偏移现象导致模型在测试时难以保持训练时的高性能。
2、为了应对领域偏移问题,近年来提出了两类经典方法:领域自适应和领域泛化。领域自适应通过引入目标域数据进行模型的适应性训练,以减少源域与目标域之间的分布差异。尽管这种方法能够显著提升模型在目标域上的表现,但其对目标域数据的依赖性使其在实际应用中面临数据获取困难和成本高昂的问题。单域泛化则是一种更具挑战性但更加通用的策略,其目标是在不依赖目标域数据的情况下,通过训练模型在源域上的学习来提升其在未知目标域上的泛化能力。领域泛化方法通常依赖于多个源域数据进行训练,假设不同源域之间存在一定的差异,模型能够通过学习源域之间的变化模式,提升其对未知目标域的鲁棒性。
3、在现有的领域迁移研究中,无论是领域自
4、1、依赖于标记数据的监督:现有的领域迁移方法大多依赖于源域数据的标记信息进行监督学习,这意味着需要大量的标记数据进行训练。数据标记不仅成本高昂,而且在实际应用中,尤其是跨领域任务中,获取标记数据的难度较大,限制了这些方法的广泛应用。
5、2、生成对抗性样本的多样性不足:现有的对抗性数据增强方法在生成样本时,往往未能充分捕捉目标域的多样性。模型生成的样本可能局限于某些特定的视觉特征或纹理,无法涵盖目标域中的所有潜在变化,导致模型的泛化能力有限,特别是在处理具有复杂视觉变化的目标域数据时,模型的表现较差。
6、3、虚假相关性的影响:现有技术中的深度模型在训练时,容易学习到与任务相关的虚假相关性,这些虚假相关性通常是数据中特定的偏差或模式,但它们并不具有实际的泛化意义。这些错误关联会导致模型在测试时做出错误预测,特别是在目标域与源域分布存在显著差异的情况下。
技术实现思路
1、本专利技术的目的是针对现有技术不足,提供了一种基于数据多样性增强的无监督领域泛化方法及设备,通过生成多样化的对抗性样本,增强模型的领域泛化能力。
2、为了实现上述目的,本专利技术所采用的技术方案是:
3、一种基于数据多样性增强的无监督领域泛化方法,包括以下步骤:
4、s1:获取原始图像、噪声图;
5、s2:将所述原始图像、噪声图作为深度学习网络模型的输入,训练所述深度学习网络模型;
6、所述深度学习网络模型包括第一生成器、第二生成器;
7、所述第一生成器包括第一卷积层、第二卷积层、第三卷积层、第一自适应实例规范化层,所述第一卷积层、所述第二卷积层均与所述第一自适应实例规范化层连接,所述第一自适应实例规范化层和所述第三卷积层连接;
8、所述第二生成器包括依次连接的编码器、第二自适应实例规范化层、解码器;
9、所述深度学习网络模型的训练过程包括:
10、所述原始图像通过第一卷积层处理,得到第一特征;
11、所述噪声图通过第二卷积层处理,得到调整噪声;
12、所述第一特征、所述调整噪声输入第一自适应实例规范化层,得到第二特征;
13、所述第二特征通过第三卷积层处理,得到特征图;
14、所述原始图像通过所述编码器处理,得到第三特征;
15、所述第三特征输入所述第二自适应实例规范化层,得到第四特征;
16、所述第四特征通过所述解码器处理,得到辅助特征图;
17、通过互信息量化所述特征图和所述原始图像之间的相关性,构建对抗性损失函数;
18、通过最大化最小化对抗性损失函数对所述第一生成器和所述第二生成器进行对抗性训练,优化训练所述深度学习网络模型,得到数据生成模型。
19、本专利技术中的两个生成器通过对抗性训练进行联合优化,生成器通过自适应实例规范化层和噪声注入生成多样化的视觉样本。在此过程中,通过互信息量的最大化和最小化策略以确保生成样本在视觉属性上的多样性和一致性。生成器在多样化图像的同时,互信息量的调控确保了生成样本之间既有足够的相似性保持模型的稳定性,又有足够的差异性以增强泛化能力。
20、本专利技术依赖无监督训练,这不仅降低了数据收集和标注的成本,还避免了由于监督引入的虚假相关性问题。通过无监督生成器的多样性增强,本专利技术确保了生成样本的高质量、多样性和泛化能力。
21、进一步地,所述第一卷积层包括多个并联的卷积层,所述多个并联的卷积层的卷积核不同。使图像在局部细节上更具表现力,增强图像细节。
22、优选地,所述多个并联的卷积层的卷积核从集合k={1,3,5,7}中均匀随机采样。
23、进一步地,所述第一自适应实例规范化层的表达式如下:
24、
25、其中,adain1(·)为第一自适应实例规范化层的输出,z为第一特征,β为噪声强度参数,用于调节噪声注入强度,为风格均值,为风格方差,为调整噪声,μ(z)为第一特征的均值,σ(z)为第一特征的方差。
26、第一自适应实例规范化层用于对风格和噪声扰动进行综合调节。
27、进一步地,所述第二自适应实例规范化层的表达式如下:
28、
29、其中,adain2(·)为第二自适应实例规范化层的输出,h为第三特征,为风格均值,为风格方差,μ(h)为第三特征的均值,σ(h)为第三特征的方差。
30、进一步地,通过两个全连接层分别处理噪声向量,得到风格均值和风格方差。使生成器能够动态调整每次生成的图像风格,通过改变风格均值和风格方差以实现风格的多样化,为生成器的输出图像赋予多样化的视觉特征。
31、进一步地,所述噪声图和所述噪声向量从标准正态分布n(0,1)中采样得到。
32、进一步地,所述对抗性损失函数laug的表达式如下:
33、
34、其中,g(·)为第一生成器的输出,φ(·)为第二生成器的输出,xi、xj为原始图像,n为原始图像数量,|| ||1为l1范数,为互信息的上界估计器,x为原始图像,x+为特征图。
35、基于同一专利技术构思,本专利技术还提供了一种电子设备,包括:
36、一个或多个处理器;
37、本文档来自技高网...
【技术保护点】
1.一种基于数据多样性增强的无监督领域泛化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述第一卷积层包括多个并联的卷积层,所述多个并联的卷积层的卷积核不同。
3.根据权利要求2所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述多个并联的卷积层的卷积核从集合K={1,3,5,7}中均匀随机采样。
4.根据权利要求1所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述第一自适应实例规范化层的表达式如下:
5.根据权利要求1所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述第二自适应实例规范化层的表达式如下:
6.根据权利要求4或5所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,通过两个全连接层分别处理噪声向量,得到风格均值和风格方差。
7.根据权利要求6所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述噪声图和所述噪声向量从标准正态分布N(0,1)中采样得到。
8.根据权利要求1所
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8任一项所述方法的步骤。
...【技术特征摘要】
1.一种基于数据多样性增强的无监督领域泛化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述第一卷积层包括多个并联的卷积层,所述多个并联的卷积层的卷积核不同。
3.根据权利要求2所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述多个并联的卷积层的卷积核从集合k={1,3,5,7}中均匀随机采样。
4.根据权利要求1所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述第一自适应实例规范化层的表达式如下:
5.根据权利要求1所述的基于数据多样性增强的无监督领域泛化方法,其特征在于,所述第二自适应实例规范化层...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。