System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种机器学习模型构建方法、装置、电子设备及存储介质制造方法及图纸_技高网

一种机器学习模型构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:44382456 阅读:0 留言:0更新日期:2025-02-25 09:56
本申请公开了一种机器学习模型构建方法、装置、电子设备及存储介质,涉及人工智能技术领域。该方法包括:对原始样本集中包含的多个原始样本执行聚类操作,得到N个簇样本,对N个簇样本分别进行特征增强,得到N个簇样本各自对应的簇增强样本,并基于N个簇样本与N个簇样本各自对应的簇增强样本分别构成N个样本对,采用卷积神经网络对N个样本对分别进行特征提取;针对每个样本对,将卷积神经网络中多个卷积层各自输出的特征进行融合,得到每个样本对的融合特征;根据正样本集、负样本集、N个融合特征,生成符合损失函数要求的机器学习模型,用以提高机器学习模型的适用性与准确性。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种机器学习模型构建方法、装置、电子设备及存储介质


技术介绍

1、近年来,机器学习作为人工智能领域一个尤为关键的分支,致力于让模型和算法具备从数据中学习的能力。而无监督单源域泛化技术指的是在仅使用单个源域的无标签数据的情况下,训练一个模型使其能够泛化到未知的目标域,因此在机器学习场景中得到了广泛研究与应用。

2、然而,采用传统的无监督单源域泛化技术进行模型训练时,由于往往只能获得有限数量的数据,而且这些数据可能只来自一个特定的域,当需要将这个模型应用到新的、未标注的目标域时,由于域偏移问题的存在,导致学习到的模型难以适应未知的多个目标域,且模型的性能可能会显著下降。


技术实现思路

1、本申请提供了一种机器学习模型构建方法、装置、电子设备及存储介质,用以提高机器学习模型的适用性与准确性。

2、第一方面,提供一种机器学习模型构建方法,包括:

3、对原始样本集中包含的多个原始样本执行聚类操作,得到n个簇样本;其中,所述n为大于1的整数;

4、对所述n个簇样本分别进行特征增强,得到所述n个簇样本各自对应的簇增强样本,并基于所述n个簇样本与n个簇样本各自对应的簇增强样本分别构成n个样本对;

5、采用卷积神经网络对所述n个样本对分别进行特征提取;其中,所述卷积神经网络中包括依次连接的多个卷积层;

6、针对每个样本对,将所述多个卷积层各自输出的特征进行融合,得到所述每个样本对的融合特征;

7、根据正样本集、负样本集、n个融合特征,构建符合损失函数要求的机器学习模型;其中,所述正样本集中包含的正样本对是基于同一簇中的原始样本、增强样本构建的,所述负样本集中包含的负样本对是基于不同簇中的原始样本、增强样本构建的。

8、本申请实施例中,首先,对原始样本集中包含的多个原始样本执行聚类操作,得到n个簇样本,对n个簇样本分别进行特征增强,得到n个簇样本各自对应的簇增强样本,并基于n个簇样本与n个簇样本各自对应的簇增强样本分别构成n个样本对,在训练过程中可以为不同簇执行各自相适应的增强策略;然后,采用卷积神经网络对n个样本对分别进行特征提取,且针对每个样本对,将卷积神经网络中依次连接的多个卷积层各自输出的特征进行融合,得到每个样本对的融合特征,在训练过程中能够更好地平衡图像的全局信息与细节信息;最后,根据正样本集、负样本集、n个融合特征,构建符合损失函数要求的机器学习模型,在训练过程中能够学习不同簇特征之间的相似性和差异性;上述整个训练过程提高了机器学习模型的适用性与准确性。

9、在一些实施例中,所述对所述n个簇样本分别进行特征增强,得到所述n个簇样本各自对应的簇增强样本,包括:

10、采用生成式对抗网络对所述n个簇样本分别进行特征增强,得到所述n个簇样本各自对应的增强样本;其中,所述生成式对抗网络中包括一个生成器与n个簇判别器,一个簇判别器对应一个簇样本,用于判别所述生成器生成的增强样本与原始样本之间的差异。

11、在一些实施例中,所述采用生成式对抗网络对所述n个簇样本分别进行特征增强,得到所述n个簇样本各自对应的增强样本,包括:

12、将第一簇样本中任意的第一原始样本输入所述生成器,得到所述第一原始样本的第一增强样本;其中,所述第一簇样本为所述n个簇样本中的任意一个;

13、将所述第一增强样本输入至与所述第一簇样本关联的第一簇判别器,若所述第一簇判别器判别出所述第一增强样本为所述第一原始样本的概率不满足概率阈值,则调整所述第一簇判别器与所述生成器各自的参数,直至所述概率满足所述概率阈值。

14、通过上述方式,采用生成式对抗网络对各个簇样本中的原始样本进行对抗训练,能够为不同簇样本中的原始样本生成各自相适应的增强样本,相较于传统的无监督单源域泛化方式,考虑到了不同类别的原始样本所需的增强策略不一致,有效地分析和学习了不同簇样本之间的差异性,从而增强了不同原始样本的有效性,为后续的特征提取奠定了基础。

15、在一些实施例中,所述卷积神经网络还包括注意力机制层;所述针对每个样本对,将所述多个卷积层各自输出的特征进行融合,得到所述每个样本对的融合特征,包括:

16、所述针对每个样本对,将所述多个卷积层各自输出的特征依次输入所述注意力机制层,确定所述各特征各自对应的权重参数;

17、根据所述各特征对应的权重参数对所述各特征进行融合,得到所述每个样本对的融合特征。

18、通过上述方式,针对每个样本对,引入注意力机制层确定不同卷积层输出的特征对应的权重参数,然后基于各特征的权重参数,将各特征进行融合,充分利用浅层特征和深层特征各自的特性,使模型能够获得有效且全面的特征信息,提高了模型的适用性,且通过不同层的特征的权重参数,可使模型更加关注域不变特征并忽略域相关特征,从而克服域之间的虚假相关性。

19、在一些实施例中,所述损失函数满足以下表达式:

20、

21、其中,所述为表征n个样本对中任意一个样本对的融合特征,所述表征与所述属于相同簇中第i个正样本对的特征,所述表征与所述属于不同簇中第j个负样本对的特征,所述τ表征温度参数,用于调节所述机器学习模型对相似度的敏锐性。

22、在一些实施例中,所述对原始样本集中所包含的原始样本执行聚类操作,得到n个簇样本,包括:

23、采用k-means++聚类算法对原始样本集中所包含的原始样本执行聚类操作,得到所述n个簇样本。

24、通过上述方式,采用k-means++聚类算法,可确保初始质心具有更适用的分布,避免质心聚集在数据分布的某一特定部分,减少收敛到局部最小值的风险,适用于单源域泛化场景。

25、第二方面,提供一种机器学习模型构建装置,包括:

26、聚类模块,用于对原始样本集中包含的多个原始样本执行聚类操作,得到n个簇样本;其中,所述n为大于1的整数;

27、特征增强模块,用于对所述n个簇样本分别进行特征增强,得到所述n个簇样本各自对应的簇增强样本,并基于所述n个簇样本与n个簇样本各自对应的簇增强样本分别构成n个样本对;

28、特征提取模块,用于采用卷积神经网络对所述n个样本对分别进行特征提取;其中,所述卷积神经网络中包括依次连接的多个卷积层;

29、特征融合模块,用于针对每个样本对,将所述多个卷积层各自输出的特征进行融合,得到所述每个样本对的融合特征;

30、模型构建模块,用于根据正样本集、负样本集、n个融合特征,构建符合损失函数要求的机器学习模型;其中,所述正样本集中包含的正样本对是基于同一簇中的原始样本、增强样本构建的,所述负样本集中包含的负样本对是基于不同簇中的原始样本、增强样本构建的。

31、在一些实施例中,所述卷积神经网络还包括注意力机制层;所述特征融合模块,具体用于:

32、所述针对每本文档来自技高网...

【技术保护点】

1.一种机器学习模型构建方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述对所述N个簇样本分别进行特征增强,得到所述N个簇样本各自对应的簇增强样本,包括:

3.如权利要求2所述的方法,其特征在于,所述采用生成式对抗网络对所述N个簇样本分别进行特征增强,得到所述N个簇样本各自对应的增强样本,包括:

4.如权利要求1所述的方法,其特征在于,所述卷积神经网络还包括注意力机制层;

5.如权利要求1所述的方法,其特征在于,所述损失函数满足以下表达式:

6.如权利要求1所述的方法,其特征在于,所述对原始样本集中所包含的原始样本执行聚类操作,得到N个簇样本,包括:

7.一种机器学习模型构建装置,其特征在于,包括:

8.如权利要求7所述的装置,其特征在于,所述卷积神经网络还包括注意力机制层;所述特征融合模块,具体用于:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法。

...

【技术特征摘要】

1.一种机器学习模型构建方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述对所述n个簇样本分别进行特征增强,得到所述n个簇样本各自对应的簇增强样本,包括:

3.如权利要求2所述的方法,其特征在于,所述采用生成式对抗网络对所述n个簇样本分别进行特征增强,得到所述n个簇样本各自对应的增强样本,包括:

4.如权利要求1所述的方法,其特征在于,所述卷积神经网络还包括注意力机制层;

5.如权利要求1所述的方法,其特征在于,所述损失函数满足以下表达式:

【专利技术属性】
技术研发人员:孙灿
申请(专利权)人:中科云谷科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1