模型训练方法、数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:37637806 阅读:7 留言:0更新日期:2023-05-25 10:04
本申请提供一种模型训练方法、数据处理方法、装置、设备及存储介质,该模型训练方法包括:获取第一训练数据;对第一训练数据进行数据增强,得到多个增强数据;根据第一训练数据对多个增强数据进行聚类处理,得到第一数据集,第一数据集包括的第一数据与第一训练数据聚类为表示相同的含义;利用第一正例样本对和第一负例样本对,对识别模型进行模型训练,得到训练后的识别模型;第一正例样本对包括第一数据集中的两个数据;第一负例样本对包括第一训练数据和第二训练数据,其中,识别模型用于识别两个样本的含义是否相同。本申请能够提高识别模型的鲁棒性。识别模型的鲁棒性。识别模型的鲁棒性。

【技术实现步骤摘要】
模型训练方法、数据处理方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种模型训练方法、数据处理方法、装置、设备及存储介质。

技术介绍

[0002]识别模型可以用于对两个文本是否为相同的语义进行识别,也可以用于对两个图像是否包括相同的目标进行识别。识别模型可以通过多种方式训练得到,如自监督学习和无监督学习。
[0003]在训练样本不足的情况下训练识别模型,需要对已有的训练样本进行数据增强,以扩充训练样本。相关技术采用的方式是将增强数据作为正例样本训练识别模型。但通过该方式训练得到的识别模型的鲁棒性较差。

技术实现思路

[0004]本申请实施例提供一种模型训练方法、数据处理方法、装置、设备及存储介质,以提高训练得到的识别模型的鲁棒性。
[0005]第一方面,本申请实施例提供一种模型训练方法,包括:
[0006]获取第一训练数据,所述第一训练数据包括图像样本或文本样本;
[0007]对所述第一训练数据进行数据增强,得到多个增强数据;
[0008]根据所述第一训练数据对所述多个增强数据进行聚类处理,得到第一数据集;所述第一数据集包括的第一数据与所述第一训练数据聚类为表示相同的含义;
[0009]利用第一正例样本对和第一负例样本对,对识别模型进行模型训练,得到训练后的识别模型;所述第一正例样本对包括所述第一数据集中的两个数据;所述第一负例样本对包括所述第一训练数据和第二训练数据,若所述第一训练数据为图像样本,则所述第一训练数据和所述第二训练数据包含的对象不同,若所述第一训练数据为文本样本,则所述第一训练数据和所述第二训练数据的语义不同。
[0010]可以看出,本申请实施例提供的模型训练方法通过对第一训练数据进行数据增强,得到多个增强数据,实现训练样本的扩充。然后采用聚类处理将多个增强数据聚为与第一训练数据表示相同的含义的第一数据集,实现增强数据的分类,避免直接采用增强数据作为正例样本训练识别模型,导致识别模型的鲁棒性降低。此外,将第一数据集中的两个数据作为第一正例样本对、将第一训练数据和第二训练数据作为第一负例样本对,训练得到识别模型,能够提高训练得到的识别模型的鲁棒性。
[0011]第二方面,本申请实施例提供一种数据处理方法,包括:
[0012]获取第一数据和第二数据,所述第一数据和所述第二数据均为图像或文本;
[0013]将所述第一数据和所述第二数据输入识别模型进行识别处理,得到数据识别结果,所述数据识别结果用于指示所述第一数据和所述第二数据的含义是否相同,所述识别模型为第一方面所述的模型训练方法训练得到的。
[0014]可以看出,本申请实施例通过将第一数据和第二数据输入第一方面的模型训练方法训练得到的识别模型,由于识别模型具有很好的鲁棒性,因此能够对第一数据和第二数据进行准确的识别。
[0015]第三方面,本申请实施例提供一种模型训练装置,包括:
[0016]获取模块,用于获取第一训练数据,所述第一训练数据包括图像样本或文本样本;
[0017]数据增强模块,用于对所述第一训练数据进行数据增强,得到多个增强数据;
[0018]处理模块,用于根据所述第一训练数据对所述多个增强数据进行聚类处理,得到第一数据集;所述第一数据集包括的第一数据与所述第一训练数据聚类为表示相同的含义;
[0019]训练模块,用于利用第一正例样本对和第一负例样本对,对识别模型进行模型训练,得到训练后的识别模型;所述第一正例样本对包括所述第一数据集中的两个数据;所述第一负例样本对包括所述第一训练数据和第二训练数据,若所述第一训练数据为图像样本,则所述第一训练数据和所述第二训练数据包含的对象不同,若所述第一训练数据为文本样本,则所述第一训练数据和所述第二训练数据的语义不同。
[0020]第四方面,本申请实施例提供一种数据处理装置,包括:
[0021]获取模块,用于获取第一数据和第二数据,所述第一数据和所述第二数据均为图像或文本;
[0022]识别模块,用于将所述第一数据和所述第二数据输入识别模型进行识别处理,得到数据识别结果,所述数据识别结果用于指示所述第一数据和所述第二数据的含义是否相同,所述识别模型为第一方面所述的模型训练方法训练得到的。
[0023]第五方面,本申请实施例提供一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面中任一项所述的模型训练方法或第二方面中任一项所述的数据处理方法。
[0024]第六方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当计算机程序在电子设备上运行时,使得电子设备执行如第一方面中任一项所述的模型训练方法或第二方面中任一项所述的数据处理方法。
[0025]第七方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序在电子设备上运行时,使得电子设备执行如第一方面中任一项所述的模型训练方法或第二方面中任一项所述的数据处理方法。
[0026]本申请实施例提供一种模型训练方法、数据处理方法、装置、设备及存储介质。本申请实施例通过对第一训练数据进行数据增强,得到多个增强数据,实现训练样本的扩充。然后采用聚类处理将多个增强数据聚为与第一训练数据表示相同的含义的第一数据集,实现增强数据的分类,避免直接采用增强数据作为正例样本训练识别模型,导致识别模型的鲁棒性降低。此外,将第一数据集中的两个数据作为第一正例样本对、将第一训练数据和第二训练数据作为第一负例样本对,训练得到识别模型,能够提高训练得到的识别模型的鲁棒性。
附图说明
[0027]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施
例,并与说明书一起用于解释本申请的原理。
[0028]图1为本申请提供的一种相关技术的示意图;
[0029]图2为本申请提供的另一种相关技术的示意图;
[0030]图3为本申请提供的模型训练方法的应用场景示意图;
[0031]图4为本申请一实施例提供的模型训练方法的流程示意图;
[0032]图5为本申请一实施例提供的模型训练方法的示意图;
[0033]图6为本申请一实施例提供的数据处理方法的流程示意图;
[0034]图7为本申请一实施例提供的模型训练装置的结构示意图;
[0035]图8为本申请一实施例提供的数据处理装置的结构示意图;
[0036]图9为本申请一实施例提供的电子设备的结构示意图。
[0037]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0038]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取第一训练数据,所述第一训练数据包括图像样本或文本样本;对所述第一训练数据进行数据增强,得到多个增强数据;根据所述第一训练数据对所述多个增强数据进行聚类处理,得到第一数据集;所述第一数据集包括的第一数据与所述第一训练数据聚类为表示相同的含义;利用第一正例样本对和第一负例样本对,对识别模型进行模型训练,得到训练后的识别模型;所述第一正例样本对包括所述第一数据集中的两个数据;所述第一负例样本对包括所述第一训练数据和第二训练数据,若所述第一训练数据为图像样本,则所述第一训练数据和所述第二训练数据包含的对象不同,若所述第一训练数据为文本样本,则所述第一训练数据和所述第二训练数据的语义不同。2.根据权利要求1所述的模型训练方法,其特征在于,在根据所述第一训练数据对所述多个增强数据进行聚类处理后,还得到第二数据集,所述第二数据集包括的第二数据与所述第一训练数据聚类为表示不同的含义;所述方法还包括:利用所述第一训练数据和所述第二数据集对所述训练后的识别模型进行测试。3.根据权利要求2所述的模型训练方法,其特征在于,针对每个所述第二数据集包括的第二数据,对所述训练后的识别模型进行测试均有以下方式:将所述第一训练数据和所述第二数据输入所述训练后的识别模型进行识别处理,得到识别结果;若所述识别结果用于指示所述第二数据和所述第一训练数据的含义相同,则将所述第二数据发送给终端设备;接收所述终端设备发送的针对所述第二数据的确认结果;若所述确认结果用于指示所述第二数据和所述第一训练数据的含义不同,则确定所述训练后的识别模型训练不达标;若所述确认结果用于指示所述第二数据和所述第一训练数据的含义相同,则确定所述训练后的识别模型训练达标。4.根据权利要求3所述的模型训练方法,其特征在于,所述方法还包括:若所述确认结果用于指示所述第二数据和所述第一训练数据的含义不同,则利用第二负例样本对优化所述训练后的识别模型,所述第二负例样本对包括所述第二数据集包括的第二数据和所述第一训练数据。5.根据权利要求4所述的模型训练方法,其特征在于,在所述第二负例样本中,所述第二数据与所述第一训练数据的比例为预设比例。6.根据权利要求3所述的模型训练方法,其特征在于,所述方法还包括:若所述确认结果用于指示所述第二数据和所述第一训练数据的含义相同,则利用第二正例样本对优化训练所述训练后的识别模型,所述第二正例样本对包括所述第二数据和...

【专利技术属性】
技术研发人员:吕乐宾蒋宁肖冰李宽丁隆耀
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1