模型训练方法、数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号：37637806 阅读：7 留言：0更新日期：2023-05-25 10:04

本申请提供一种模型训练方法、数据处理方法、装置、设备及存储介质，该模型训练方法包括：获取第一训练数据；对第一训练数据进行数据增强，得到多个增强数据；根据第一训练数据对多个增强数据进行聚类处理，得到第一数据集，第一数据集包括的第一数据与第一训练数据聚类为表示相同的含义；利用第一正例样本对和第一负例样本对，对识别模型进行模型训练，得到训练后的识别模型；第一正例样本对包括第一数据集中的两个数据；第一负例样本对包括第一训练数据和第二训练数据，其中，识别模型用于识别两个样本的含义是否相同。本申请能够提高识别模型的鲁棒性。识别模型的鲁棒性。识别模型的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、数据处理方法、装置、设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种模型训练方法、数据处理方法、装置、设备及存储介质。

技术介绍

[0002]识别模型可以用于对两个文本是否为相同的语义进行识别，也可以用于对两个图像是否包括相同的目标进行识别。识别模型可以通过多种方式训练得到，如自监督学习和无监督学习。
[0003]在训练样本不足的情况下训练识别模型，需要对已有的训练样本进行数据增强，以扩充训练样本。相关技术采用的方式是将增强数据作为正例样本训练识别模型。但通过该方式训练得到的识别模型的鲁棒性较差。

技术实现思路

[0004]本申请实施例提供一种模型训练方法、数据处理方法、装置、设备及存储介质，以提高训练得到的识别模型的鲁棒性。
[0005]第一方面，本申请实施例提供一种模型训练方法，包括：
[0006]获取第一训练数据，所述第一训练数据包括图像样本或文本样本；
[0007]对所述第一训练数据进行数据增强，得到多个增强数据；
[0008]根据所述第一训练数据对所述多个增强数据进行聚类处理，得到第一数据集；所述第一数据集包括的第一数据与所述第一训练数据聚类为表示相同的含义；
[0009]利用第一正例样本对和第一负例样本对，对识别模型进行模型训练，得到训练后的识别模型；所述第一正例样本对包括所述第一数据集中的两个数据；所述第一负例样本对包括所述第一训练数据和第二训练数据，若所述第一训练数据为图像样本，则所述第一训练数据和所述第...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：获取第一训练数据，所述第一训练数据包括图像样本或文本样本；对所述第一训练数据进行数据增强，得到多个增强数据；根据所述第一训练数据对所述多个增强数据进行聚类处理，得到第一数据集；所述第一数据集包括的第一数据与所述第一训练数据聚类为表示相同的含义；利用第一正例样本对和第一负例样本对，对识别模型进行模型训练，得到训练后的识别模型；所述第一正例样本对包括所述第一数据集中的两个数据；所述第一负例样本对包括所述第一训练数据和第二训练数据，若所述第一训练数据为图像样本，则所述第一训练数据和所述第二训练数据包含的对象不同，若所述第一训练数据为文本样本，则所述第一训练数据和所述第二训练数据的语义不同。2.根据权利要求1所述的模型训练方法，其特征在于，在根据所述第一训练数据对所述多个增强数据进行聚类处理后，还得到第二数据集，所述第二数据集包括的第二数据与所述第一训练数据聚类为表示不同的含义；所述方法还包括：利用所述第一训练数据和所述第二数据集对所述训练后的识别模型进行测试。3.根据权利要求2所述的模型训练方法，其特征在于，针对每个所述第二数据集包括的第二数据，对所述训练后的识别模型进行测试均有以下方式：将所述第一训练数据和所述第二数据输入所述训练后的识别模型进行识别处理，得到识别结果；若所述识别结果用于指示所述第二数据和所述第一训练数据的含义相同，则将所述第二数据发送给终端设备；接收所述终端设备发送的针对所述第二数据的确认结果；若所述确认结果用于指示所述第二数据和所述第一训练数据的含义不同，则确定所述训练后的识别模型训练不达标；若所述确认结果用于指示所述第二数据和所述第一训练数据的含义相同，则确定所述训练后的识别模型训练达标。4.根据权利要求3所述的模型训练方法，其特征在于，所述方法还包括：若所述确认结果用于指示所述第二数据和所述第一训练数据的含义不同，则利用第二负例样本对优化所述训练后的识别模型，所述第二负例样本对包括所述第二数据集包括的第二数据和所述第一训练数据。5.根据权利要求4所述的模型训练方法，其特征在于，在所述第二负例样本中，所述第二数据与所述第一训练数据的比例为预设比例。6.根据权利要求3所述的模型训练方法，其特征在于，所述方法还包括：若所述确认结果用于指示所述第二数据和所述第一训练数据的含义相同，则利用第二正例样本对优化训练所述训练后的识别模型，所述第二正例样本对包括所述第二数据和...

【专利技术属性】
技术研发人员：吕乐宾，蒋宁，肖冰，李宽，丁隆耀，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人