数据处理方法、装置及设备制造方法及图纸

技术编号：31012280 阅读：12 留言：0更新日期：2021-11-30 00:41

本申请提出了一种数据处理方法、装置及设备，可以应用于云技术、人工智能、区块链、车联网、智慧交通、智能家居等各种领域或场景，该方法包括：获取训练样本，训练样本包括参考样本、正样本和负样本；调用特征提取模型对参考样本、正样本和负样本进行特征提取处理，得到参考样本的参考特征，正样本的正特征以及负样本的负特征；根据参考特征和正特征确定相似损失，根据参考特征、正特征和负特征确定对比损失；将相似损失和对比损失叠加为目标损失，根据目标损失训练特征提取模型，得到目标特征提取模型，目标特征提取模型用于提取多媒体数据的数据特征，采用本申请可以提高特征提取模型的准确性。的准确性。的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置及设备

[0001]本申请涉及计算机
，尤其涉及一种数据处理方法、数据处理装置及计算机设备。

技术介绍

[0002]随着计算机技术的迅速发展，特征提取模型的应用越来越广泛，在应用特征提取模型之前，通常需要先对特征提取模型进行训练，训练的好坏可以决定特征提取模型的准确性（由特征质量的好坏决定），而损失的计算方法在很大程度上决定了特征提取模型训练的好坏，因此，针对损失设计合理的计算方法，提高特征提取模型的准确性是有待解决的问题。

技术实现思路

[0003]本申请实施例提供了一种数据处理方法、装置及设备，可以联合对比损失和相似损失，有效提高特征提取模型的准确性。
[0004]一方面，本申请实施例提供了一种数据处理方法，所述方法包括：获取训练样本，所述训练样本包括参考样本、正样本和负样本，所述参考样本和所述正样本满足相似关系，所述参考样本和所述负样本满足不相似关系；调用特征提取模型对所述参考样本、所述正样本和所述负样本进行特征提取处理，得到所述参考样本的参考特征，所述正样本的正特征以及所述负样本的负特征；根据所述参考特征和所述正特征确定相似损失，根据所述参考特征、所述正特征和所述负特征确定对比损失；将所述相似损失和所述对比损失叠加为目标损失，根据所述目标损失训练所述特征提取模型，得到目标特征提取模型，所述目标特征提取模型是用于提取多媒体数据的数据特征。
[0005]另一方面，本申请实施例提供了一种数据处理装置，所述装置包括：获取单元，用于获取训练样本，所述训练样本包括参...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：获取训练样本，所述训练样本包括参考样本、正样本和负样本，所述参考样本和所述正样本满足相似关系，所述参考样本和所述负样本满足不相似关系；调用特征提取模型对所述参考样本、所述正样本和所述负样本进行特征提取处理，得到所述参考样本的参考特征，所述正样本的正特征以及所述负样本的负特征；根据所述参考特征和所述正特征确定相似损失，根据所述参考特征、所述正特征和所述负特征确定对比损失；将所述相似损失和所述对比损失叠加为目标损失，根据所述目标损失训练所述特征提取模型，得到目标特征提取模型，所述目标特征提取模型是用于提取多媒体数据的数据特征。2.根据权利要求1所述的方法，其特征在于，所述将所述相似损失和所述对比损失叠加为目标损失，包括：获取所述特征提取模型的已训练批次量；若所述已训练批次量小于预设值，则将所述相似损失的权重和所述对比损失的权重均设为第一参数；若所述已训练批次量不小于所述预设值，则根据所述正样本的数据类型和所述负样本的数据类型，确定所述相似损失的权重和所述对比损失的权重；根据所述相似损失的权重和所述对比损失的权重，将所述相似损失和所述对比损失叠加为目标损失。3.根据权利要求2所述的方法，其特征在于，所述根据所述正样本的数据类型和所述负样本的数据类型，确定所述相似损失的权重和所述对比损失的权重，包括：获取所述训练样本所在的训练批次的参考相似损失和参考对比损失；根据所述参考相似损失和所述参考对比损失，确定所述正样本的数据类型和所述负样本的数据类型，所述数据类型包括噪声类型和非噪声类型；若所述正样本的数据类型为所述噪声类型，且所述负样本的数据类型为所述非噪声类型，则将所述相似损失的权重设为第二参数，将所述对比损失的权重设为所述第一参数，所述第一参数大于所述第二参数；若所述正样本的数据类型为所述非噪声类型，且所述负样本的数据类型为所述噪声类型，则将所述相似损失的权重设为所述第一参数，将所述对比损失的权重设为所述第二参数。4.根据权利要求3所述的方法，其特征在于，所述方法还包括：若所述正样本和所述负样本的数据类型均为所述非噪声类型，则将所述相似损失的权重和所述对比损失的权重均设为所述第一参数；若所述正样本和所述负样本的数据类型均为所述噪声类型，则将所述相似损失的权重和所述对比损失的权重均设为空，权重为空的相似损失和权重为空的对比损失叠加得到的目标损失为空。5.根据权利要求3所述的方法，其特征在于，所述获取所述训练样本所在的训练批次的参考相似损失和参考对比损失，包括：若所述训练样本所在的训练批次为目标训练批次，则将所述训练样本所在的训练批次
的平均相似损失作为所述参考相似损失，将所述训练样本所在的训练批次的平均对比损失作为所述参考对比损失；若所述训练样本所在的训练批次不为所述目标训练批次，则根据所述训练样本所在的训练批次的平均相似损失，以及与所述训练样本所在的训练批次相邻的训练批次确定所...

【专利技术属性】
技术研发人员：郭卉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人