数据处理方法及装置、计算设备、存储介质制造方法及图纸

技术编号：33420284 阅读：13 留言：0更新日期：2022-05-19 00:13

本申请实施例提供一种数据处理方法及装置、计算设备、存储介质，该方法包括：在机器学习模型任一次训练任务中，确定多个训练样本分别对应的预测结果；对所述多个训练样本分别进行评价处理，获得所述多个训练样本分别对应的评价权重；基于所述多个训练样本分别对应的预测结果与评价权重，确定所述多个训练样本分别对应的损失值；根据所述多个训练样本分别对应的损失值，获取所述训练任务的训练结果。本申请实施例提高了模型训练精度及准确度。请实施例提高了模型训练精度及准确度。请实施例提高了模型训练精度及准确度。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法及装置、计算设备、存储介质

[0001]本申请涉及计算机
，尤其涉及一种数据处理方法及装置、计算设备、存储介质。

技术介绍

[0002]在计算机视觉、自然语言处理、机器控制等人工智能领域中，机器学习模型的应用越来越广泛。在机器学习模型中，分类是一种较为常见的处理任务，例如图像分类、语音识别等
均会使用到分类任务。
[0003]现有技术中，机器学习模型使用之前，需要训练获得机器学习模型的模型参数。在训练过程中，为了获得准确的模型参数，可以使用多个训练数据进行多次训练直至训练结果满足训练目标。在每一次训练时，可以计算多个训练样本各自的样本特征，然后将多个样本特征依次输入分类器计算获得多个训练样本各自的预测结果，以利用多个训练样本各自的预测结果以及标签信息，通过损失函数计算此次训练的损失值，以在损失值满足损失阈值时，停止训练。
[0004]但是，将多个训练样本各自的预测结果与标签信息输入损失函数时，计算获得的损失值对训练目标的判断会产生一定的误差，会导致模型训练效果较差。

技术实现思路

[0005]有鉴于此，本申请实施例提供一种数据处理方法及装置、计算设备、存储介质，用以解决现有技术中将多个训练样本各自的预测结果与标签信息输入损失函数时，计算获得的损失值对训练目标的判断会产生一定的误差，会导致模型训练效果较差的技术问题。
[0006]第一方面，本申请实施例提供一种数据处理方法，包括：
[0007]在机器学习模型任一次训练任务中，确定多个训练样本分别对应...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：在机器学习模型任一次训练任务中，确定多个训练样本分别对应的预测结果；对所述多个训练样本分别进行评价处理，获得所述多个训练样本分别对应的评价权重；基于所述多个训练样本分别对应的预测结果与评价权重，确定所述多个训练样本分别对应的损失值；根据所述多个训练样本分别对应的损失值，获取所述训练任务的训练结果。2.根据权利要求1所述的方法，其特征在于，所述在机器学习模型任一次训练任务中，确定多个训练样本分别对应的预测结果包括：在机器学习模型的任一次训练任务中，提取所述多个训练样本分别对应的样本特征；将所述多个样本特征分别输入分类器，预测获得所述多个训练样本分别对应的预测结果；所述对所述多个训练样本分别进行评价处理，获得所述多个训练样本分别对应的评价权重包括：将所述多个训练样本分别对应的样本特征进行权重计算处理，获得所述多个训练样本分别对应的评价权重。3.根据权利要求2所述的方法，其特征在于，所述将所述多个训练样本分别对应的样本特征进行权重计算处理，获得所述多个训练样本分别对应的评价权重包括：将所述多个训练样本分别对应的样本特征进行注意力机制权重计算，获得所述多个训练样本分别对应的评价权重。4.根据权利要求1所述的方法，其特征在于，所述基于所述多个训练样本分别对应的预测结果与评价权重，计算所述多个训练样本分别对应的损失值包括：针对任一个训练样本，计算所述训练样本的预测结果与评价权重的乘积，获得所述训练样本的评价结果，以获得所述多个训练样本分别对应的评价结果；将所述多个训练样本分别对应的评价结果依次输入所述损失函数，计算获得所述多个训练样本分别对应的损失值。5.根据权利要求4所述的方法，其特征在于，所述损失函数包括交叉熵函数；所述将所述多个训练样本分别对应的评价结果依次输入所述损失函数，计算获得所述多个训练样本分别对应的损失值包括：将所述多个训练样本分别对应的评价结果输入交叉熵函数，计算获得所述多个训练样本分别对应的损失值。6.根据权利要求5所述的方法，其特征在于，所述将所述多个训练样本分别对应的评价结果依次输入所述交叉熵函数，计算获得所述多个训练样本分别对应的损失值包括：确定所述多个训练样本分别对应的标签信息；针对任一个训练样本，将所述训练样本对应的标签信息以及评价结果输入所述交叉熵函数，计算获得所述训练样本对应的损失值，以获得所述多个训练样本分别对应的损失值。7.根据权利要求4所述的方法，其特征在于，所述针对任一个训练样本，计算所述训练样本的预测结果与评价权重的乘积，获得所述训练样本的评价结果，以获得所述多个训练样本分别对应的评价结果包括：
针对任一个训练样本，确定所述训练样本对应预测结果中的多个预测概率；分别计算所述多个预测概率与所述训练样本对应评价权重的乘积，计算获得多个评价概率；确定所述多个评价概率构成的所述训练样本的评价结果，以获得所述多个多个训练样本分别对应的评价结果。8.根据权利要求1所述的方法，其特征在于，所述在机器学习模型任一次训练任务中，确定多个训练样本分别对应的预测结果包括：检测用户触发的训练请求，确定待训练的机器学习模型；确定所述机器学习模型对应的所述多个训练样本；确定所述机器学习模型的第一模型参数；启动所述第一模型参数的训练任务，将所述多个训练样本分别输入所述第一模型参数对应的所述机器学习模型，...

【专利技术属性】
技术研发人员：王锴，孙佰贵，李昊，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人