数据处理方法及装置、计算设备、存储介质制造方法及图纸

技术编号:33420284 阅读:13 留言:0更新日期:2022-05-19 00:13
本申请实施例提供一种数据处理方法及装置、计算设备、存储介质,该方法包括:在机器学习模型任一次训练任务中,确定多个训练样本分别对应的预测结果;对所述多个训练样本分别进行评价处理,获得所述多个训练样本分别对应的评价权重;基于所述多个训练样本分别对应的预测结果与评价权重,确定所述多个训练样本分别对应的损失值;根据所述多个训练样本分别对应的损失值,获取所述训练任务的训练结果。本申请实施例提高了模型训练精度及准确度。请实施例提高了模型训练精度及准确度。请实施例提高了模型训练精度及准确度。

【技术实现步骤摘要】
数据处理方法及装置、计算设备、存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法及装置、计算设备、存储介质。

技术介绍

[0002]在计算机视觉、自然语言处理、机器控制等人工智能领域中,机器学习模型的应用越来越广泛。在机器学习模型中,分类是一种较为常见的处理任务,例如图像分类、语音识别等
均会使用到分类任务。
[0003]现有技术中,机器学习模型使用之前,需要训练获得机器学习模型的模型参数。在训练过程中,为了获得准确的模型参数,可以使用多个训练数据进行多次训练直至训练结果满足训练目标。在每一次训练时,可以计算多个训练样本各自的样本特征,然后将多个样本特征依次输入分类器计算获得多个训练样本各自的预测结果,以利用多个训练样本各自的预测结果以及标签信息,通过损失函数计算此次训练的损失值,以在损失值满足损失阈值时,停止训练。
[0004]但是,将多个训练样本各自的预测结果与标签信息输入损失函数时,计算获得的损失值对训练目标的判断会产生一定的误差,会导致模型训练效果较差。

技术实现思路

[0005]有鉴于此,本申请实施例提供一种数据处理方法及装置、计算设备、存储介质,用以解决现有技术中将多个训练样本各自的预测结果与标签信息输入损失函数时,计算获得的损失值对训练目标的判断会产生一定的误差,会导致模型训练效果较差的技术问题。
[0006]第一方面,本申请实施例提供一种数据处理方法,包括:
[0007]在机器学习模型任一次训练任务中,确定多个训练样本分别对应的预测结果;
[0008]对所述多个训练样本分别进行评价处理,获得所述多个训练样本分别对应的评价权重;
[0009]基于所述多个训练样本分别对应的预测结果与评价权重,确定所述多个训练样本分别对应的损失值;
[0010]根据所述多个训练样本分别对应的损失值,获取所述训练任务的训练结果。
[0011]第二方面,本申请实施例提供一种数据处理方法,包括:
[0012]响应于调用目标服务的请求,确定所述目标服务对应的处理资源;
[0013]利用所述目标服务对应的处理资源执行如下步骤:
[0014]在机器学习模型任一次训练任务中,确定多个训练样本分别对应的预测结果;
[0015]对所述多个训练样本分别进行评价处理,获得所述多个训练样本分别对应的评价权重;
[0016]基于所述多个训练样本分别对应的预测结果与评价权重,确定所述多个训练样本分别对应的损失值;
[0017]根据所述多个训练样本分别对应的损失值,获取所述训练任务的训练结果。
[0018]第三方面,本申请实施例提供一种数据处理方法,包括:
[0019]检测用户触发的训练请求,确定待训练的卷积神经网络模型;
[0020]在所述卷积神经网络模型的任一次训练任务中,确定多个训练样本分别对应的预测结果;
[0021]对所述多个训练样本分别进行评价处理,获得所述多个训练样本分别对应的评价权重;
[0022]基于所述多个训练样本分别对应的预测结果与评价权重,确定所述多个训练样本分别对应的损失值;
[0023]根据所述多个训练样本分别对应的损失值,获取所述训练任务的训练结果。
[0024]第四方面,本申请实施例提供一种数据处理装置,包括:
[0025]样本预测模块,用于在机器学习模型任一次训练任务中,确定多个训练样本分别对应的预测结果;
[0026]样本评价模块,用于对所述多个训练样本分别进行评价处理,获得所述多个训练样本分别对应的评价权重;
[0027]损失确定模块,用于基于所述多个训练样本分别对应的预测结果与评价权重,确定所述多个训练样本分别对应的损失值;
[0028]结果获取模块,用于根据所述多个训练样本分别对应的损失值,获取所述训练任务的训练结果。
[0029]第五方面,本申请实施例提供一种计算设备,包括:存储组件以及处理组件;所述存储组件用于存储一条或多条计算机指令;所述一条或多条计算机指令被所述处理组件调用以执行本申请实施例提供的任一种数据处理方法。
[0030]第六方面,本申请实施例提供一存储介质,包括:计算机可读存储介质,所述存储介质用于存储一条或多条计算机指令,所述一条或多条计算机指令执行时用以实现本申请实施例提供的任一种数据处理方法。
[0031]本申请实施例,在机器学习模型的任一次训练任务中,可以确定多个训练样本分别对应的预测结果。此外,还对该多个训练样本分别进行评价处理,以获得所述多个训练样本分别对应的评价权重,从而利用多个训练样本分别对应的评价权重以及预测结果,确定所述多个训练样本分别对应的损失值。通过对训练样本进行评价处理,以获得评价权重,实现对样本本身的挖掘,获得的评价权重体现了训练样本的鉴别性信息,利用各训练样本的评价权重参与到损失计算可以获得更为准确的损失值,提高训练的准确度。
附图说明
[0032]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本申请实施例提供的一种数据处理方法的一个实施例的流程图;
[0034]图2为本申请实施例提供的一种数据处理方法的又一个实施例的流程图;
[0035]图3为本申请实施例提供的一种数据处理方法的示例图;
[0036]图4为本申请实施例提供的一种数据处理方法的又一个实施例的流程图;
[0037]图5为本申请实施例提供的一种数据处理方法的又一个实施例的流程图;
[0038]图6为本申请实施例提供的一种数据处理装置的一个实施例的结构示意图;
[0039]图7为本申请实施例提供的一种计算设备的一个实施例的结构示意图。
具体实施方式
[0040]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0041]在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
[0042]应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:在机器学习模型任一次训练任务中,确定多个训练样本分别对应的预测结果;对所述多个训练样本分别进行评价处理,获得所述多个训练样本分别对应的评价权重;基于所述多个训练样本分别对应的预测结果与评价权重,确定所述多个训练样本分别对应的损失值;根据所述多个训练样本分别对应的损失值,获取所述训练任务的训练结果。2.根据权利要求1所述的方法,其特征在于,所述在机器学习模型任一次训练任务中,确定多个训练样本分别对应的预测结果包括:在机器学习模型的任一次训练任务中,提取所述多个训练样本分别对应的样本特征;将所述多个样本特征分别输入分类器,预测获得所述多个训练样本分别对应的预测结果;所述对所述多个训练样本分别进行评价处理,获得所述多个训练样本分别对应的评价权重包括:将所述多个训练样本分别对应的样本特征进行权重计算处理,获得所述多个训练样本分别对应的评价权重。3.根据权利要求2所述的方法,其特征在于,所述将所述多个训练样本分别对应的样本特征进行权重计算处理,获得所述多个训练样本分别对应的评价权重包括:将所述多个训练样本分别对应的样本特征进行注意力机制权重计算,获得所述多个训练样本分别对应的评价权重。4.根据权利要求1所述的方法,其特征在于,所述基于所述多个训练样本分别对应的预测结果与评价权重,计算所述多个训练样本分别对应的损失值包括:针对任一个训练样本,计算所述训练样本的预测结果与评价权重的乘积,获得所述训练样本的评价结果,以获得所述多个训练样本分别对应的评价结果;将所述多个训练样本分别对应的评价结果依次输入所述损失函数,计算获得所述多个训练样本分别对应的损失值。5.根据权利要求4所述的方法,其特征在于,所述损失函数包括交叉熵函数;所述将所述多个训练样本分别对应的评价结果依次输入所述损失函数,计算获得所述多个训练样本分别对应的损失值包括:将所述多个训练样本分别对应的评价结果输入交叉熵函数,计算获得所述多个训练样本分别对应的损失值。6.根据权利要求5所述的方法,其特征在于,所述将所述多个训练样本分别对应的评价结果依次输入所述交叉熵函数,计算获得所述多个训练样本分别对应的损失值包括:确定所述多个训练样本分别对应的标签信息;针对任一个训练样本,将所述训练样本对应的标签信息以及评价结果输入所述交叉熵函数,计算获得所述训练样本对应的损失值,以获得所述多个训练样本分别对应的损失值。7.根据权利要求4所述的方法,其特征在于,所述针对任一个训练样本,计算所述训练样本的预测结果与评价权重的乘积,获得所述训练样本的评价结果,以获得所述多个训练样本分别对应的评价结果包括:
针对任一个训练样本,确定所述训练样本对应预测结果中的多个预测概率;分别计算所述多个预测概率与所述训练样本对应评价权重的乘积,计算获得多个评价概率;确定所述多个评价概率构成的所述训练样本的评价结果,以获得所述多个多个训练样本分别对应的评价结果。8.根据权利要求1所述的方法,其特征在于,所述在机器学习模型任一次训练任务中,确定多个训练样本分别对应的预测结果包括:检测用户触发的训练请求,确定待训练的机器学习模型;确定所述机器学习模型对应的所述多个训练样本;确定所述机器学习模型的第一模型参数;启动所述第一模型参数的训练任务,将所述多个训练样本分别输入所述第一模型参数对应的所述机器学习模型,...

【专利技术属性】
技术研发人员:王锴孙佰贵李昊
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1