本公开实施例公开了一种对象预测方法、装置、电子设备、及存储介质,方法包括:确定目标对象的特征;基于多个待融合模型,分别根据所述目标对象的特征进行预测,并根据各待融合模型的预测结果和评估权重确定所述目标对象的最终预测结果;其中,各待融合模型的评估权重通过如下方式确定:基于训练集和评价指标对多个算法模型进行训练并调参得到所述多个待融合模型;基于验证集和所述评价指标分别对所述多个待融合模型进行模型评估,根据评估结果及自适应权重生成函数分别得到所述多个待融合模型的评估权重。本公开实施例的技术方案能够自适应地确定多个待融合模型对应的模型融合的权重比以进行预测,能够提升机器学习的预测性能。
Object prediction methods, devices, equipment and media
【技术实现步骤摘要】
对象预测方法、装置、设备、及介质
本公开实施例涉及机器学习
,具体涉及一种对象预测方法、装置、电子设备、及存储介质。
技术介绍
在云计算与大数据时代,机器学习在各行业发挥着越来越重要的作用。如何通过机器学习模型有效挖掘出数据中的信息并为决策提供支持,已成为一个必然的研究热点。近年来比较流行对多种模型进行模型融合,旨在综合多个不同机器学习模型的优势以改进模型预测性能,如何实现自动化的模型融合成为一个亟待解决的问题。
技术实现思路
有鉴于此,本公开实施例提供一种对象预测方法、装置、电子设备、及存储介质,能够自适应地确定多个待融合模型对应的模型融合的权重比以进行预测,能够提升机器学习的预测性能。本公开实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开实施例的实践而习得。第一方面,本公开实施例提供了一种对象预测方法,包括:确定目标对象的特征;基于多个待融合模型,分别根据所述目标对象的特征进行预测,并根据各待融合模型的预测结果和评估权重确定所述目标对象的预测结果;其中,各待融合模型的评估权重通过如下方式确定:基于训练集和评价指标对多个算法模型进行训练并调参得到所述多个待融合模型;基于验证集和所述评价指标分别对所述多个待融合模型进行模型评估,根据评估结果分别得到所述多个待融合模型的评估权重。于一实施例中,所述评价指标通过如下方式确定:根据机器学习的目标业务场景的任务目标信息,确定用于评价机器学习模型的所述评价指标。于一实施例中,所述机器学习的目标业务场景为监督学习中的分类问题场景,所述用于评价机器学习模型的评价指标包括精确率、召回率、准确率、以及ROC曲线下的面积AUC其中之一。于一实施例中,所述机器学习的目标业务场景为监督学习中的回归问题场景,所述用于评价机器学习模型的评价指标包括负均方误差、负平均绝对误差、负均方根误差以及决定系数其中之一。于一实施例中,基于验证集和所述评价指标分别对所述多个待融合模型进行模型评估包括:基于验证集和所述评价指标,采用交叉验证算法分别对所述多个待融合模型进行模型评估。于一实施例中,所述多个算法模型为N个算法模型,所述方法还包括:将样本集拆分成N份样本子集,对所述N个算法模型,分别选择N-1份样本子集作为训练集,将剩余的一份样本子集作为验证集;其中N为大于1的整数。于一实施例中,根据评估结果分别得到所述多个待融合模型的评估权重包括,根据评估结果分别得到所述多个待融合模型的评估分数,根据如下公式分别计算各待融合模型的评估权重:Wi=log(1+Si)/(1-Si);其中Wi为第i个待融合模型的评估权重,i为大于0的整数;Si为第i个待融合模型的评估分数。于一实施例中,所述对象预测方法用于预测沉船上的乘客是否存活;所述评价指标包括准确率;所述目标对象的特征至少包括乘客的姓名、年龄、性别、所有船舱等级、上船的码头、终点码头、以及职业其中之一。第二方面,本公开实施例还提供了一种对象预测装置,包括:特征确定单元,用于确定目标对象的特征;结果预测单元,用于基于多个待融合模型,分别根据所述目标对象的特征进行预测,并根据各待融合模型的预测结果和评估权重确定所述目标对象的预测结果;其中,各待融合模型的评估权重通过如下单元确定:待融合模型训练单元,用于基于训练集和评价指标对多个算法模型进行训练并调参得到所述多个待融合模型;评估权重获取单元,用于基于验证集和所述评价指标分别对所述多个待融合模型进行模型评估,根据评估结果分别得到所述多个待融合模型的评估权重。于一实施例中,所述装置还包括评价指标确定单元,用于根据机器学习的目标业务场景的任务目标信息,确定用于评价机器学习模型的所述评价指标。于一实施例中,所述机器学习的目标业务场景为监督学习中的分类问题场景,所述用于评价机器学习模型的评价指标包括精确率、召回率、准确率、以及ROC曲线下的面积AUC其中之一。于一实施例中,所述机器学习的目标业务场景为监督学习中的回归问题场景,所述用于评价机器学习模型的评价指标包括负均方误差、负平均绝对误差、负均方根误差以及决定系数其中之一。于一实施例中,所述评估权重获取单元用于:基于验证集和所述评价指标,采用交叉验证算法分别对所述多个待融合模型进行模型评估。于一实施例中,所述多个算法模型为N个算法模型,所述装置还包括样本集拆分单元,用于将样本集拆分成N份样本子集,对所述N个算法模型,分别选择N-1份样本子集作为训练集,将剩余的一份样本子集作为验证集,其中N为大于1的整数。于一实施例中,所述评估权重获取单元用于,根据评估结果分别得到所述多个待融合模型的评估分数,根据如下公式分别计算各待融合模型的评估权重:Wi=log(1+Si)/(1-Si);其中Wi为第i个待融合模型的评估权重,i为大于0的整数;Si为第i个待融合模型的评估分数。于一实施例中,所述对象预测装置用于预测沉船上的乘客是否存活;所述评价指标包括准确率;所述目标对象的特征至少包括乘客的姓名、年龄、性别、所有船舱等级、上船的码头、终点码头、以及职业其中之一。第三方面,本公开实施例还提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中任一项所述方法的指令。第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一项所述方法的步骤。本公开实施例的技术方案基于多个待融合模型,分别根据目标对象的特征进行预测,并根据各待融合模型的预测结果和评估权重确定所述目标对象的预测结果,能够自适应地确定多个待融合模型对应的模型融合的权重比以进行预测,能够提升机器学习的预测性能。附图说明为了更清楚地说明本公开实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本公开实施例中的一部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本公开实施例的内容和这些附图获得其他的附图。图1是本公开实施例提供的一种对象预测方法的流程示意图;图2是本公开实施例提供的一种对象预测方法中确定各待融合模型的评估权重的方法的流程示意图;图3是本公开实施例提供的另一种对象预测方法的示意图;图4是本公开实施例提供的另一种对象预测方法中的数据拆分示意图;图5是本公开实施例提供的一种对象预测装置的结构示意图;图6是本公开实施例提供的另一种对象预测装置的结构示意图;图7示出了适于用来实现本公开实施例的电子设备的结构示意图。具体实施方式为使本公开实施例解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本公开实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本公开实施例中的一部分实施例,而不是全部的实施例。基于本公开实施例中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开实施例保护的范围。需要说明的是,本公开实施例中术语“系统”和“网络”在本文中常被可互换使用。本公开实施例中提到的“和/或”是指”包括一个或更多个相关所列项目的任何和所有组合。本公开的说明书和权利要求书及附图本文档来自技高网...
【技术保护点】
1.一种对象预测方法,其特征在于,包括:确定目标对象的特征;基于多个待融合模型,分别根据所述目标对象的特征进行预测,并根据各待融合模型的预测结果和评估权重确定所述目标对象的预测结果;其中,各待融合模型的评估权重通过如下方式确定:基于训练集和评价指标对多个算法模型进行训练并调参得到所述多个待融合模型;基于验证集和所述评价指标分别对所述多个待融合模型进行模型评估,根据评估结果分别得到所述多个待融合模型的评估权重。
【技术特征摘要】
1.一种对象预测方法,其特征在于,包括:确定目标对象的特征;基于多个待融合模型,分别根据所述目标对象的特征进行预测,并根据各待融合模型的预测结果和评估权重确定所述目标对象的预测结果;其中,各待融合模型的评估权重通过如下方式确定:基于训练集和评价指标对多个算法模型进行训练并调参得到所述多个待融合模型;基于验证集和所述评价指标分别对所述多个待融合模型进行模型评估,根据评估结果分别得到所述多个待融合模型的评估权重。2.根据权利要求1所述的方法,其特征在于,所述评价指标通过如下方式确定:根据机器学习的目标业务场景的任务目标信息,确定用于评价机器学习模型的所述评价指标。3.根据权利要求2所述的方法,其特征在于,所述机器学习的目标业务场景为监督学习中的分类问题场景,所述用于评价机器学习模型的评价指标包括精确率、召回率、准确率、以及ROC曲线下的面积AUC其中之一。4.根据权利要求2所述的方法,其特征在于,所述机器学习的目标业务场景为监督学习中的回归问题场景,所述用于评价机器学习模型的评价指标包括负均方误差、负平均绝对误差、负均方根误差以及决定系数其中之一。5.根据权利要求1所述的方法,其特征在于,基于验证集和所述评价指标分别对所述多个待融合模型进行模型评估包括:基于验证集和所述评价指标,采用交叉验证算法分别对所述多个待融合模型进行模型评估。6.根据权利要求1所述的方法,其特征在于,所述多个算法模型为N个算法模型,所述方法还包括:将样本集拆分成N份样本子集,对所述N个算法模型,分别选择N-1份样本子集作为训练集,将剩余的一份样本子集作为验证集;其中N为大于1的整...
【专利技术属性】
技术研发人员:梁彧,张娇婷,金红,杨满智,刘长永,陈晓光,
申请(专利权)人:恒安嘉新北京科技股份公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。