业务时序指标的归因方法以及装置制造方法及图纸

技术编号:24856335 阅读:29 留言:0更新日期:2020-07-10 19:09
本说明书实施例提供业务时序指标的归因方法以及装置,其中所述方法包括:将特征池输入第一机器学习模型进行训练,得到变量的特征权重,特征池中包括基于业务时序指标样本分解得到的多个变量,模型对业务时序指标样本的时间曲线进行拟合,如果未达到预设训练目标,通过可解释机器学习框架进行影响特征权重的计算,按影响特征权重筛选出变量组合,添加到特征池中,输入模型进行迭代,实现了基于模型解释性算法的特征自适应迭代,如果达到预设训练目标,则可以从特征池确定具有耦合关系的变量组合,计算出变量组合对异常时间点的异常变动幅度的贡献系数,实现了业务时序指标的归因。

【技术实现步骤摘要】
业务时序指标的归因方法以及装置
本说明书实施例涉及数据处理
,特别涉及一种业务时序指标的归因方法。本说明书一个或者多个实施例同时涉及一种业务时序指标的归因装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
在智能化数据业务管理的场景中,为了能够提升管理能力和效率,需要对管理的业务指标进行监控。若要对业务指标进行监控,则需要对业务指标与其关键影响因子的相关性进行归因。利用关键影响因子的相关性来对业务指标的发展趋势和波动进行监控。但是,在业务指标中,存在着变量耦合关系难以确定、动态时变等特性的业务时序指标。基于这些特性,目前很难对业务时序指标进行归因。
技术实现思路
有鉴于此,本说明书施例提供了一种业务时序指标的归因方法。本说明书一个或者多个实施例同时涉及一种业务时序指标的归因装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种业务时序指标的归因方法,包括:将特征池输入第一机器学习模型进行训练,得到所述特征池中的变量的特征权重,其中,所述特征池中包括基于业务时序指标样本分解得到的多个变量,所述第一机器学习模型,用于通过调整所述特征池中变量的特征权重对所述业务时序指标样本的时间曲线进行拟合;如果所述第一机器学习模型的训练未达到预设训练目标,通过可解释机器学习框架对所述第一机器学习模型得到的特征权重进行影响特征权重的计算,按影响特征权重筛选出变量组合,将所述变量组合添加到所述特征池中,重新进入所述将特征池输入第一机器学习模型进行训练的步骤;如果所述第一机器学习模型的训练达到预设训练目标,根据所述特征池包含的变量组合对应的特征权重,确定所述业务时序指标样本的多个变量中,具有耦合关系的变量组合;计算所述具有耦合关系的变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数。可选地,所述按影响特征权重筛选出变量组合包括:分别针对各业务时序指标样本,按所针对的业务时序指标样本的多个变量各自的影响特征权重,对所针对的业务时序指标样本的多个变量进行排序;筛选出分别在多个业务时序指标样本的排序在前的变量中组合出现的多个变量作为变量组合。可选地,还包括:如果所述第一机器学习模型的训练达到预设训练目标,根据所述特征池包含的变量对应的特征权重,确定所述业务时序指标样本的多个变量中,具有耦合关系的变量;计算所述具有耦合关系的变量对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数。可选地,所述计算所述具有耦合关系的变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数包括:基于所述具有耦合关系的变量以及变量组合,对所述业务时序指标样本构建第二机器学习模型;基于所述第二机器学习模型,以所述业务时序指标样本在异常时间点达到异常变动幅度为目标,对所述具有耦合关系的变量以及变量组合分别对应的权重系数进行求解,求解得到的权重系数作为所述贡献系数。可选地,所述计算所述具有耦合关系的变量以及变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数包括:将所述第一机器学习模型得到的具有耦合关系的变量以及变量组合分别对应的特征权重作为输入,利用可解释机器学习框架的局部加性模型做近似,拆解出所述具有耦合关系的变量以及变量组合分别对所述异常时间点的异常变动幅度的贡献系数。可选地,所述计算所述具有耦合关系的变量以及变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数包括:基于所述具有耦合关系的变量以及变量组合,对所述业务时序指标样本构建第二机器学习模型;基于所述第二机器学习模型,以所述业务时序指标样本在异常时间点达到异常变动幅度为目标,对所述具有耦合关系的变量以及变量组合分别对应的权重系数进行求解;将所述第二机器学习模型得到的具有耦合关系的变量以及变量组合分别对应的权重系数作为输入,利用可解释机器学习框架的局部加性模型做近似,拆解出所述具有耦合关系的变量以及变量组合分别对所述异常时间点的异常变动幅度的贡献系数。根据本说明书实施例的第二方面,提供了一种业务时序指标的归因装置,包括:模型训练模块,被配置为将特征池输入第一机器学习模型进行训练,得到所述特征池中的变量的特征权重,其中,所述特征池中包括基于业务时序指标样本分解得到的多个变量,所述第一机器学习模型,用于通过调整所述特征池中变量的特征权重对所述业务时序指标样本的时间曲线进行拟合。可解释学习模块,被配置为如果所述第一机器学习模型的训练未达到预设训练目标,通过可解释机器学习框架对所述第一机器学习模型得到的特征权重进行影响特征权重的计算,按影响特征权重筛选出变量组合。特征添加模块,被配置为将所述变量组合添加到所述特征池中,触发所述模型训练模块重新进入所述将特征池输入第一机器学习模型进行训练的步骤。耦合变量确定模块,被配置为如果所述第一机器学习模型的训练达到预设训练目标,根据所述特征池包含的变量组合,确定所述业务时序指标样本的多个变量中,具有耦合关系的变量组合。贡献系数计算模块,被配置为计算所述具有耦合关系的变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数。可选地,所述可解释学习模块包括:影响计算子模块,被配置为通过可解释机器学习框架对所述机器学习模型得到的特征权重进行影响特征权重的计算,得到所述业务时序指标样本的变量的影响特征权重。排序子模块,被配置为分别针对各业务时序指标样本,按所针对的业务时序指标样本的多个变量各自的影响特征权重,对所针对的业务时序指标样本的多个变量进行排序。组合提取子模块,被配置为筛选出分别在多个业务时序指标样本的排序在前的变量中组合出现的多个变量作为变量组合。可选地,所述耦合变量确定模块,还被配置为如果所述第一机器学习模型的训练达到预设训练目标,根据所述特征池包含的变量对应的特征权重,确定所述业务时序指标样本的多个变量中,具有耦合关系的变量。所述贡献系数计算模块,还被配置为计算所述具有耦合关系的变量对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数。可选地,所述贡献系数计算模块包括:模型构建子模块,被配置为基于所述具有耦合关系的变量以及变量组合,对所述业务时序指标样本构建第二机器学习模型。模型求解子模块,被配置为基于所述第二机器学习模型,以所述业务时序指标样本在异常时间点达到异常变动幅度为目标,对所述具有耦合关系的变量以及变量组合分别对应的权重系数进行求解,求解得到的权重系数作为所述贡献系数。可选地,所述贡献系数计算模块,被配置为将所述第一机器学习模型得到的具有耦合关系的变量以及变量组合分别对应的特征权重作为输入,利用可解释机器学习框架的局部加性模型做近似,拆解出所述具有耦合关系的变量以及变量组合分别对所述异常时间点的异常变动幅度的贡献系数。可选地,所述贡献系数计算模块包括:模型构建子模块,被配置为基于所述具有耦合关系的变量以及变量组合,对所述业务时序指标样本构建第二机器学习模型。模型求解子模块,被配置为基于所述第二机器学习模型,以所述业务时序指标样本本文档来自技高网...

【技术保护点】
1.一种业务时序指标的归因方法,包括:/n将特征池输入第一机器学习模型进行训练,得到所述特征池中的变量的特征权重,其中,所述特征池中包括基于业务时序指标样本分解得到的多个变量,所述第一机器学习模型,用于通过调整所述特征池中变量的特征权重对所述业务时序指标样本的时间曲线进行拟合;/n如果所述第一机器学习模型的训练未达到预设训练目标,通过可解释机器学习框架对所述第一机器学习模型得到的特征权重进行影响特征权重的计算,按影响特征权重筛选出变量组合,将所述变量组合添加到所述特征池中,重新进入所述将特征池输入第一机器学习模型进行训练的步骤;/n如果所述第一机器学习模型的训练达到预设训练目标,根据所述特征池包含的变量组合对应的特征权重,确定所述业务时序指标样本的多个变量中,具有耦合关系的变量组合;/n计算所述具有耦合关系的变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数。/n

【技术特征摘要】
1.一种业务时序指标的归因方法,包括:
将特征池输入第一机器学习模型进行训练,得到所述特征池中的变量的特征权重,其中,所述特征池中包括基于业务时序指标样本分解得到的多个变量,所述第一机器学习模型,用于通过调整所述特征池中变量的特征权重对所述业务时序指标样本的时间曲线进行拟合;
如果所述第一机器学习模型的训练未达到预设训练目标,通过可解释机器学习框架对所述第一机器学习模型得到的特征权重进行影响特征权重的计算,按影响特征权重筛选出变量组合,将所述变量组合添加到所述特征池中,重新进入所述将特征池输入第一机器学习模型进行训练的步骤;
如果所述第一机器学习模型的训练达到预设训练目标,根据所述特征池包含的变量组合对应的特征权重,确定所述业务时序指标样本的多个变量中,具有耦合关系的变量组合;
计算所述具有耦合关系的变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数。


2.根据权利要求1所述的方法,所述按影响特征权重筛选出变量组合包括:
分别针对各业务时序指标样本,按所针对的业务时序指标样本的多个变量各自的影响特征权重,对所针对的业务时序指标样本的多个变量进行排序;
筛选出分别在多个业务时序指标样本的排序在前的变量中组合出现的多个变量作为变量组合。


3.根据权利要求1所述的方法,还包括:
如果所述第一机器学习模型的训练达到预设训练目标,根据所述特征池包含的变量对应的特征权重,确定所述业务时序指标样本的多个变量中,具有耦合关系的变量;
计算所述具有耦合关系的变量对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数。


4.根据权利要求1所述的方法,所述计算所述具有耦合关系的变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数包括:
基于具有耦合关系的变量以及变量组合,对所述业务时序指标样本构建第二机器学习模型;
基于所述第二机器学习模型,以所述业务时序指标样本在异常时间点达到异常变动幅度为目标,对具有耦合关系的变量以及变量组合分别对应的权重系数进行求解,求解得到的权重系数作为所述贡献系数。


5.根据权利要求1所述的方法,所述计算所述具有耦合关系的变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数包括:
将所述第一机器学习模型得到的具有耦合关系的变量以及变量组合分别对应的特征权重作为输入,利用可解释机器学习框架的局部加性模型做近似,拆解出所述具有耦合关系的变量以及变量组合分别对所述异常时间点的异常变动幅度的贡献系数。


6.根据权利要求1所述的方法,所述计算所述具有耦合关系的变量组合对所述业务时序指标样本的异常时间点的异常变动幅度的贡献系数包括:
基于所述具有耦合关系的变量以及变量组合,对所述业务时序指标样本构建第二机器学习模型;
基于所述第二机器学习模型,以所述业务时序指标样本在异常时间点达到异常变动幅度为目标,对所述具有耦合关系的变量以及变量组合分别对应的权重系数进行求解;
将所述第二机器学习模型得到的具有耦合关系的变量以及变量组合分别对应的权重系数作为输入,利用可解释机器学习框架的局部加性模型做近似,拆解出所述具有耦合关系的变量以及变量组合分别对所述异常时间点的异常变动幅度的贡献系数。


7.一种业务时序指标的归因装置,包括:
模型训练模块,被配置为将特征池输入第一机器学习模型进行训练,得到所述特征池中的变量的特征权重,其中,所述特征池中包括基于业务时序指标样本分解得到的多个变量,所述第一机器学习模型,用于通过调整所述特征池中变量的特征权重对所述业务时序指标样本的时间曲线进行拟合;
可解释学习模块,被配置为如果所述第一机器学习模型的训练未达到预设训练目标,通过可解释机器学习框架对所述第一机器学习模型得到的特征权重进行影响特征权重的计算,按影响特征权重筛选出变量组合;
特征添加模块,被配置为将所述变量组合添加到所述特征池中,触发所述模型训练模块重新进入所述将特征池输入第一机器学习模型进行训练的步骤;
耦合变量确定模块,被配置...

【专利技术属性】
技术研发人员:姜玉坤杨耀刘磊焦瑜净
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1