数据分析方法和装置制造方法及图纸

技术编号:34363342 阅读:17 留言:0更新日期:2022-07-31 07:57
本申请实施例提供数据分析方法和装置,用于实现整个数据分析过程的全自动化。方法包括:获取对第一业务的数据进行数据分析的关键指标数值;根据关键指标数值,确定对第一业务的关键指标影响重要性排序前M的M个参考维度,M为正整数;确定M个参考维度中每个参考维度下对关键指标影响重要性排序前N的N个子维度中每个子维度的关键指标与业务指标的相关性,N为正整数;根据相关性,确定对第一业务的关键指标影响的关键根因和行为建议。本申请适用于数据分析领域。数据分析领域。数据分析领域。

Data analysis method and device

【技术实现步骤摘要】
数据分析方法和装置


[0001]本申请涉及数据分析领域,尤其涉及数据分析方法和装置。

技术介绍

[0002]现有技术中,当业务人员关心的业务的数据指标出现波动(比如订单数月环比上升/下降X%)时,如图1所示:
[0003](1)首先业务人员需要自己发现数据指标发生波动的问题,通过排除数据未更新或数据存在异常值来确认数据指标波动是由业务活动造成的,即确认问题。然后开始对问题进行分析,人工根据一定的分析流程,对数据进行分析,得到分析结论。分析结论可以包括数据波动问题的可能原因,针对性的解决方案或建议。这个分析过程一般需要1~2天。该方案中,如果分析过程中遇到困难,例如数据量过大,则所用的时间会更长,甚至可能无法得出分析结果。此外,如果业务数据指标经常波动,需要业务人员或数据分析人员重复进行上述分析过程,不仅效率低,而且业务人员的精力也会不足。
[0004](2)有关于数据指标的数据报表可供进行数据分析,但出于专业性的考虑,业务人员会将数据报表交给数据团队来分析。数据团队根据数据报表对数据进行分析后,将得出的分析结论发送给业务人员。该方案会增加业务人员所在公司的成本,交接的过程会浪费时间,且有业务数据泄密的风险。
[0005]基于此,现有技术提供一种自动数据分析方法,该自动数据分析方法通过选取的分析规则组合成分析模板,利用分析模板对数据进行异常分析得到分析结果。但是这种方法存在以下缺点:
[0006](1)需要人工选取分析规则生成分析模版。
[0007](2)分析模版分析的是数据是否存在异常,得到是异常结果后,还需要业务人员做二次分析才能确定导致数据异常的关键根因。
[0008]因此,如何实现整个数据分析过程的全自动化,是目前亟待解决的问题。

技术实现思路

[0009]本申请实施例提供一种数据分析的方法和装置,用于解决如何实现整个数据分析过程的全自动化的问题。
[0010]为达到上述目的,本申请的实施例采用如下技术方案:
[0011]第一方面,提供了一种数据分析的方法,该方法包括:获取对第一业务的数据进行数据分析的关键指标数值;根据关键指标数值,确定对第一业务的关键指标影响重要性排序前M的M个参考维度,M为正整数;确定M个参考维度中每个参考维度下对关键指标影响重要性排序前N的N个子维度中每个子维度的关键指标与业务指标的相关性,N为正整数;根据相关性,确定对第一业务的关键指标影响的关键根因和行为建议。基于本申请实施例提供的数据分析方法,可以全自动地根据业务数据分析关键指标,实现了实现整个数据分析过程的全自动化,提高了数据分析的效率。
[0012]结合上述第一方面,在一种可能的实现方式中,根据相关性,确定对第一业务的关键指标影响的关键根因和行为建议:根据相关性,确定对关键指标影响重要性排序前K的K个业务指标,K为正整数;将K个业务指标对应的业务根因确定为对关键指标影响的关键根因;根据关键根因确定对关键指标影响的行为建议。基于本申请实施例提供的数据分析方法,能够根据关键指标与业务指标的相关性,确定对关键指标影响大的关键根因,实现了自动化确定对第一业务的关键指标影响的关键根因和行为建议。
[0013]结合上述第一方面,在一种可能的实现方式中,K个业务指标对应的业务根因为预先配置的业务根因库中的业务根因,业务根因库为与关键指标对应的业务根因库。基于本申请实施例提供的数据分析方法,能够预先配置与关键指标对应的业务根因库和与业务根因对应的业务指标,实现在数据分析过程中自动确定业务根因和业务指标。
[0014]结合上述第一方面,在一种可能的设计中,根据关键指标数值,确定对第一业务的关键指标影响重要性排序前M的M个参考维度,包括:根据预设参考维度中每个参考维度下,子维度的最大关键指标数值,确定对关键指标影响重要性排序前M的M个参考维度。基于本申请实施例提供的数据分析方法,能够根据子维度的最大关键指标数值从预设参考维度中选出对关键指标影响大的参考维度,提高了数据分析的准确性。
[0015]结合上述第一方面,在一种可能的实现方式中,根据预设参考维度中每个参考维度下,子维度的最大关键指标数值,确定对关键指标影响重要性排序前M的M个参考维度,包括:根据预设参考维度中每个参考维度下,子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对关键指标影响重要性排序前M的M个参考维度。基于本申请实施例提供的数据分析方法,能够根据子维度的最大关键指标数值和最大关键指标数值的波动程度确定对关键指标影响大的参考维度,提高了数据分析的全面性和准确性。
[0016]结合上述第一方面,在一种可能的实现方式中,根据预设参考维度中每个参考维度下,子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对关键指标影响重要性排序前M的M个参考维度,包括:根据第一业务的关键指标数值在分析周期内的波动程度,确定参考值,参考值用于在确定对关键指标影响重要性排序前M的M个参考维度前过滤预设参考维度下的子维度,获得目标参考子维度;根据目标参考子维度中,子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对关键指标影响重要性排序前M的M个参考维度。基于本申请实施例提供的数据分析方法,能够通过参考值过滤对关键指标波动影响不大的子维度,且根据过滤后的子维度的最大关键指标数值和最大关键指标数值的波动程度选取出对关键指标影响大的参考维度,提高了数据分析的全面性和准确性。
[0017]结合上述第一方面,在一种可能的实现方式中,每个子维度的关键指标与业务指标的相关性的计算规则满足如下关系:其中,i=1,2,3,

,n1,j=1,2,3,

,n2,n1和n2为大于1的整数;X
i
表示每个子维度的参数为i的关键指标的数值的集合;Y
j
表示每个子维度的参数为j的业务指标的数值的集合;corr(X
i
,Y
j
)表示X
i
与Y
j
之间的相关性;cov表示协方差;σ表示标准差。基于本申请实施例提供的数据分析方法,提供了子维度的关键指标与业务指标的相关性的计算规则,能够通过数字准确表示出子维度的关键指标与业务指标的相关性。
[0018]结合上述第一方面,在一种可能的实现方式中,当corr(X
i
,Y
j
)的绝对值处于[0.8,1]区间时,每个子维度的参数为i的关键指标与参数为j的业务指标强相关;或者,corr(X
i
,Y
j
)的绝对值处于[0.5,0.8)区间时,每个子维度的参数为i的关键指标与参数为j的业务指标中等相关;或者,corr(X
i
,Y
j
)的绝对值处于[0.3,0.5)区间时,每个子维度的参数为i的关键指标与参数为j的业务指标弱相关;或者,corr(X
i
,Y
j
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:获取对第一业务的数据进行数据分析的关键指标数值;根据所述关键指标数值,确定对第一业务的关键指标影响重要性排序前M的M个参考维度,M为正整数;确定所述M个参考维度中每个参考维度下对所述关键指标影响重要性排序前N的N个子维度中每个子维度的关键指标与业务指标的相关性,N为正整数;根据所述相关性,确定对所述第一业务的关键指标影响的关键根因和行为建议。2.根据权利要求1所述的方法,其特征在于,所述根据所述相关性,确定对所述第一业务的关键指标影响的关键根因和行为建议包括:根据所述相关性,确定对所述关键指标影响重要性排序前K的K个业务指标,K为正整数;将所述K个业务指标对应的业务根因确定为对所述关键指标影响的关键根因;根据所述关键根因确定对所述关键指标影响的行为建议。3.根据权利要求2所述的方法,其特征在于,所述K个业务指标对应的业务根因为预先配置的业务根因库中的业务根因,所述业务根因库为与所述关键指标对应的业务根因库。4.根据权利要求1

3任一项所述的方法,其特征在于,所述根据所述关键指标数值,确定对第一业务的关键指标影响重要性排序前M的M个参考维度,包括:根据预设参考维度中每个参考维度下,子维度的最大关键指标数值,确定对所述关键指标影响重要性排序前M的M个参考维度。5.根据权利要求4所述的方法,其特征在于,所述根据预设参考维度中每个参考维度下,子维度的最大关键指标数值,确定对所述关键指标影响重要性排序前M的M个参考维度,包括:根据所述预设参考维度中每个参考维度下,子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对所述关键指标影响重要性排序前M的M个参考维度。6.根据权利要求5所述的方法,其特征在于,根据所述预设参考维度中每个参考维度下,子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对所述关键指标影响重要性排序前M的M个参考维度,包括:根据所述第一业务的关键指标数值在分析周期内的波动程度,确定参考值,所述参考值用于在确定对所述关键指标影响重要性排序前M的M个参考维度前过滤所述预设参考维度下的子维度,获得目标参考子维度;根据预设参考维度中每个参考维度下,目标参考子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对关键指标影响重要性排序前M的M个参考维度。7.根据权利要求1

6任一项所述的方法,其特征在于,所述每个子维度的关键指标与业务指标的相关性的计算规则满足如下关系:
其中,i=1,2,3,

,n1,j=1,2,3,

,n2,n1和n2为大于1的整数;X
i
表示每个子维度的参数为i的关键指标的数值的集合;Y
j
表示每个子维度的参数为j的业务指标的数值的集合;corr(X
i
,Y
j
)表示X
i
与Y
j
之间的相关性;cov表示协方差;σ表示标准差。8.根据权利要求7所述的方法,其特征在于,当所述corr(X
i
,Y
j
)的绝对值处于[0.8,1]区间时,所述每个子维度的参数为i的关键指标与参数为j的业务指标强相关;或者,所述corr(X
i
,Y
j
)的绝对值处于[0.5,0.8)区间时,所述每个子维度的参数为i的关键指标与参数为j的业务指标中等相关;或者,所述corr(X
i
,Y
j
)的绝对值处于[0.3,0.5)区间时,所述每个子维度的参数为i的关键指标与参数为j的业务指标弱相关;或者,所述corr(X
i
,Y
j
)的绝对值处于[0,0.3)时,所述每个子维度的参数为i的关键指标与参数为j的业务指标不相关。9.根据权利要求1

8任一项所述的方法,其特征在于,所述方法还包括:根据所述关键根因和行为建议确定分析报告;将所述分析报告通过前台界面或邮件显示给用户。10.根据权利要求9所述的方法,其特征在于,所述前台界面包括管理功能;所述管理功能包括分析规则配置功能、数据展示功能、关键根因和行为建议展示功能等功能。11.一种数据分析装置,其特征在于,所述数据分析装置包括处理模块:所述处理模块,用于获取对第一业务的数据进行数据分析的关键指标数值;所述处理模块,还用于根据所述关键指...

【专利技术属性】
技术研发人员:刘纪方金长宁王国强孟平史超
申请(专利权)人:南京意博软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1