【技术实现步骤摘要】
数据分析方法和装置
[0001]本申请涉及数据分析领域,尤其涉及数据分析方法和装置。
技术介绍
[0002]现有技术中,当业务人员关心的业务的数据指标出现波动(比如订单数月环比上升/下降X%)时,如图1所示:
[0003](1)首先业务人员需要自己发现数据指标发生波动的问题,通过排除数据未更新或数据存在异常值来确认数据指标波动是由业务活动造成的,即确认问题。然后开始对问题进行分析,人工根据一定的分析流程,对数据进行分析,得到分析结论。分析结论可以包括数据波动问题的可能原因,针对性的解决方案或建议。这个分析过程一般需要1~2天。该方案中,如果分析过程中遇到困难,例如数据量过大,则所用的时间会更长,甚至可能无法得出分析结果。此外,如果业务数据指标经常波动,需要业务人员或数据分析人员重复进行上述分析过程,不仅效率低,而且业务人员的精力也会不足。
[0004](2)有关于数据指标的数据报表可供进行数据分析,但出于专业性的考虑,业务人员会将数据报表交给数据团队来分析。数据团队根据数据报表对数据进行分析后,将得出的分析结论发送给业务人员。该方案会增加业务人员所在公司的成本,交接的过程会浪费时间,且有业务数据泄密的风险。
[0005]基于此,现有技术提供一种自动数据分析方法,该自动数据分析方法通过选取的分析规则组合成分析模板,利用分析模板对数据进行异常分析得到分析结果。但是这种方法存在以下缺点:
[0006](1)需要人工选取分析规则生成分析模版。
[0007](2)分析模版分析的是数据是否 ...
【技术保护点】
【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:获取对第一业务的数据进行数据分析的关键指标数值;根据所述关键指标数值,确定对第一业务的关键指标影响重要性排序前M的M个参考维度,M为正整数;确定所述M个参考维度中每个参考维度下对所述关键指标影响重要性排序前N的N个子维度中每个子维度的关键指标与业务指标的相关性,N为正整数;根据所述相关性,确定对所述第一业务的关键指标影响的关键根因和行为建议。2.根据权利要求1所述的方法,其特征在于,所述根据所述相关性,确定对所述第一业务的关键指标影响的关键根因和行为建议包括:根据所述相关性,确定对所述关键指标影响重要性排序前K的K个业务指标,K为正整数;将所述K个业务指标对应的业务根因确定为对所述关键指标影响的关键根因;根据所述关键根因确定对所述关键指标影响的行为建议。3.根据权利要求2所述的方法,其特征在于,所述K个业务指标对应的业务根因为预先配置的业务根因库中的业务根因,所述业务根因库为与所述关键指标对应的业务根因库。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述根据所述关键指标数值,确定对第一业务的关键指标影响重要性排序前M的M个参考维度,包括:根据预设参考维度中每个参考维度下,子维度的最大关键指标数值,确定对所述关键指标影响重要性排序前M的M个参考维度。5.根据权利要求4所述的方法,其特征在于,所述根据预设参考维度中每个参考维度下,子维度的最大关键指标数值,确定对所述关键指标影响重要性排序前M的M个参考维度,包括:根据所述预设参考维度中每个参考维度下,子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对所述关键指标影响重要性排序前M的M个参考维度。6.根据权利要求5所述的方法,其特征在于,根据所述预设参考维度中每个参考维度下,子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对所述关键指标影响重要性排序前M的M个参考维度,包括:根据所述第一业务的关键指标数值在分析周期内的波动程度,确定参考值,所述参考值用于在确定对所述关键指标影响重要性排序前M的M个参考维度前过滤所述预设参考维度下的子维度,获得目标参考子维度;根据预设参考维度中每个参考维度下,目标参考子维度的最大关键指标数值和最大关键指标数值在分析周期内的波动程度,确定对关键指标影响重要性排序前M的M个参考维度。7.根据权利要求1
‑
6任一项所述的方法,其特征在于,所述每个子维度的关键指标与业务指标的相关性的计算规则满足如下关系:
其中,i=1,2,3,
…
,n1,j=1,2,3,
…
,n2,n1和n2为大于1的整数;X
i
表示每个子维度的参数为i的关键指标的数值的集合;Y
j
表示每个子维度的参数为j的业务指标的数值的集合;corr(X
i
,Y
j
)表示X
i
与Y
j
之间的相关性;cov表示协方差;σ表示标准差。8.根据权利要求7所述的方法,其特征在于,当所述corr(X
i
,Y
j
)的绝对值处于[0.8,1]区间时,所述每个子维度的参数为i的关键指标与参数为j的业务指标强相关;或者,所述corr(X
i
,Y
j
)的绝对值处于[0.5,0.8)区间时,所述每个子维度的参数为i的关键指标与参数为j的业务指标中等相关;或者,所述corr(X
i
,Y
j
)的绝对值处于[0.3,0.5)区间时,所述每个子维度的参数为i的关键指标与参数为j的业务指标弱相关;或者,所述corr(X
i
,Y
j
)的绝对值处于[0,0.3)时,所述每个子维度的参数为i的关键指标与参数为j的业务指标不相关。9.根据权利要求1
‑
8任一项所述的方法,其特征在于,所述方法还包括:根据所述关键根因和行为建议确定分析报告;将所述分析报告通过前台界面或邮件显示给用户。10.根据权利要求9所述的方法,其特征在于,所述前台界面包括管理功能;所述管理功能包括分析规则配置功能、数据展示功能、关键根因和行为建议展示功能等功能。11.一种数据分析装置,其特征在于,所述数据分析装置包括处理模块:所述处理模块,用于获取对第一业务的数据进行数据分析的关键指标数值;所述处理模块,还用于根据所述关键指...
【专利技术属性】
技术研发人员:刘纪方,金长宁,王国强,孟平,史超,
申请(专利权)人:南京意博软件科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。