数据分析的方法、装置、设备以及存储介质制造方法及图纸

技术编号:26531152 阅读:14 留言:0更新日期:2020-12-01 14:11
本申请公开了数据分析的方法、装置、设备以及存储介质,涉及大数据、信息技术等领域。具体实现方案为:根据数据的变化情况确定异常时段;数据包括加载多个维度标签的数据;根据异常时段的数据和正常时段的数据的差异,确定异常时段的根因维度标签;正常时段是预先确定的;对加载根因维度标签的数据进行分析,得到数据分析结果。本申请直接利用异常时段和正常时段的数据即可进行分析,降低了数据获取的复杂程度,提高了数据分析的效率。

【技术实现步骤摘要】
数据分析的方法、装置、设备以及存储介质
本申请涉及数据处理领域,尤其涉及大数据、信息技术等领域。
技术介绍
为了更好地实时了解和分析服务的运行状况,互联网公司通常会在采集数据时,会附上属性标签,如用户代理(UA,UserAgent)、网络制式、地理位置等。由此构成了采集数据的多维度表示。常规方式利用人工方式对采集数据进行分析比对,从而根据属性标签确定故障原因。或者,在采集数据中筛选出正常数据和异常数据,从而根据属性标签确定故障原因。上述方法耗时费力。
技术实现思路
本申请提供了一种数据分析的方法、装置、设备以及存储介质。根据本申请的一方面,提供了一种数据分析的方法,该方法可以包括以下步骤:根据数据的变化情况确定异常时段;数据包括加载多个维度标签的数据;根据异常时段的数据和正常时段的数据的差异,确定根因维度标签;正常时段是预先确定的;对加载根因维度标签的数据进行分析,得到数据分析结果。根据本申请的另一方面,提供了一种数据分析的装置,该装置可以包括以下组件:异常时段确定模块,用于根据数据的变化情况确定异常时段;数据包括加载多个维度标签的数据;根因维度标签确定模块,用于根据异常时段的数据和正常时段的数据的差异,确定根因维度标签;正常时段是预先确定的;数据分析模块,用于对加载根因维度标签的数据进行分析,得到数据分析结果。第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请任意一项实施例所提供的方法。第四方面,本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本申请任意一项实施例所提供的方法。根据本申请的技术,在确定出异常时段的情况下,通过将异常时段与正常时段的数据进行比对,利用数据差异确定出加载根因维度的数据。进而可以通过对加载根因维度标签的数据进行分析快速确认出现异常时段的原因。本申请直接利用异常时段和正常时段的数据即可进行分析,降低了数据获取的复杂程度,提高了数据分析的效率。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请的数据分析的方法的流程图;图2是根据本申请的确定根因维度标签的流程图;图3是根据本申请的利用决策树确定根因维度标签的示意图;图4是根据本申请的确定数据差异的流程图;图5是根据本申请的数据分析的装置的示意图;图6是用来实现本申请实施例的数据分析的方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。如图1所示,本申请提供一种数据分析的方法,该方法可以包括以下步骤:S101:根据数据的变化情况确定异常时段;数据包括加载多个维度标签的数据;S102:根据异常时段的数据和正常时段的数据的差异,确定根因维度标签;正常时段是预先确定的;S103:对加载根因维度标签的数据进行分析,得到数据分析结果。在本申请的实施例中,数据可以是用户的访问数据、请求数据等。例如,访问可以包括用户点击或登录目标页面的操作。请求可以包括交易请求操作、数据传输请求操作等。用户的每一个操作均可以作为一个数据。另外,对于每一个数据,均可以对其加载标签。示例性的,标签可以包括用户的操作类型、用户的网络地址、用户的网络运营商以及用户的地理位置等不同维度。正常时段可以是预先确定的。例如,将经过分析确定的不存在数据异常的时段确定为正常时段。其中,数据激增、数据突降等均可以认为是数据异常。异常时段可以是相对于正常时段而言的。通过对数据流量的监控,可以利用数据的变化情况确定出异常时段。例如,相比于正常时段,在某个时段中数据访问量出现突增或突降等情况下,可以将该时段确定为异常时段。或者,在某个时段中出现操作未成功的比例突增(例如,操作未成功可以包括无法正常支付或无法正常访问页面等)的情况下,也可以将该时段确定为异常时段。本实施例中,异常时段可以是实时发生的。从而可以对实时发生的异常情况进行及时分析。通过对异常时段和正常时段的数据进行差异化比较,从而可以确定出存在差异数据所对应的维度标签为根因维度标签。以维度标签包括用户的网络运营商和/或用户的地理位置为例。其中,用户的网络运营商所对应的维度标签具体可以包括网络运营商A、网络运营商B、网络运营商C。用户的地理位置所对应的维度标签具体可以包括北京、上海、广州等。例如,通过比较可以确定出存在差异数据所对应的根因维度标签是“北京”、“网络运营商A”。基于此,可以将加载维度标签“北京”、“网络运营商A”的数据进行分析,得到数据分析结果。在数据分析过程中,例如在异常时段为负载过高的情况下,可以对加载维度标签“北京”、“网络运营商A”的数据中的正常数据进行分析。又例如,在异常时段为如流量突降的情况下,可以对加载维度标签“北京”、“网络运营商A”的数据中的异常数据进行分析,从而得到出现数据异常的原因。其中,前述的正常数据可以是操作成功的数据,例如访问页面成功的数据、支付成功的数据等。异常数据可以是操作未成功的数据。通过上述方案,在确定出异常时段的情况下,通过将异常时段与正常时段的数据进行比对,利用数据差异确定出加载根因维度的数据。进而可以通过对加载根因维度标签的数据进行分析快速确认出现异常时段的原因。结合图2所示,在一种实施方式中,步骤S102可以包括以下步骤:S1021:获取加载待确定的维度标签的正常时段的数据以及加载待确定的维度标签的异常时段的数据;S1022:在正常时段的数据和异常时段的数据的差异满足预定条件的情况下,将待确定的维度标签确定为根因维度标签。可以结合决策树,确定出根因维度标签。即,结合决策树确定出异常时段的原因。例如,可以将异常时段和正常时段中的数据的维度标签进行提取,得到维度标签集合。维度标签集合中的各维度标签可以作为待确定的维度标签,用以确定是否为根因维度标签。维度标签集合中的每一个维度标签都可以作为决策树的节点。例如,维度标签集合中包括用户的地理位置、用户所使用的运营商等标签。示例性的,可以首先将用户的地理位置作为决策树的根节点。在该根节点下,可以对应多个第一级子节点,例如北京、上海、广州等。进一步本文档来自技高网...

【技术保护点】
1.一种数据分析的方法,包括:/n根据数据的变化情况确定异常时段;所述数据包括加载多个维度标签的数据;/n根据所述异常时段的数据和正常时段的数据的差异,确定根因维度标签;所述正常时段是预先确定的;/n对加载所述根因维度标签的数据进行分析,得到数据分析结果。/n

【技术特征摘要】
1.一种数据分析的方法,包括:
根据数据的变化情况确定异常时段;所述数据包括加载多个维度标签的数据;
根据所述异常时段的数据和正常时段的数据的差异,确定根因维度标签;所述正常时段是预先确定的;
对加载所述根因维度标签的数据进行分析,得到数据分析结果。


2.根据权利要求1所述的方法,其中,所述根据所述异常时段的数据和正常时段的数据的差异,确定根因维度标签,包括:
获取加载待确定的维度标签的正常时段的数据以及加载所述待确定的维度标签的异常时段的数据;
在所述正常时段的数据和所述异常时段的数据的差异满足预定条件的情况下,将所述待确定的维度标签确定为根因维度标签。


3.根据权利要求2所述的方法,所述正常时段的数据和所述异常时段的数据的差异满足预定条件的确定方式,包括:
在所述正常时段中,确定加载所述待确定的维度标签的数据与全部数据的第一占比;
在所述异常时段中,确定加载所述待确定的维度标签的数据与全部数据的第二占比;
根据所述第一占比和所述第二占比,确定加载所述待确定的维度标签的数据在所述正常时段和所述异常时段中的差异;
在所述差异不小于阈值的情况下,确定为满足预定条件。


4.根据权利要求3所述的方法,其中,所述确定加载所述待确定的维度标签的数据在所述正常时段和所述异常时段中的差异,包括:
利用JS散度、F散度、KL散度及计算海林格距离中的至少一种方式进行确定。


5.根据权利要求1至4所述的方法,其中,所述数据的变化情况包括:数据的变化量超过阈值和/或数据的变化率超过阈值。


6.一种数据分析的装置,其特征在于,包括:
异常时段确定模块,用于根据数据的变化情况确定异常时段;所述数据包括加载多个维度标签的数据;
根因维度标签确定模块,用于根据所述异常时段的数据和正常时段的数据的差异,确定根因维度标签;所述正常时段是预先确定...

【专利技术属性】
技术研发人员:李聪陈宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1