流量检测方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36035198 阅读:16 留言:0更新日期:2022-12-21 10:38
本公开提供了一种流量检测方法、装置、电子设备和存储介质,涉及互联网、大数据等计算机技术领域。具体实现方案为:获取待检测的业务流量数据、对应的检测维度以及统计指标;确定检测维度的多个维度值并确定统计指标的多个指标值;基于多个维度值以及多个指标值,对业务流量数据进行聚合,得到各维度值在多个指标值下的流量分布数据;确定各维度值在多个指标值下的流量分布数据之间的相关度,并基于相关度确定业务流量数据中的目标业务流量数据。由此,实现了从待检测的业务流量数据中检测出存在异常的目标业务流量数据,且通用性强,复杂度低,检测效率高。检测效率高。检测效率高。

【技术实现步骤摘要】
流量检测方法、装置、电子设备和存储介质


[0001]本公开涉及计算机
,具体为互联网、大数据等
,尤其涉及流量检测方法、装置、电子设备和存储介质。

技术介绍

[0002]随着互联网技术的发展,访问各网站的流量数据中,出现了机器爬取、非正常用户团伙作弊等非正常用户行为的流量数据。如何从访问各网站的海量流量数据中,检测出非正常用户行为的异常流量数据,是亟待解决的问题。

技术实现思路

[0003]本公开提供了一种流量检测方法、装置、电子设备和存储介质。
[0004]根据本公开的一方面,提供了一种流量检测方法,所述方法包括:获取待检测的业务流量数据、对应的检测维度以及统计指标;确定所述检测维度的多个维度值并确定所述统计指标的多个指标值;基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据;确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据。
[0005]根据本公开的另一方面,提供了一种流量检测装置,所述装置包括:获取模块,用于获取待检测的业务流量数据、对应的检测维度以及统计指标;第一确定模块,用于确定所述检测维度的多个维度值并确定所述统计指标的多个指标值;聚合模块,用于基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据;第二确定模块,用于确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的流量检测方法。
[0007]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的流量检测方法。
[0008]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的流量检测方法的步骤。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1是根据本公开第一实施例的流量检测方法的流程示意图;
[0012]图2是根据本公开第二实施例的流量检测方法的流程示意图;
[0013]图3是根据本公开第三实施例的流量检测方法的流程示意图;
[0014]图4是根据本公开第四实施例的流量检测方法的流程示意图;
[0015]图5是根据本公开第五实施例的流量检测装置的结构示意图;
[0016]图6是根据本公开第六实施例的流量检测装置的结构示意图;
[0017]图7是用来实现本公开实施例的流量检测方法的电子设备的框图。
具体实施方式
[0018]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0019]需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
[0020]本公开实施例提供一种流量检测方法、装置、电子设备、非瞬时计算机可读存储介质以及计算机程序产品。其中流量检测方法包括:获取待检测的业务流量数据、对应的检测维度以及统计指标;确定检测维度的多个维度值并确定统计指标的多个指标值;基于多个维度值以及多个指标值,对业务流量数据进行聚合,得到各维度值在多个指标值下的流量分布数据;确定各维度值在多个指标值下的流量分布数据之间的相关度,并基于相关度确定业务流量数据中的目标业务流量数据。由此,实现了从待检测的业务流量数据中检测出存在异常的目标业务流量数据,且通用性强,复杂度低,检测效率高。
[0021]其中,本公开提供的流量检测方法、装置、电子设备、非瞬时计算机可读存储介质以及计算机程序产品,涉及计算机
,具体为互联网、大数据

[0022]其中,互联网技术指在计算机技术的基础上开发建立的一种信息技术。互联网技术的普遍应用,是进入信息社会的标志。
[0023]下面参考附图描述本公开实施例的流量检测方法、装置、电子设备、非瞬时计算机可读存储介质以及计算机程序产品。
[0024]首先对本公开实施例提供的流量检测方法进行说明。
[0025]图1是根据本公开第一实施例的流量检测方法的流程示意图。其中,需要说明的是,本实施的流量检测方法,执行主体为流量检测装置,该流量检测装置可以由软件和/或硬件实现,该流量检测装置可以配置在电子设备中,该电子设备可以包括但不限于终端设备、服务器等,该实施例对电子设备不作具体限定。
[0026]如图1所示,该流量检测方法可以包括:
[0027]步骤101,获取待检测的业务流量数据、对应的检测维度以及统计指标。
[0028]其中,业务流量数据,为预设时间段内访问某个网站的流量数据,具体可以为预设时间段内某个网站的访问日志中包括的数据,比如某个网站的访问日志中包括的,该网站
的各访问请求对应的访问用户的用户标识、所使用设备的型号、所使用设备的IP(Internet Protocol,互联网协议)地址、访问时间、所使用的浏览器类型、所使用的浏览器的JA3指纹、所使用设备所在的地区、所使用设备的IP地址所处的IPC段等数据。其中,IPC段指C类IP地址,是指在IP地址的四段号码中,前三段号码为网络号码,剩下的一段号码为本地计算机的号码。JA3是一种对传输层安全应用程序进行指纹识别的方法,JA3指纹能够唯一标识对应的浏览器。其中,预设时间段可以根据需要设置,比如为1天、3天、7天、一个月等。
[0029]检测维度,为预先设置的对业务流量数据进行检测的维度,可以根据需要设置,比如可以设置为时间维度、用户维度、IP维度、IPC维度、JA3维度等,本公开对此不作限制。
[0030]统计指标,为用于对业务流量数据进行统计的指标,比如时序、地域、设备类型、IPC段、JA3、浏览器类型等指标。
[0031]其中,获取的检测维度或统计指标的数量可以为一个或多个,本公开对此不作限制。
[0032]需要说明的是,获取待检测的业务流量数据后,还可以先对业务流量数据进行数据清洗以及IP地址、设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流量检测方法,其中,所述方法包括:获取待检测的业务流量数据、对应的检测维度以及统计指标;确定所述检测维度的多个维度值并确定所述统计指标的多个指标值;基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据;确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据。2.根据权利要求1所述的方法,其中,所述检测维度包括时间维度,所述多个维度值,包括所述业务流量数据所属的多个时间段;所述基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据,包括:基于所述多个时间段以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述时间段在所述多个指标值下的流量分布数据。3.根据权利要求2所述的方法,其中,所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据,包括:确定所述多个时间段中的任意两个时间段在所述多个指标值下的流量分布数据之间的相关度;从各所述时间段在所述多个指标值下的流量分布数据中,确定与其它流量分布数据之间的相关度低于第一预设阈值的目标流量分布数据;基于所述目标流量分布数据,确定所述业务流量数据中的目标业务流量数据。4.根据权利要求1所述的方法,其中,所述检测维度包括用户维度,所述多个维度值,包括所述业务流量数据所包括的多个用户标识中满足预设条件的多个候选用户标识;所述基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据,包括:基于多个所述候选用户标识以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述候选用户标识在所述多个指标值下的流量分布数据。5.根据权利要求4所述的方法,其中,所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据,包括:确定所述多个候选用户标识中的任意两个候选用户标识在所述多个指标值下的流量分布数据之间的相关度;基于所述任意两个候选用户标识在所述多个指标值下的流量分布数据之间的相关度,从所述多个候选用户标识中确定用户标识集合,其中,所述用户标识集合中任意用户标识与除所述任意用户标识之外的其它用户标识在所述多个指标值下的流量分布数据之间的相关度高于第二预设阈值;基于所述用户标识集合,确定所述业务流量数据中的目标业务流量数据。6.根据权利要求4所述的方法,其中,所述多个维度值还包括指定用户标识;所述方法还包括:
基于所述指定用户标识以及所述多个指标值,对所述业务流量数据进行聚合,得到所述指定用户标识在所述多个指标值下的流量分布数据;所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据,包括:确定所述指定用户标识与所述多个候选用户标识在所述多个指标值下的流量分布数据之间的相关度;从所述多个候选用户标识中确定目标用户标识,所述目标用户标识与所述指定用户标识在所述多个指标值下的流量分布数据之间的相关度高于第三预设阈值;基于所述目标用户标识,确定所述业务流量数据中的目标业务流量数据。7.根据权利要求1

6中任一项所述的方法,其中,所述确定所述统计指标的多个指标值,包括:基于所述统计指标的多个预设指标值,对所述业务流量数据进行聚合,得到在多个所述预设指标值下的流量分布数据;基于各所述预设指标值下的流量分布数据以及所述业务流量数据,确定各所述预设指标值对应的流量覆盖率;将对应的流量覆盖率高于第四预设阈值的多个预设指标值,确定为所述统计指标的多个指标值。8.根据权利要求1

6中任一项所述的方法,其中,所述统计指标的数量为多个;所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据,包括:对于多个所述统计指标中的同一统计指标,确定各所述维度值在所述同一统计指标的多个指标值下的流量分布数据之间的相关度;基于各所述维度值在各所述同一统计指标的多个指标值下的流量分布数据之间的相关度,确定所述业务流量数据中的目标业务流量数据。9.一种流量检测装置,其中,所述装置包括:获取模块,用于获取待检测的业务流量数据、对应的检测维度以及统计指标;第一确定模块,用于确定所述检测维度的多个维度值并确定所述...

【专利技术属性】
技术研发人员:李任鹏
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1