【技术实现步骤摘要】
流量检测方法、装置、电子设备和存储介质
[0001]本公开涉及计算机
,具体为互联网、大数据等
,尤其涉及流量检测方法、装置、电子设备和存储介质。
技术介绍
[0002]随着互联网技术的发展,访问各网站的流量数据中,出现了机器爬取、非正常用户团伙作弊等非正常用户行为的流量数据。如何从访问各网站的海量流量数据中,检测出非正常用户行为的异常流量数据,是亟待解决的问题。
技术实现思路
[0003]本公开提供了一种流量检测方法、装置、电子设备和存储介质。
[0004]根据本公开的一方面,提供了一种流量检测方法,所述方法包括:获取待检测的业务流量数据、对应的检测维度以及统计指标;确定所述检测维度的多个维度值并确定所述统计指标的多个指标值;基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据;确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据。
[0005]根据本公开的另一方面,提供了一种流量检测装置,所述装置包括:获取模块,用于获取待检测的业务流量数据、对应的检测维度以及统计指标;第一确定模块,用于确定所述检测维度的多个维度值并确定所述统计指标的多个指标值;聚合模块,用于基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据;第二确定模块,用于确定各所述维度值在所述多个指标值下的流量分布数据之间的 ...
【技术保护点】
【技术特征摘要】
1.一种流量检测方法,其中,所述方法包括:获取待检测的业务流量数据、对应的检测维度以及统计指标;确定所述检测维度的多个维度值并确定所述统计指标的多个指标值;基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据;确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据。2.根据权利要求1所述的方法,其中,所述检测维度包括时间维度,所述多个维度值,包括所述业务流量数据所属的多个时间段;所述基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据,包括:基于所述多个时间段以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述时间段在所述多个指标值下的流量分布数据。3.根据权利要求2所述的方法,其中,所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据,包括:确定所述多个时间段中的任意两个时间段在所述多个指标值下的流量分布数据之间的相关度;从各所述时间段在所述多个指标值下的流量分布数据中,确定与其它流量分布数据之间的相关度低于第一预设阈值的目标流量分布数据;基于所述目标流量分布数据,确定所述业务流量数据中的目标业务流量数据。4.根据权利要求1所述的方法,其中,所述检测维度包括用户维度,所述多个维度值,包括所述业务流量数据所包括的多个用户标识中满足预设条件的多个候选用户标识;所述基于所述多个维度值以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述维度值在所述多个指标值下的流量分布数据,包括:基于多个所述候选用户标识以及所述多个指标值,对所述业务流量数据进行聚合,得到各所述候选用户标识在所述多个指标值下的流量分布数据。5.根据权利要求4所述的方法,其中,所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据,包括:确定所述多个候选用户标识中的任意两个候选用户标识在所述多个指标值下的流量分布数据之间的相关度;基于所述任意两个候选用户标识在所述多个指标值下的流量分布数据之间的相关度,从所述多个候选用户标识中确定用户标识集合,其中,所述用户标识集合中任意用户标识与除所述任意用户标识之外的其它用户标识在所述多个指标值下的流量分布数据之间的相关度高于第二预设阈值;基于所述用户标识集合,确定所述业务流量数据中的目标业务流量数据。6.根据权利要求4所述的方法,其中,所述多个维度值还包括指定用户标识;所述方法还包括:
基于所述指定用户标识以及所述多个指标值,对所述业务流量数据进行聚合,得到所述指定用户标识在所述多个指标值下的流量分布数据;所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据,包括:确定所述指定用户标识与所述多个候选用户标识在所述多个指标值下的流量分布数据之间的相关度;从所述多个候选用户标识中确定目标用户标识,所述目标用户标识与所述指定用户标识在所述多个指标值下的流量分布数据之间的相关度高于第三预设阈值;基于所述目标用户标识,确定所述业务流量数据中的目标业务流量数据。7.根据权利要求1
‑
6中任一项所述的方法,其中,所述确定所述统计指标的多个指标值,包括:基于所述统计指标的多个预设指标值,对所述业务流量数据进行聚合,得到在多个所述预设指标值下的流量分布数据;基于各所述预设指标值下的流量分布数据以及所述业务流量数据,确定各所述预设指标值对应的流量覆盖率;将对应的流量覆盖率高于第四预设阈值的多个预设指标值,确定为所述统计指标的多个指标值。8.根据权利要求1
‑
6中任一项所述的方法,其中,所述统计指标的数量为多个;所述确定各所述维度值在所述多个指标值下的流量分布数据之间的相关度,并基于所述相关度确定所述业务流量数据中的目标业务流量数据,包括:对于多个所述统计指标中的同一统计指标,确定各所述维度值在所述同一统计指标的多个指标值下的流量分布数据之间的相关度;基于各所述维度值在各所述同一统计指标的多个指标值下的流量分布数据之间的相关度,确定所述业务流量数据中的目标业务流量数据。9.一种流量检测装置,其中,所述装置包括:获取模块,用于获取待检测的业务流量数据、对应的检测维度以及统计指标;第一确定模块,用于确定所述检测维度的多个维度值并确定所述...
【专利技术属性】
技术研发人员:李任鹏,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。