System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据处理方法、装置、设备及存储介质制造方法及图纸_技高网

一种数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:44272353 阅读:2 留言:0更新日期:2025-02-14 22:13
本公开提供了一种数据处理方法、装置、设备及存储介质,涉及计算机技术领域。数据处理方法包括:基于目标环境与所有交互对象的第一交互数据,确定目标环境的第一风险类别分布和每个风险类别对异常交互行为的敏感度;基于敏感度,确定满足目标条件的时间窗口取值;基于目标交互对象在最近时间窗口中与目标环境的第二交互数据,确定目标交互对象的第二风险类别分布;基于敏感度和风险类别在第一风险类别分布与第二风险类别分布中占比的差值,确定第一风险类别分布和第二风险类别分布的目标相似度;如果目标相似度满足第二阈值,则确定最近时间窗口内的第二交互数据存在异常。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及一种数据处理方法、装置、设备及存储介质


技术介绍

1、目前,对于数据异常转移、网络流量异常以及其他相似的网络风险行为,还没有明确的行业标准进行风险检测,常用的解决方案为设定固定阈值并判断相关数据是否满足该固定阈值。然而,上述解决方案无法根据企业情况动态确定合理的固定阈值,缺乏灵活性,而且无法确定进行风险检测较为稳定的时间窗口,导致检测结果的准确性不高,另外,固定阈值可能会导致告警风暴,从而掩盖住真正的异常风险。


技术实现思路

1、本公开提供了一种数据处理方法、装置、设备及存储介质,以至少解决现有技术中存在的以上技术问题。

2、根据本公开的第一方面,提供了一种数据处理方法,包括:基于目标环境与所有交互对象的第一交互数据,确定所述目标环境的第一风险类别分布和每个风险类别对异常交互行为的敏感度;基于所述敏感度,确定满足目标条件的时间窗口取值,所述目标条件表征每两个时间窗口中的第一交互数据的风险类别分布的相似度均满足第一阈值;基于目标交互对象在最近时间窗口中与所述目标环境的第二交互数据,确定所述目标交互对象的第二风险类别分布;基于所述敏感度和所述风险类别在第一风险类别分布与第二风险类别分布中占比的差值,确定所述第一风险类别分布和第二风险类别分布的目标相似度;如果所述目标相似度满足第二阈值,则确定所述最近时间窗口内的第二交互数据存在异常。

3、在一可实施方式中,所述确定所述目标环境的第一风险类别分布和每个风险类别对异常交互行为的敏感度,包括:将所述第一交互数据输入至风险分类模型,通过所述风险分类模型输出所述目标环境的第一风险类别分布和每个风险类别的敏感度,所述风险分类模型基于训练交互数据和所述训练交互数据对应的风险类别训练得到;其中,所述训练交互数据对应的风险类别基于所述训练交互数据中特征的权重值和每两条训练交互数据特征值的差值对训练交互数据进行聚类后得到。

4、在一可实施方式中,所述基于所述敏感度,确定满足目标条件的时间窗口取值,包括:在时间窗口的初始取值下,基于每个时间窗口中的第一交互数据,确定每个时间窗口的风险类别分布;基于每个风险类别在每两个时间窗口的风险类别分布中占比的差值和所述敏感度,确定每两个时间窗口的风险类别分布的相似度;如果所述相似度均满足所述第一阈值,则将所述初始取值确定为所述时间窗口取值。

5、在一可实施方式中,一种数据处理方法还包括:如果存在不满足所述第一阈值的相似度,则调整所述初始取值,在调整后的初始取值下,确定每两个时间窗口的风险类别分布的相似度,直到所述相似度均满足所述第一阈值。

6、在一可实施方式中,所述确定所述第一风险类别分布和所述第二风险类别分布的目标相似度,包括:确定所述第二风险类别分布中的未分类风险类别占比,所述未分类风险类别占比为所述第二风险类别分布中不属于所述第一风险类别分布的风险类别的占比;基于所述敏感度、所述风险类别在所述第一风险类别分布与第二风险类别分布中占比的差值和所述未分类风险类别占比,确定所述目标相似度。

7、在一可实施方式中,一种数据处理方法还包括:确定所述目标交互对象在历史时间窗口中的风险类别分布与所述第一风险类别分布的历史相似度;基于异常检测算法检测所述目标相似度和所述历史相似度组成的相似度序列中的异常相似度,并确定所述异常相似度对应的时间窗口内的第二交互数据存在异常。

8、在一可实施方式中,一种数据处理方法还包括以下至少一种:如果所述第二交互数据存在异常,则生成告警信息,所述告警信息中包括所述第二交互数据的异常原因;如果所述第二交互数据存在异常,则暂停所述目标交互对象与所述目标环境之间的交互行为。

9、根据本公开的第二方面,提供了一种数据处理装置,包括:类别确定模块,用于基于目标环境与所有交互对象的第一交互数据,确定所述目标环境的第一风险类别分布和每个风险类别对异常交互行为的敏感度;窗口确定模块,用于基于所述敏感度,确定满足目标条件的时间窗口取值,所述目标条件表征每两个时间窗口中的第一交互数据的风险类别分布的相似度均满足第一阈值;类别确定模块,还用于基于目标交互对象在最近时间窗口中与所述目标环境的第二交互数据,确定所述目标交互对象的第二风险类别分布;相似度确定模块,用于基于所述敏感度和所述风险类别在第一风险类别分布与第二风险类别分布中占比的差值,确定所述第一风险类别分布和第二风险类别分布的目标相似度;异常确定模块,用于如果所述目标相似度满足第二阈值,则确定所述最近时间窗口内的第二交互数据存在异常。

10、根据本公开的第三方面,提供了一种电子设备,包括:

11、至少一个处理器;以及

12、与所述至少一个处理器通信连接的存储器;其中,

13、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。

14、根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。

15、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种数据处理方法,包括:

2.根据权利要求1所述的方法,所述确定所述目标环境的第一风险类别分布和每个风险类别对异常交互行为的敏感度,包括:

3.根据权利要求1所述的方法,所述基于所述敏感度,确定满足目标条件的时间窗口取值,包括:

4.根据权利要求3所述的方法,还包括:

5.根据权利要求1所述的方法,所述确定所述第一风险类别分布和所述第二风险类别分布的目标相似度,包括:

6.根据权利要求1-5任一项所述的方法,还包括:

7.根据权利要求1-5任一项所述的方法,还包括以下至少一种:

8.一种数据处理装置,包括:

9.一种电子设备,包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行根据权利要求1-7中任一项所述的方法。

【技术特征摘要】

1.一种数据处理方法,包括:

2.根据权利要求1所述的方法,所述确定所述目标环境的第一风险类别分布和每个风险类别对异常交互行为的敏感度,包括:

3.根据权利要求1所述的方法,所述基于所述敏感度,确定满足目标条件的时间窗口取值,包括:

4.根据权利要求3所述的方法,还包括:

5.根据权利要求1所述的方法,所述确定所述第一风险类别分布和所述第...

【专利技术属性】
技术研发人员:张斌罗奚
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1