System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息安全,具体是一种计算机大数据信息安全风险行为识别方法及系统。
技术介绍
1、随着大数据技术的不断发展,大数据信息安全已成为各行各业关注的焦点。同时,伴随着数据量的增加和数据处理方式的多样化,传统的信息安全技术已经不能满足对大数据信息安全的需求,因此需要研究新的方法和技术来识别和防范大数据信息安全风险。
2、传统的信息安全技术主要包括防火墙、入侵检测系统(ids)、数据加密等,这些技术主要是针对特定的安全事件或攻击行为进行识别和防御。然而,针对大数据环境下的信息安全风险,传统的技术存在一些局限性,例如无法处理大规模的数据、无法识别新型的安全威胁等问题。
3、此外,相关技术中的信息安全风险行为识别方法所依照的识别模型,在模型设置阶段,很难针对新的训练数据(已识别数据)对多个决策进行排查、修剪,很容易导致最终得到的识别模型存在误差较大的缺陷。
技术实现思路
1、有鉴于此,本专利技术的目的是提供一种计算机大数据信息安全风险行为识别方法及系统,以解决现有技术中的问题,多个候选决策集成的目标风险识别模型鲁棒性更强,同时,可以通过时序划分检测单元的方式,对多个决策的一致性进行检验,减少误报的可能性,提高风险识别的可信度,从而避免对正常行为的误判。
2、为了实现上述目的,本专利技术采用了如下技术方案:
3、本专利技术的计算机大数据信息安全风险行为识别方法,包括步骤:
4、获取已识别数据的数据集,其中,数据集包括多个样本单
5、按照时序对多个样本单元进行排序,并赋予样本单元与之对应的时序特征;
6、根据时序特征,将多个样本单元划分为测试单元与检测单元;
7、基于测试单元,构建多个候选风险识别决策;
8、基于多个候选风险识别决策,对检测单元进行检验判断,以确定目标风险识别模型;
9、根据目标风险识别模型,对待识别数据的风险行为进行识别。
10、该计算机大数据信息安全风险行为识别方法通过时序以及时序特征筛选出了检测单元与测试单元,采用检测单元对多个决策的一致性进行检验,减少误报的可能性,提高风险识别的可信度,从而避免对正常行为的误判。
11、在本申请一实施例中,根据时序特征,将多个样本单元划分为测试单元与检测单元,包括:
12、基于时序特征与当前时间,分别确定多个样本单元的价值系数;
13、基于预设条件,从多个样本单元中挑选检测单元;
14、其中,预设条件为检测单元的数量大于等于数量阈值,且多个检测单元所对应的价值系数的平均值大于等于系数阈值。
15、在本申请一实施例中,基于时序特征与当前时间,分别确定多个样本单元的价值系数,包括:
16、
17、其中,ω为价值系数、e为数学常数、t0为当前时间、ti为时序特征、α为控制常数。
18、在本申请一实施例中,标签特征包括高风险特征、中风险特征、低风险特征与无风险特征;
19、基于预设条件,从多个样本单元中挑选检测单元的步骤,还包括:
20、根据标签特征,确定预设条件;其中,
21、响应于标签特征为高风险特征时,预设条件为第一预设条件;
22、第一预设条件为高风险特征的检测单元的数量大于等于第一数量阈值,且多个高风险特征的检测单元所对应的价值系数的平均值大于等于第一系数阈值;
23、响应于标签特征为中风险特征时,预设条件为第二预设条件;
24、第二预设条件为中风险特征的检测单元的数量大于等于第二数量阈值,且多个中风险特征的检测单元所对应的价值系数的平均值大于等于第二系数阈值;
25、响应于标签特征为低风险特征时,预设条件为第三预设条件;
26、第三预设条件为低风险特征的检测单元的数量大于等于第三数量阈值,且多个低风险特征的检测单元所对应的价值系数的平均值大于等于第三系数阈值;
27、响应于标签特征为无风险特征时,预设条件为第四预设条件;
28、第四预设条件为无风险特征的检测单元的数量大于等于第四数量阈值,且多个无风险特征的检测单元所对应的价值系数的平均值大于等于第四系数阈值。
29、在本申请一实施例中,根据标签特征,确定预设条件的步骤中,包括:
30、k1≥k2≥k3≥k4
31、m1≥m2≥m3≥m4
32、其中,k1为第一数量阈值、k2为第二数量阈值、k3为第三数量阈值、k4为第四数量阈值,m1为第一系数阈值、m2为第二系数阈值、m3为第三系数阈值、m4为第四系数阈值。
33、在本申请一实施例中,属性特征包括登录特征、流量特征、操作特征、访问特征与权限变更特征;
34、基于测试单元,构建多个候选风险识别决策的步骤,包括:
35、s410,选取测试单元中的部分属性特征作为候选特征集合;
36、s420,根据候选特征集合,选择划分特征与划分节点;
37、s430,基于划分节点,采用递归的方式,得到单个候选风险识别决策;
38、循环步骤s410-s430,以得到多个候选风险识别决策。
39、在本申请一实施例中,基于多个候选风险识别决策,对检测单元进行检验判断,以确定目标风险识别模型的步骤,包括:
40、将检测单元所对应的属性特征放入多个候选风险识别决策,以得到识别标签;
41、基于检测单元所对应的标签特征与检测单元所对应的识别标签,判断候选风险识别决策是否为目标风险识别决策;
42、基于多个目标风险识别决策,集成目标风险识别模型。
43、在本申请一实施例中,基于检测单元所对应的标签特征与检测单元所对应的识别标签,判断候选风险识别决策是否为目标风险识别决策,包括:
44、预设高风险特征的所属等级为3、中风险特征的所属等级为2、低风险特征的所属等级为1、无风险特征的所属等级为0;
45、若检测单元所对应的标签特征的所属等级与检测单元所对应的识别标签的所属等级之差小于等于1,则判断候选风险识别决策为目标风险识别决策;
46、反之,则判断候选风险识别决策不为目标风险识别决策。
47、在本申请一实施例中,根据目标风险识别模型,对待识别数据的风险行为进行识别的步骤,包括:
48、基于多个目标风险识别决策,分别对对待识别数据的风险行为进行识别,以得到多个识别标签;
49、对多个识别标签所对应的多个所属等级取平均值,得到平均等级;
50、基于平均等级,确定待识别数据的标签特征。
51、本申请还提供一种计算机大数据信息安全风险行为识别系统,包括:
52、获取模块,用于获取已识别数据的数据集,其中,数据集包括多个样本单元,任一样本单元均包括属本文档来自技高网...
【技术保护点】
1.一种计算机大数据信息安全风险行为识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述根据所述时序特征,将所述多个所述样本单元划分为测试单元与检测单元,包括:
3.根据权利要求2所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述基于时序特征与当前时间,分别确定多个样本单元的价值系数,包括:
4.根据权利要求2所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述标签特征包括高风险特征、中风险特征、低风险特征与无风险特征;
5.根据权利要求4所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述根据所述标签特征,确定所述预设条件的步骤中,包括:
6.根据权利要求1所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述属性特征包括登录特征、流量特征、操作特征、访问特征与权限变更特征;
7.根据权利要求4所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述基于多个所述候选风险识别决策,对所述检测单元进行检验判断,以
8.根据权利要求7所述的计算机大数据信息安全风险行为识别方法,其特征在于,基于所述检测单元所对应的所述标签特征与检测单元所对应的所述识别标签,判断所述候选风险识别决策是否为目标风险识别决策,包括:
9.根据权利要求8所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述根据所述目标风险识别模型,对待识别数据的风险行为进行识别的步骤,包括:
10.一种计算机大数据信息安全风险行为识别系统,其特征在于,包括:
...【技术特征摘要】
1.一种计算机大数据信息安全风险行为识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述根据所述时序特征,将所述多个所述样本单元划分为测试单元与检测单元,包括:
3.根据权利要求2所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述基于时序特征与当前时间,分别确定多个样本单元的价值系数,包括:
4.根据权利要求2所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述标签特征包括高风险特征、中风险特征、低风险特征与无风险特征;
5.根据权利要求4所述的计算机大数据信息安全风险行为识别方法,其特征在于,所述根据所述标签特征,确定所述预设条件的步骤中,包括:
6.根据权利要求1所述的计算机大数据信息安...
【专利技术属性】
技术研发人员:肖捷,
申请(专利权)人:新疆益盛鑫网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。