一种异常数据的识别方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:35301080 阅读:13 留言:0更新日期:2022-10-22 12:49
本发明专利技术涉及数据处理技术领域,尤其涉及一种异常数据的识别方法、装置、存储介质及计算机设备。包括获取目标RTU在待测时间窗口内对应的数据均值;获取多个与目标RTU具有相同的属性标签的对比RTU对应的对比数据集;获取最大对比数据均值和最小对比数据均值;当A0>Umax或者A0<Umin时,进入异常标记环节,确定正常浮动区间;当A0>D

【技术实现步骤摘要】
一种异常数据的识别方法、装置、存储介质及计算机设备


[0001]本专利技术涉及数据处理
,尤其涉及一种异常数据的识别方法、装置、存储介质及计算机设备。

技术介绍

[0002]数据传输主要依照对应的传输协议而进行,在工业领域中,很多数据传输协议在进行数据传输时采用明文的方式进行传输。由此,传输的数据格式容易被仿造,进而容易受到网络攻击,使得传输的数据中存在异常数据,存在安全隐患。
[0003]但是,相关技术中对传输数据中的异常数据异常检测时,需要需要解析分析对应的报文数据,由此,使得数据进行异常检测的效率较低,无法对大量的传输数据中的异常数据进行快速识别。

技术实现思路

[0004]有鉴于此,本专利技术提供一种异常数据的识别方法、装置、存储介质及计算机设备,至少部分解决现有技术中存在的数据进行异常检测的效率较低,无法对大量的传输数据中的异常数据进行快速识别的问题。
[0005]根据本专利技术的第一个方面,提供了一种异常数据的识别方法,包括:
[0006]获取目标RTU在待测时间窗口内对应的数据均值A0;
[0007]获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的对比数据集H,所述H符合如下条件:
[0008][0009]其中,Hij是H中第i个所述对比RTU在第j个时间窗口内对应的对比数据均值,i∈[1,y],j∈[1,z],y为所述对比RTU的数量,z为第i个所述对比RTU对应的时间窗口的总数量;
[0010]获取最大对比数据均值Umax和最小对比数据均值Umin,其中,所述Umax为H中的最大值,所述Umin为H中的最小值;
[0011]当所述A0>Umax或者所述A0<Umin时,进入异常标记环节,所述异常标记环节包括如下步骤:
[0012]根据所述H、所述Umax及所述Umin,确定正常浮动区间[D
0min
,D
0max
],其中,所述D
0min
和D
0max
满足如下条件:
[0013]D
0min
=Umin

Avg(H)
×
[2Umin

Avg(H)]/Umin;
[0014]D
0max
=Umax+Avg(H)
×
[2Avg(H)

Umax]/Umax;
[0015]其中,Avg()为预设的均值处理函数;
[0016]当所述A0>D
0max
或者所述A0<D
0min
时,将所述目标RTU在待测时间窗口内对应的上传数据标记为异常状态。
[0017]在本专利技术中进一步的,在所述获取最大对比数据均值Umax和最小对比数据均值Umin之后,所述方法还包括:
[0018]当所述Umin≤A0≤Umax时,将所述A0对应的上传数据均标记为正常状态。
[0019]在本专利技术中进一步的,所述H中的对比数据均值符合正态分布,
[0020]所述获取最大对比数据均值Umax和最小对比数据均值Umin,包括:
[0021]根据所述H中的每一所述对比数据均值,确定所述H对应的正态分布图;
[0022]根据所述正态分布图,确定目标取值面积S0;
[0023]根据获取Umax=a,Umin=b;
[0024]其中,μ为所述H中的所有所述对比数据均值的平均数,σ为所述H中的所有所述对比数据均值的标准差,a和b为关于μ对称的上取值边界值与下取值边界值,S0∈[0.8,1]。
[0025]在本专利技术中进一步的,所述S0=0.8。
[0026]在本专利技术中进一步的,所述H中的对比数据均值均已完成异常标记;
[0027]在所述获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的对比数据集H之前,所述方法还包括:
[0028]获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的第一对比数据集H1,所述H1符合如下条件:
[0029][0030]其中,H1sg是H1中第s个所述对比RTU在第g个时间窗口内对应的对比数据均值,s∈[1,m],g∈[1,w],m为所述对比RTU的数量,w为第s个所述对比RTU对应的时间窗口的总数量;
[0031]确定H1中被标记为异常状态的对比数据均值的数量Q;
[0032]当Q>K1时,重新确定多个对比RTU对应的H1,其中,K1为第一预设阈值。
[0033]在本专利技术中进一步的,在所述确定H1中被标记为异常状态的对比数据均值的数量Q之后,所述方法还包括:
[0034]当Q≤K1时,将所述H1确定为H。
[0035]在本专利技术中进一步的,所述获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的对比数据集H,包括:
[0036]获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的第二初始对比数据集H2,所述H2符合如下条件:
[0037][0038]其中,H2pq是H2中第p个所述对比RTU在第q个时间窗口内对应的对比数据大小列表,n为所述对比RTU的数量,c为所述对比RTU对应的时间窗口的总数量;
[0039]获取P
1pq
和P
2pq
,所述P
1pq
为所述H2pq对应的第一比例值,所述P
2pq
为所述H2pq对应的第二比例值,所述P
1pq
和P
2pq
满足如下条件:
[0040]P
1pq
=H2pq
max
/Avg(H2pq);
[0041]P
2pq
=Avg(H2pq)/H2pq
min

[0042]其中,H2pq
max
和H2pq
min
分别为H2pq中的数据最大值及数据最小值,Avg(H2pq)为H2pq中的对比数据均值;
[0043]当所述P
1pq
>K2或所述P
2pq
>K3时,在H2中去除所述H2pq,其中,所述K2为第二预设阈值,所述K3为第三预设阈值;
[0044]根据所述H2中剩余的数据大小列表,确定第二对比数据均值集H3,所述H3符合如下条件:
[0045][0046]其中,H2xz是H3中第x个所述对比RTU在第z个时间窗口内对应的对比数据均值,L≤n,d≤c,L为所述对比RTU的数量,d为所述对比RTU对应的对比数据均值的总数量;
[0047]将所述H3确定为H。
[0048]根据本专利技术的第二个方面,提供了一种异常数据的识别装置,包括:
[0049]第一获取模块,用于获取目标RTU在待测时间窗口内对应的数据均值A0;
...

【技术保护点】

【技术特征摘要】
1.一种异常数据的识别方法,其特征在于,包括:获取目标RTU在待测时间窗口内对应的数据均值A0;获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的对比数据集H,所述H符合如下条件:其中,Hij是H中第i个所述对比RTU在第j个时间窗口内对应的对比数据均值,i∈[1,y],j∈[1,z],y为所述对比RTU的数量,z为第i个所述对比RTU对应的时间窗口的总数量;获取最大对比数据均值Umax和最小对比数据均值Umin,其中,所述Umax为H中的最大值,所述Umin为H中的最小值;当所述A0>Umax或者所述A0<Umin时,进入异常标记环节,所述异常标记环节包括如下步骤:根据所述H、所述Umax及所述Umin,确定正常浮动区间[D
0min
,D
0max
],其中,所述D
0min
和D
0max
满足如下条件:D
0min
=Umin

Avg(H)
×
[2Umin

Avg(H)]/Umin;D
0max
=Umax+Avg(H)
×
[2Avg(H)

Umax]/Umax;其中,Avg()为预设的均值处理函数;当所述A0>D
0max
或者所述A0<D
0min
时,将所述目标RTU在待测时间窗口内对应的上传数据标记为异常状态。2.根据权利要求1所述的方法,其特征在于,在所述获取最大对比数据均值Umax和最小对比数据均值Umin之后,所述方法还包括:当所述Umin≤A0≤Umax时,将所述A0对应的上传数据均标记为正常状态。3.根据权利要求1所述的方法,其特征在于,所述H中的对比数据均值符合正态分布,所述获取最大对比数据均值Umax和最小对比数据均值Umin,包括:根据所述H中的所有所述对比数据均值,确定所述H对应的正态分布图;根据所述正态分布图,确定目标取值面积S0;根据获取Umax=a,Umin=b;其中,μ为所述H中的所有所述对比数据均值的平均数,σ为所述H中的所有所述对比数据均值的标准差,a和b为关于μ对称的上取值边界值与下取值边界值,S0∈[0.8,1]。4.根据权利要求3所述的方法,其特征在于,所述S0=0.8。5.根据权利要求1所述的方法,其特征在于,所述H中的对比数据均值均已完成异常标记;在所述获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的对比数据集H之前,所述方法还包括:获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的第一对比数据集H1,所
述H1符合如下条件:其中,H1sg是H1中第s个所述对比RTU在第g个时间窗口内对应的对比数据均值,s∈[1,m],g∈[1,w],m为所述对比RTU的数量,w为第s个所述对比RTU对应的时间窗口的总数量;确定H1中被标记为异常状态的对比数据均值的数量Q;当Q>K1时,重新确定多个对比RTU对应的H1,其中,K1为第一预设阈值。6.根据权利要求5所述的方法,其特征在于,在所述确定H1中被标记为异常状态的对比数据均值的数量Q之后,所述方法还包括:当Q≤K1时,将所述H1确定为H。7.根据权利要求1所述的方法,其特征在于,所述获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的对比数据集H,包括:获取多个与所述目标RTU具有相同的属性标签的对比RTU对应的第二初始对比数据集H2,所述H2符合如下条件:其中,H2pq是H2中第p个所述对比RTU在第q个时间窗口内对应的对比数据...

【专利技术属性】
技术研发人员:李峰时伟强姜明
申请(专利权)人:山东云天安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1