一种数据污染程度确定方法、装置及存储介质制造方法及图纸

技术编号:34028997 阅读:18 留言:0更新日期:2022-07-06 10:38
本发明专利技术公开了一种数据污染程度确定方法、装置及存储介质,包括:确定网络中各节点的流量;在确定有污染数据时,确定污染时间段内传输过污染数据的节点;根据传输过污染数据的节点在污染时间段内的流量,以及污染数据所占的比例确定数据污染程度。采用本发明专利技术,解决了目前没有对数据污染事件导致的污染范围及程度进行评估的方案的问题,实现了对数据污染影响范围及程度的评估,对于节点较多的网络,不需要消耗大量资源常态化计算节点相关属性数据。要消耗大量资源常态化计算节点相关属性数据。要消耗大量资源常态化计算节点相关属性数据。

A method, device and storage medium for determining the degree of data pollution

【技术实现步骤摘要】
一种数据污染程度确定方法、装置及存储介质


[0001]本专利技术涉及素数据安全
,特别涉及一种数据污染程度确定方法、装置及存储介质。

技术介绍

[0002]在互联网时代,各种系统、应用每天都在产生海量的数据,很多数据质量管理体系或安全防护体系并不完备,就可能使得很多被污染的数据夹杂在正常数据中被存储和使用,产生数据污染事件。数据污染是指一种由人们故意的或偶然的行为造成的对原始数据的完整性和真实性的损害,即篡改或者伪造的原始数据。
[0003]数据污染问题导致的直接后果就是原始数据失真。被污染的数据如果被使用,可能经过传播会影响到一系列相关环节的分析和决策工作,导致做出错误的数据分析结果,可能还会造成严重的经济损失。
[0004]现有技术的不足在于:没有对数据污染事件导致的污染范围及程度进行评估的方案。

技术实现思路

[0005]本专利技术提供了一种数据污染程度确定方法、装置及存储介质,用以解决没有对数据污染事件导致的污染范围及程度进行评估的方案的问题。
[0006]本专利技术提供以下技术方案:
[0007]一种数据污染程度确定方法,包括:
[0008]确定网络中各节点的流量;
[0009]在确定有污染数据时,确定污染时间段内传输过污染数据的节点;
[0010]根据传输过污染数据的节点在污染时间段内的流量,以及污染数据所占的比例确定数据污染程度。
[0011]实施中,确定各节点的流量,包括:
[0012]获取网络中各节点传输的数据;
[0013]获取数据中的关键字段;
[0014]根据关键字段提取操作对象数据;
[0015]根据传输的对象数据确定各节点的流量。
[0016]实施中,关键字段包括以下字段之一或者其组合:
[0017]起始节点的唯一标识、到达节点的唯一标识、节点上业务对应的唯一标识、数据的发生时间、数据的操作请求、数据的操作状态。
[0018]实施中,进一步包括:
[0019]确定网络中各节点的流量后,根据流量大小对各节点分级;
[0020]在根据传输过污染数据的节点在污染时间段内的流量,以及污染数据所占的比例确定数据污染程度时,根据节点的分级以及污染数据所占的比例确定数据污染程度。
[0021]实施中,根据以下信息之一或者其组合确定污染时间段内传输过污染数据的节点:
[0022]发现数据污染的节点的信息;
[0023]发生数据污染事件的时间范围;
[0024]污染数据对象。
[0025]实施中,确定污染时间段内传输过污染数据的节点,包括:
[0026]依据数据污染源属性,确定数据污染对象集合{A1,A2,
……
,A
n
};
[0027]将A
i
作为数据流出对象,将到达节点限定为污染发现节点N0,数据对象等于集合{A1,A2,
……
,A
n
}中的某一项,在操作信息表以及操作信息表对应数据对象表的数据流出对象字段中检索,得到污染节点和污染数据对象键值对集合{{A1,N11},{A1,N12},
……
,{A
n
,N1
m
}}中,去重得到第一层污染节点集合{N11,N12,
……
,N1
j
};
[0028]将A
i
作为数据流出对象,在数据关联表的数据流出对象字段中检索,将检索得到的对应数据流入对象字段的对象去重组成关联污染数据对象集合{Ai1,Ai2,Ai据流i
n
};
[0029]将到达节点限定为第一层污染节点集合{N11,N12,
……
,N1
j
}中的一项,操作数据对象限定为关联污染数据对象集合{Ai1,Ai2,Ai项,i
n
}中的内容,检索是否存在相关操作记录,若存在,将检索出来的起始节点字段内容,形成为污染节点和污染数据对象键值对集合{{Ai1,N21},{Ai1,N22},
……
,{Ai
n
,N2
n
}},并去重组合成部分第二层污染节点集合{N2
i
,N2
i+1
,
……
,N2
j
};
[0030]以此类推,得到第三层、
……
、第n层污染节点,确定所有污染节点。
[0031]实施中,根据传输过污染数据的节点在污染时间段内的流量,以及污染数据所占的比例确定数据污染程度,包括:
[0032]确定传输过污染数据的污染节点集合{N1,N2,
……
,N
n
}中各节点的污染源数据占比数据;
[0033]确定检索时间范围为数据污染事件发生后的时间,获取{N1,N2,
……
,N
n
}中各节点N
n
的被请求操作总数量;
[0034]获取{N1,N2,
……
,N
n
}中各节点N
n
的操作对象为污染影响数据对象的被请求操作总数量;
[0035]确定{N1,N2,
……
,N
n
}中各节点N
n
的污染源数据占比;
[0036]确定{N1,N2,
……
,N
n
}中各节点的传播力属性值,其中,所述传播力属性值是根据该节点的流量确定的数值;
[0037]根据传播力数值和污染源数据占比数据,确定数据污染事件的污染程度分值。
[0038]一种数据污染程度确定装置,包括:
[0039]处理器,用于读取存储器中的程序,执行下列过程:
[0040]确定网络中各节点的流量;
[0041]在确定有污染数据时,确定污染时间段内传输过污染数据的节点;
[0042]根据传输过污染数据的节点在污染时间段内的流量,以及污染数据所占的比例确定数据污染程度;
[0043]收发机,用于在处理器的控制下接收和发送数据。
[0044]实施中,确定各节点的流量,包括:
[0045]获取网络中各节点传输的数据;
[0046]获取数据中的关键字段;
[0047]根据关键字段提取操作对象数据;
[0048]根据传输的对象数据确定各节点的流量。
[0049]实施中,关键字段包括以下字段之一或者其组合:
[0050]起始节点的唯一标识、到达节点的唯一标识、节点上业务对应的唯一标识、数据的发生时间、数据的操作请求、数据的操作状态。
[0051]实施中,进一步包括:
[0052]确定网络中各节点的流量后,根据流量大小对各节点分级;
[0053]在根据传输过污染数据的节点在污染时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据污染程度确定方法,其特征在于,包括:确定网络中各节点的流量;在确定有污染数据时,确定污染时间段内传输过污染数据的节点;根据传输过污染数据的节点在污染时间段内的流量,以及污染数据所占的比例确定数据污染程度。2.如权利要求1所述的方法,其特征在于,确定各节点的流量,包括:获取网络中各节点传输的数据;获取数据中的关键字段;根据关键字段提取操作对象数据;根据传输的对象数据确定各节点的流量。3.如权利要求2所述的方法,其特征在于,关键字段包括以下字段之一或者其组合:起始节点的唯一标识、到达节点的唯一标识、节点上业务对应的唯一标识、数据的发生时间、数据的操作请求、数据的操作状态。4.如权利要求1所述的方法,其特征在于,进一步包括:确定网络中各节点的流量后,根据流量大小对各节点分级;在根据传输过污染数据的节点在污染时间段内的流量,以及污染数据所占的比例确定数据污染程度时,根据节点的分级以及污染数据所占的比例确定数据污染程度。5.如权利要求1所述的方法,其特征在于,根据以下信息之一或者其组合确定污染时间段内传输过污染数据的节点:发现数据污染的节点的信息;发生数据污染事件的时间范围;污染数据对象。6.如权利要求5所述的方法,其特征在于,确定污染时间段内传输过污染数据的节点,包括:依据数据污染源属性,确定数据污染对象集合{A1,A2,
……
,A
n
};将A
i
作为数据流出对象,将到达节点限定为污染发现节点N0,数据对象等于集合{A1,A2,
……
,A
n
}中的某一项,在操作信息表以及操作信息表对应数据对象表的数据流出对象字段中检索,得到污染节点和污染数据对象键值对集合{{A1,N11},{A1,N12},
……
,{A
n
,N1
m
}}中,去重得到第一层污染节点集合{N11,N12,
……
,N1
j
};将A
i
作为数据流出对象,在数据关联表的数据流出对象字段中检索,将检索得到的对应数据流入对象字段的对象去重组成关联污染数据对象集合{Ai1,Ai2,Ai据流i
n
};将到达节点限定为第一层污染节点集合{N11,N12,
……
,N1
j
}中的一项,操作数据对象限定为关联污染数据对象集合{Ai1,Ai2,Ai项,i
n
}中的内容,检索是否存在...

【专利技术属性】
技术研发人员:刘颖卿张星李春梅吕临颖耿慧拯
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1