一种用于保证电力数据安全的数据处理系统及方法技术方案

技术编号:37493226 阅读:16 留言:0更新日期:2023-05-07 09:31
本发明专利技术提出了一种用于保证电力数据安全的数据处理系统及方法,涉及数据处理技术领域,将电力数据集分解成字段内容和标签两列,对电力数据集进行分类,得到文字数据子集、非文字数据子集;对非文字数据子集进行分类,得到字母数据、符号数据和数字串数据,并上传至数据处理中心;在文字数据子集中提取出中心词,采用语义相似度规则形成多个语义子集;对不同语义子集的字段内容匹配敏感信息,映射到不同的脱敏规则;对映射后的敏感数据进行加密处理;将加密后的敏感数据上传至数据处理中心,实现了能进行数据的自动识别,有效保护敏感数据。感数据。感数据。

【技术实现步骤摘要】
一种用于保证电力数据安全的数据处理系统及方法


[0001]本专利技术涉及数据处理
,具体涉及一种用于保证电力数据安全的数据处理系统及方法。

技术介绍

[0002]伴随着智能电网的迅速发展,对敏感数据的保护要求也越来越高,如何在数据交换、共享和使用过程中精确定位、充分脱敏,是当前实现数据安全使用的关键性问题。就当前存在的问题,现有技术采用传统的烟囱式架构搭建数据的中间库,但是该数据中间库在数据使用监管方面存在薄弱点,对数据脱敏存在数据安全隐患;大数据使用面向HBase的脱敏技术,并结合权限算法完成脱敏任务。然而该方法计算步骤复杂,需要耗费大量时间,大大降低了电力数据的传输速率,大数据脱敏效果较差。
[0003]电力数据挖掘前景广阔,对于电网企业发展而言,电力数据真切地辅助企业在优质服务、高效运营等方面向数字化、智能化转型发展。例如:智能用电分析等,可以辅助电网合理调配电力供给、优化用电方案;通过对终端智能设备采集、传输的数据进行分析,可以帮助企业优化成本,分析用户用电特性,为居民设计能效方案,提升客户综合服务体验。然而,基于现有计算机网络的电力网络自动化系统因其网络安防系统固有的缺陷,易受到外部的网络攻击,系统主从站之间传输的应用数据存在被攻击者窃听、篡改与伪造的安全风险。

技术实现思路

[0004]为了解决上述技术问题,本专利技术提出了一种用于保证电力数据安全的数据处理方法,包括如下步骤:S1、将电力数据集分解成字段内容和标签两列,按照标签列对电力数据集进行分类,得到文字数据子集、非文字数据子集;S2、对所述非文字数据子集进行分类,得到字母数据、符号数据和数字串数据,并上传至数据处理中心;S3、在所述文字数据子集中提取出中心词,按照语义相似度形成多个语义子集;S4、对不同语义子集的字段内容匹配敏感信息,映射到不同的脱敏规则;S5、对映射后的敏感数据进行加密处理;S6、将加密后的敏感数据上传至数据处理中心。
[0005]进一步地,步骤S3包括如下步骤:S31、接收电力数据中的文字数据子集,构成具有n个数据的集合;S32、通过滤除技术删除集合X中的噪声数据,输出语义集合S;S33、设定中心词,将语义集合S采用遍历方式搜索,逐个计算每个语义与中心词取绝对差值:
;S34、将语义集合S按照绝对差值进行排序,设定语义间隔阈值,绝对差值大于语义间隔阈值的所有语义划分在一个语义子集中,形成多个语义子集。
[0006]进一步地,步骤S4包括如下步骤:S41、获取不同语义子集的字段内容,采用敏感词聚类算法匹配敏感信息;对m个语义子集的字段内容执行敏感词聚类算法,基于K个敏感词,计算m个语义子集的字段内容的中心语义与敏感词的距离的平方和d,公式为:;式中,表示第j个语义子集的字段内容的中心语义;表示第i个敏感词;表示聚类系数;S42、基于聚类结果进行不同脱敏规则的映射。
[0007]进一步地,步骤S42中,表示脱敏规则群;E表示映射规则,设相同聚类G中的任意两个元素为u,v,中的任意两个元素为a,b;、分别脱敏映射元素,为相同聚类G整体映射集合,设为,则:。
[0008]进一步地,步骤S5中,映射后的敏感数据的加密公钥PK分别包括相同聚类G中的两个除u、v外的随机元素m,h和整体映射集合中的1个生成元g,则:;式中:为集合中除a,b外的任意一个元素;为映射后的敏感数据的加密主密钥;整体映射集合中的数据映射私钥为:;式中:为集合中的除,a,b外的任意一个元素;映射后的敏感数据的加密后的密文C为:;式中:s为集合中的除,,a,b外的任意一个元素。
[0009]本专利技术还提出了一种用于保证电力数据安全的数据处理系统,用于实现用于保证电力数据安全的数据处理方法,包括:数据库,标签单元,分类单元,语义子集形成单元,脱敏单元,加密单元和数据处理中心;所述数据库,用于存储电力数据;所述标签单元,用于将电力数据集分解成字段内容和标签两列,按照标签列对电
力数据集进行分类,得到文字数据子集、非文字数据子集;所述分类单元,用于对非文字数据子集进行分类,得到字母数据、符号数据和数字串数据,并上传至数据处理中心;所述语义子集形成单元,用于在文字数据子集中提取出中心词,按照语义相似度形成多个语义子集;脱敏单元,用于对不同语义子集的字段内容匹配敏感信息,映射到不同的脱敏规则;所述加密单元,用于对映射后的敏感数据进行加密处理;所述数据处理中心接收加密后的敏感数据和非文字数据子集分类后的数据。
[0010]进一步地,所述脱敏单元包括匹配模块及映射模块,所述匹配模块用于获取不同语义子集的字段内容,采用敏感词聚类算法匹配敏感信息;所述映射模块用于基于聚类结果进行不同脱敏规则的映射。
[0011]相比于现有技术,本专利技术具有如下有益技术效果:将电力数据集分解成字段内容和标签两列,对电力数据集进行分类,得到文字数据子集、非文字数据子集;对非文字数据子集进行分类,得到字母数据、符号数据和数字串数据,并上传至数据处理中心;在文字数据子集中提取出中心词,按照语义相似度形成多个语义子集;对不同语义子集的字段内容匹配敏感信息,映射到不同的脱敏规则;对映射后的敏感数据进行加密处理;将加密后的敏感数据上传至数据处理中心,实现了能进行数据的自动识别,有效保护敏感数据。
附图说明
[0012]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0013]图1为本专利技术的用于保证电力数据安全的数据处理方法的流程示意图。
[0014]图2为本专利技术的按照语义相似度形成多个语义子集的步骤流程图。
[0015]图3为本专利技术的用于保证电力数据安全的数据处理系统的结构示意图。
具体实施方式
[0016]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0017]在本专利技术的具体实施例附图中,为了更好、更清楚的描述系统中的各元件的工作原理,表现所述装置中各部分的连接关系,只是明显区分了各元件之间的相对位置关系,并不能构成对元件或结构内的信号传输方向、连接顺序及各部分结构大小、尺寸、形状的限定。
[0018]如图1所示,为本专利技术的用于保证电力数据安全的数据处理方法的流程示意图,包
括如下步骤:S1、将电力数据集分解成字段内容和标签两列,按照标签列对电力数据集进行分类,得到文字数据子集、非文字数据子集。
[0019]将电力数据集分解成字段内容和标签两列,提取电力数据集中每个字段的具体内容,并为其打上对应的类型标签,包括:文字数据标签、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于保证电力数据安全的数据处理方法,其特征在于,包括如下步骤:S1、将电力数据集分解成字段内容和标签两列,按照标签列对电力数据集进行分类,得到文字数据子集、非文字数据子集;S2、对所述非文字数据子集进行分类,得到字母数据、符号数据和数字串数据,并上传至数据处理中心;S3、在所述文字数据子集中提取出中心词,按照语义相似度形成多个语义子集;S4、对不同语义子集的字段内容匹配敏感信息,映射到不同的脱敏规则;S5、对映射后的敏感数据进行加密处理;S6、将加密后的敏感数据上传至数据处理中心。2.根据权利要求1所述的用于保证电力数据安全的数据处理方法,其特征在于,步骤S3包括如下步骤:S31、接收电力数据中的文字数据子集,构成具有n个数据的集合;S32、通过滤除技术删除集合X中的噪声数据,输出语义集合S;S33、设定中心词,将语义集合S采用遍历方式搜索,逐个计算每个语义与中心词取绝对差值:;S34、将语义集合S按照绝对差值进行排序,设定语义间隔阈值,绝对差值大于语义间隔阈值的所有语义划分在一个语义子集中,形成多个语义子集。3.根据权利要求2所述的用于保证电力数据安全的数据处理方法,其特征在于,步骤S4包括如下步骤:S41、获取不同语义子集的字段内容,采用敏感词聚类算法匹配敏感信息;对m个语义子集的字段内容执行敏感词聚类算法,基于K个敏感词,计算m个语义子集的字段内容的中心语义与敏感词的距离的平方和d,公式为:;式中,表示第j个语义子集的字段内容的中心语义;表示第i个敏感词;表示聚类系数;S42、基于聚类结果进行不同脱敏规则的映射。4.根据权利要求3所述的用于保证电力数据安全的数据处理方法,其特征在于,步骤S42中,表示脱敏规则群;E表示映射规则,设相同聚类G中的任意两个元素为u,v,中的任意两个元素为a,b;、分...

【专利技术属性】
技术研发人员:来骥李硕张实君徐相森曾婧聂正璞孟德
申请(专利权)人:国网冀北电力有限公司信息通信分公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1