一种电力数据文件的处理系统和方法技术方案

技术编号:39797228 阅读:7 留言:0更新日期:2023-12-22 02:30
本发明专利技术提供的一种电力数据文件的处理系统和方法,涉及数据处理技术领域

【技术实现步骤摘要】
一种电力数据文件的处理系统和方法


[0001]本专利技术涉及数据处理
,具体而言,涉及一种电力数据文件的处理系统和方法


技术介绍

[0002]在数据处理技术的精度越来越高的情况下,数据处理技术的应用场景也不断扩展,例如,可以在电力领域中加以利用,具体来说,对于采集到的或形成的电力数据文件,可以利用数据处理技术进行数据特征分析,以确定出数据之间的相关性或区别性,使得可以进行分类存储,但是,在现有技术中,存在着分类存储的可靠度不佳的问题


技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种电力数据文件的处理系统和方法,以提高分类存储的可靠度

[0004]为实现上述目的,本专利技术实施例采用如下技术方案:
[0005]一种电力数据文件的处理方法,包括:
[0006]对于待存储的多个待存储电力数据文件中的每一个待存储电力数据文件,将该待存储电力数据文件标记为待处理电力数据文件;
[0007]利用多个电力数据分析网络,分析出所述待处理电力数据文件对应的目标电力异常表征数据,所述目标电力异常表征数据用于反映所述待处理电力数据文件对应的电力系统的异常状态;
[0008]基于对应的目标电力异常表征数据,对所述多个待存储电力数据文件进行第一分类处理,以形成至少一个第一分类集合,每一个所述第一分类集合包括至少一个待存储电力数据文件;
[0009]基于待存储电力数据文件之间的相似度,分别在每一个所述第一分类集合内部进行第二分类处理,形成每一个所述第一分类集合对应的至少一个第二分类集合,每一个第二分类集合包括至少一个待存储电力数据文件;
[0010]对得到的每一个所述第二分类集合分别进行分类存储

[0011]在一些优选的实施例中,在上述电力数据文件的处理方法中,所述基于对应的目标电力异常表征数据,对所述多个待存储电力数据文件进行第一分类处理,以形成至少一个第一分类集合的步骤,包括:
[0012]将所述多个待存储电力数据文件中的每两个待存储电力数据文件对应的目标电力异常表征数据进行一致性或相似性分析;
[0013]将分析出的对应的目标电力异常表征数据一致的待存储电力数据文件或对应的目标电力异常表征数据属于同一个参数区间的待存储电力数据文件,分配到同一个第一分类集合中,以形成至少一个第一分类集合

[0014]在一些优选的实施例中,在上述电力数据文件的处理方法中,所述基于待存储电
力数据文件之间的相似度,分别在每一个所述第一分类集合内部进行第二分类处理,形成每一个所述第一分类集合对应的至少一个第二分类集合的步骤,包括:
[0015]对于每一个所述第一分类集合,对该第一分类集合包括的待存储电力数据文件进行数量统计操作,以形成对应的文件数量统计值,并在该文件数量统计值小于或等于预先确定的第一参考值的情况下,将该第一分类集合确定为对应的第二分类集合,以及,在该文件数量统计值大于所述第一参考值的情况下,将该第一分类集合确定为对应的第三分类集合;
[0016]基于待存储电力数据文件之间的相似度,分别在每一个所述第三分类集合内部进行第二分类处理,形成每一个所述第三分类集合对应的至少一个第二分类集合

[0017]在一些优选的实施例中,在上述电力数据文件的处理方法中,所述基于待存储电力数据文件之间的相似度,分别在每一个所述第三分类集合内部进行第二分类处理,形成每一个所述第三分类集合对应的至少一个第二分类集合的步骤,包括:
[0018]将所述第三分类集合中的每一个待存储电力数据文件进行关键词提取操作,以形成每一个待存储电力数据文件对应的关键词序列,所述关键词序列中的每一个关键词属于针对电力系统领域配置的参考关键词集合;
[0019]分别对对应的所述关键词序列进行特征挖掘处理,以形成所述待存储电力数据文件对应的关键词特征表示;
[0020]基于所述关键词特征表示,计算出对应的待存储电力数据文件之间的相似度,并基于所述待存储电力数据文件之间的相似度,分别在每一个所述第三分类集合内部进行第二分类处理,形成每一个所述第三分类集合对应的至少一个第二分类集合

[0021]在一些优选的实施例中,在上述电力数据文件的处理方法中,所述分别对对应的所述关键词序列进行特征挖掘处理,以形成所述待存储电力数据文件对应的关键词特征表示的步骤,包括:
[0022]对于所述关键词序列中的每一个关键词,对该关键词进行嵌入处理,以形成该关键词对应的词嵌入特征表示;以及,基于目标电力数据语料,确定出所述关键词序列中的每一个关键词,在所述关键词序列中是否具有相关关键词,所述相关关键词和对应的所述关键词,在所述目标电力数据语料中的共现概率大于预设概率;
[0023]将所述关键词序列中的不具有相关关键词的每一个关键词,标记为第一关键词,并将所述关键词序列中的具有相关关键词的每一个关键词,标记为第二关键词,以及,将每一个所述第一关键词的词嵌入特征表示进行标记,以标记为该第一关键词的目标词嵌入特征表示;
[0024]对于每一个所述第二关键词,对该第二关键词对应的相关关键词对应的词嵌入特征表示进行标记处理,以标记为该第二关键词对应的相关词嵌入特征表示,以及,对该相关词嵌入特征表示进行转置操作,以形成该第二关键词对应的转置词嵌入特征表示;
[0025]分别计算每一个所述第二关键词对应的词嵌入特征表示

对应的转置词嵌入特征表示和相关词嵌入特征表示进行融合操作,以形成每一个所述第二关键词对应的目标词嵌入特征表示;
[0026]对所述关键词序列中的每一个关键词对应的目标词嵌入特征表示进行拼接操作,以形成所述待存储电力数据文件对应的关键词特征表示

[0027]在一些优选的实施例中,在上述电力数据文件的处理方法中,所述基于所述关键词特征表示,计算出对应的待存储电力数据文件之间的相似度,并基于所述待存储电力数据文件之间的相似度,分别在每一个所述第三分类集合内部进行第二分类处理,形成每一个所述第三分类集合对应的至少一个第二分类集合的步骤,包括:
[0028]对所述第三分类集合中每一个待存储电力数据文件对应的关键词特征表示进行均值计算,以输出对应的均值关键词特征表示;
[0029]对于所述第三分类集合中每一个待存储电力数据文件,计算该待存储电力数据文件对应的关键词特征表示和所述均值关键词特征表示之间的余弦相似度,以得到该待存储电力数据文件对应的余弦相似度;
[0030]基于余弦配置的多个连续的相似度区间,对所述第三分类集合中每一个待存储电力数据文件进行第二分类处理,以形成所述第三分类集合对应的至少一个第二分类集合,在所述第二分类集合中,包括的每一个待存储电力数据文件对应的余弦相似度属于同一个相似度区间

[0031]在一些优选的实施例中,在上述电力数据文件的处理方法中,所述利用多个电力数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种电力数据文件的处理方法,其特征在于,包括:对于待存储的多个待存储电力数据文件中的每一个待存储电力数据文件,将该待存储电力数据文件标记为待处理电力数据文件;利用多个电力数据分析网络,分析出所述待处理电力数据文件对应的目标电力异常表征数据,所述目标电力异常表征数据用于反映所述待处理电力数据文件对应的电力系统的异常状态;基于对应的目标电力异常表征数据,对所述多个待存储电力数据文件进行第一分类处理,以形成至少一个第一分类集合,每一个所述第一分类集合包括至少一个待存储电力数据文件;基于待存储电力数据文件之间的相似度,分别在每一个所述第一分类集合内部进行第二分类处理,形成每一个所述第一分类集合对应的至少一个第二分类集合,每一个第二分类集合包括至少一个待存储电力数据文件;对得到的每一个所述第二分类集合分别进行分类存储
。2.
如权利要求1所述的电力数据文件的处理方法,其特征在于,所述基于对应的目标电力异常表征数据,对所述多个待存储电力数据文件进行第一分类处理,以形成至少一个第一分类集合的步骤,包括:将所述多个待存储电力数据文件中的每两个待存储电力数据文件对应的目标电力异常表征数据进行一致性或相似性分析;将分析出的对应的目标电力异常表征数据一致的待存储电力数据文件或对应的目标电力异常表征数据属于同一个参数区间的待存储电力数据文件,分配到同一个第一分类集合中,以形成至少一个第一分类集合
。3.
如权利要求1所述的电力数据文件的处理方法,其特征在于,所述基于待存储电力数据文件之间的相似度,分别在每一个所述第一分类集合内部进行第二分类处理,形成每一个所述第一分类集合对应的至少一个第二分类集合的步骤,包括:对于每一个所述第一分类集合,对该第一分类集合包括的待存储电力数据文件进行数量统计操作,以形成对应的文件数量统计值,并在该文件数量统计值小于或等于预先确定的第一参考值的情况下,将该第一分类集合确定为对应的第二分类集合,以及,在该文件数量统计值大于所述第一参考值的情况下,将该第一分类集合确定为对应的第三分类集合;基于待存储电力数据文件之间的相似度,分别在每一个所述第三分类集合内部进行第二分类处理,形成每一个所述第三分类集合对应的至少一个第二分类集合
。4.
如权利要求3所述的电力数据文件的处理方法,其特征在于,所述基于待存储电力数据文件之间的相似度,分别在每一个所述第三分类集合内部进行第二分类处理,形成每一个所述第三分类集合对应的至少一个第二分类集合的步骤,包括:将所述第三分类集合中的每一个待存储电力数据文件进行关键词提取操作,以形成每一个待存储电力数据文件对应的关键词序列,所述关键词序列中的每一个关键词属于针对电力系统领域配置的参考关键词集合;分别对对应的所述关键词序列进行特征挖掘处理,以形成所述待存储电力数据文件对应的关键词特征表示;基于所述关键词特征表示,计算出对应的待存储电力数据文件之间的相似度,并基于
所述待存储电力数据文件之间的相似度,分别在每一个所述第三分类集合内部进行第二分类处理,形成每一个所述第三分类集合对应的至少一个第二分类集合
。5.
如权利要求4所述的电力数据文件的处理方法,其特征在于,所述分别对对应的所述关键词序列进行特征挖掘处理,以形成所述待存储电力数据文件对应的关键词特征表示的步骤,包括:对于所述关键词序列中的每一个关键词,对该关键词进行嵌入处理,以形成该关键词对应的词嵌入特征表示;以及,基于目标电力数据语料,确定出所述关键词序列中的每一个关键词,在所述关键词序列中是否具有相关关键词,所述相关关键词和对应的所述关键词,在所述目标电力数据语料中的共现概率大于预设概率;将所述关键词序列中的不具有相关关键词的每一个关键词,标记为第一关键词,并将所述关键词序列中的具有相关关键词的每一个关键词,标记为第二关键词,以及,将每一个所述第一关键词的词嵌入特征表示进行标记,以标记为该第一关键词的目标词嵌入特征表示;对于每一个所述第二关键词,对该第二关键词对应的相关关键词对应的词嵌入特征表示进行标记处理,以标记为该第二关键词对应的相关词嵌入特征表示,以及,对该相关词嵌入特征表示进行转置操作,以形成该第二关键词对应的转置词嵌入特征表示;分别计算每一个所述第二关键词对应的词嵌入特征表...

【专利技术属性】
技术研发人员:邹剑王珂李南王坤
申请(专利权)人:湖北中恒电测科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1