System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及告警信号,尤其是涉及一种基于知识图谱和改进图神经网络的告警信号分级方法。
技术介绍
1、随着电力系统规模的不断扩大其产生了海量的电力数据,近年来人工智能技术的快速发展为有效的处理并分析这些数据奠定了良好的基础。继电保护装置作为监测电力系统或设备运行状态的一种装置,其会产生大量的告警信号,针对海量的告警信号,仅仅依靠人工来处理分析具有时效性差,效率低,准确率难以保证的缺点,采用传统的机器学习方法来处理分析这些告警信号时会严重依赖于特征工程,使用特征工程的方法不仅工作量大,效率低,而且继电保护装置产生的告警信号数据通常属于短文本类别,并且告警信息中通常包含许多电力系统中的专业术语,传统的机器学习算法比如支持向量机难以充分理解短文本中蕴含的信息,常常会造成信息提取不充分的情况,进而导致无法准确对告警信号产生分级,对继电保护告警信号分级是一类时效性要求比较强的工作,要求相关工作人员快速准确的对告警信号进行分级,进而能够匹配相应的故障处置措施来对电力设备或系统进行检修,若无法准确快速的处理告警信号,严重时会导致电力系统或设备瘫痪,因此采用先进的人工智能算法对继电保护告警信号进行准确快速的分级对维持电力系统或设备稳定高效运转具有重大的意义。
2、传统的对告警信号进行分级的研究已经取得了不小的成果,主要采用机器学习算法比如支持向量机,或者深度学习算法比如循环神经网络和卷积神经网络。机器学习算法的缺点有以下几点:1)机器学习算法在前期对数据进行处理时步骤繁琐需要依靠大量的人力,需要对文本进行分词,去除停用词,分词结果的
3、总之现有方法的不足之处主要有两个方面:1)在面对蕴含复杂语义信息的告警信号数据时对文本信息的提取不够充分往往只关注局部信息忽略了全局信息。2)在对告警信息进行特征提取时往往只关注单条文本的信息,然而不同数据之间往往存在一定了联系,因此忽略了多条语句之间的关系信息。
技术实现思路
1、本专利技术的目的是提供一种基于知识图谱和改进图神经网络的告警信号分级方法,利用告警信号图谱中的知识作为先验经验,能够更好的约束模型来进行训练,提高模型的准确率,并且采用改进的图神经网络来充分把握不同句子之间以及同一句子内部的关联,有利于模型理解更深层次的语义信息。
2、为实现上述目的,本专利技术提供了一种基于知识图谱和改进图神经网络的告警信号分级方法,包括以下步骤:s1、将告警信号知识图谱中的每个三元组合并为一个包含实体和关系信息的句子si;
3、s2、n个句子si中包含w个不同的字符ci,每个句子si对应的标签为labeli,使用句子si、字符ci与标签labeli来构建文本图g;
4、s3、计算得出文本图g中两个节点之间的边的权重,生成所有节点的初始嵌入矩阵;
5、s4、基于构建好的文本图g,将文本图g送入改进的图神经网络进行建模,预训练阶段完成后,得到所有句子节点的嵌入表示,即xsen,为之后s6阶段的相似度计算、s7阶段的向量融合做准备;
6、s5、设输入模型的待分级语句为s1i,i代表待分级的第i个句子,将待分级语句s1i送入bert-bilstm特征提取层进行特征提取,得到特征提取层的结果hi;
7、s6、将特征提取层的结果hi按照列的方向进行融合,使特征提取层的结果hi与句子节点的初始嵌入矩阵xsen中的向量维度相同,然后将特征提取层的结果hi与句子节点的初始嵌入矩阵xsen中所有的向量进行相似度计算,得出相似度最高的前五个句子节点的嵌入表示;
8、s7、当相似度最高的前五个句子节点均大于0.5,将未进行按列融合的特征提取层的结果hi与相似度最高的前五个句子节点进行句子级别的注意力计算;将求得的权重系数分别与相似度最高的前五个句子节点进行相乘再相加得到融合后的注意力向量,将注意力向量yi与特征提取层的结果hi进行拼接;进入下一步骤s8;当相似度最高的前五个句子节点有一个小于0.5,则直接将未进行按列融合的特征提取层的结果hi展成一维向量并拼接d×l维零向量,进入步骤s8;
9、s8、将拼接后的结果送入softmax层进行分类得到最终结果。
10、优选的,步骤s1中,设告警信号知识图谱中的实体-关系-实体的表示形式为(ei,rk,ej)其中ei∈e{e1,e2,...ez},rk∈r{r1,r2,...rm},e代表所有实体集,r代表所有的关系集。一共有n条三元组,则会产生n条句子,si中i代表第i个句子。
11、优选的,步骤s2中,设文本图g中字符节点的初始嵌入特征为全零向量,本项目中有四类标签,所以标签节点的初始嵌入矩阵为label={label1,labeli,...label4},labeli为随机初始化的d维向量,句子节点的初始嵌入特征xi经过bert模型嵌入得到,计算方法为xi=bert(si),xi为d维向量,设句子节点的初始嵌入矩阵为xsen={x1,x2,...xi},则整个文本图g的初始节点嵌入矩阵为
12、x的形状为(n+w+4)×d,其中n为句子节点个数,w为字符节点个数,4代表标签的四个种类,d代表这些节点向量的维度,是d维。
13、优选的,步骤s3中,设边的权重矩阵为a,若两个节点都为句子节点,则的值如式(1)所示:
14、
15、若其中一个节点为句子节点另一个为字符节点则的值按照式(2)得出,
16、
17、其中,tfij为字符cj在句子si出现的频率,n为所有句子的个数,df为包含字符cj的句子个数。
18、若两个节点都是字符节点则计算这两个节点的pmi指标,pmi越大说明这两个字符的相关性越强。的值按式(3)得出。
19、
20、
21、
22、若两个节点相同则这两个节点之间的权重关系为1,若其中本文档来自技高网...
【技术保护点】
1.一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤S1中,设告警信号知识图谱中的实体-关系-实体的表示形式为(ei,rk,ej)其中ei∈E{e1,e2,...ez},rk∈R{r1,r2,...rm},E代表所有实体集,R代表所有的关系集。一共有n条三元组,则会产生n条句子,si中i代表第i个句子。
3.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤S2中,设文本图G中字符节点的初始嵌入特征为全0向量,本项目中有四类标签,所以标签节点的初始嵌入矩阵为label={label1,labeli,...label4},labeli为随机初始化的d维向量,句子节点的初始嵌入特征xi经过BERT模型嵌入得到,计算方法为xi=BERT(si),xi为d维向量,设句子节点的初始嵌入矩阵为Xsen={x1,x2,...xi},则整个文本图G的初始节点嵌入矩阵为
4.根据权利要求1所述的一种基于
5.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤S4中,在对节点的嵌入矩阵进行更新时采用TCN模型,设第0层的节点嵌入向量L(0)表示为初始节点嵌入矩阵,即L(0)=X,设第i次聚合后的表示为Ji=D-1/2AD-1/2L(i-1),将Ji送入TCN模型中进行更新,具体方式如下:
6.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤S5中,提取后的结果可以由(13)-(16)式得出。
7.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤S6中,相似度最高的五个节点,设其分别为x1,x2,x3,x4,x5,相似度最高的五个节点的相似度分别为smi1,smi2,smi3,smi4,smi5。
8.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤S7中,若smi1,smi2,smi3,smi4,smi5均大于0.5,将未进行按列融合的hi与x1,x2,x3,x4,x5进行句子级别的注意力计算,首先将hi展平为一维向量,则hi形状为1*(d*l),为了能够进行注意力计算,对x1,x2,x3,x4,x5进行补0处理,得到与hi相同的维度,然后hi分别与x1,x2,x3,x4,x5进行内积计算,如式(17),得到权重系数aij,然后对权重系数进行归一化,如式(18),最终将求得的权重系数分别与x1,x2,x3,x4,x5进行相乘再相加得到融合后的向量表示yi如式(19)。
9.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤S8中,将oinew送入softmax层,得到四种告警信号类别的概率,选取概率值最大的那个做为告警信号的最终结果。
...【技术特征摘要】
1.一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤s1中,设告警信号知识图谱中的实体-关系-实体的表示形式为(ei,rk,ej)其中ei∈e{e1,e2,...ez},rk∈r{r1,r2,...rm},e代表所有实体集,r代表所有的关系集。一共有n条三元组,则会产生n条句子,si中i代表第i个句子。
3.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤s2中,设文本图g中字符节点的初始嵌入特征为全0向量,本项目中有四类标签,所以标签节点的初始嵌入矩阵为label={label1,labeli,...label4},labeli为随机初始化的d维向量,句子节点的初始嵌入特征xi经过bert模型嵌入得到,计算方法为xi=bert(si),xi为d维向量,设句子节点的初始嵌入矩阵为xsen={x1,x2,...xi},则整个文本图g的初始节点嵌入矩阵为
4.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤s3中,设边的权重矩阵为a,若两个节点都为句子节点,则的值如式(1)所示:
5.根据权利要求1所述的一种基于知识图谱和改进图神经网络的告警信号分级方法,其特征在于,步骤s4中,在对节点的嵌入矩阵进行更新时采用tcn模型,设第0层的节点嵌入向量l(0)表示为初始节点嵌入矩阵,即l(0)=x,设第i次聚合后...
【专利技术属性】
技术研发人员:李萍,颜长鑫,李佑伟,朱瑾,周睿,王业,任旭超,王奎,赵一鸣,薛晓超,王官亮,宋昆,
申请(专利权)人:国网江苏省电力有限公司淮安供电分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。