语义分析知识库构建方法和配电自动化终端运维知识库技术

技术编号:34480020 阅读:20 留言:0更新日期:2022-08-10 08:56
本发明专利技术提供了语义分析知识库构建方法和配电自动化终端运维知识库,利用现场巡视人员对配电自动化终端运行状态的自然语言描述,自动抽取关键信息,形成配电自动化终端描述文本,通过分词技术与深度学习算法,形成配电自动化终端运维知识库,便于现场人员提高其自身在开展配电自动化终端维护工作。通过在配电自动化终端运维工作中引入自然语言语义分析技术,可实现配电自动化终端户外恶劣环境下巡视信息的快速分析处理;通过形成的的配电自动化终端运维知识库,可根据巡视人员给出的配电自动化终端状态描述自然语言自动推荐相应的配电自动化终端维护工作。电自动化终端维护工作。电自动化终端维护工作。

【技术实现步骤摘要】
语义分析知识库构建方法和配电自动化终端运维知识库


[0001]本专利技术属于电力
,具体涉及语义分析知识库构建方法和配电自动化终端运维知识库。

技术介绍

[0002]配电自动化终端主要用于配电网正常运行时的电压电流数据采集与监测、配电开关状态采集与开合遥控等。配电自动化终端是配电自动化系统的重要组成部分。随着配电自动化系统在国家电网和南方电网的大规模推广应用,配电自动化终端、配套的通信系统以及配电主站的数量呈现爆发式增长态势。目前多个城市的配电自动化终端达到数万级别,配电自动化主站与配电自动化终端通过通信系统实现双向交互,为配电网调度、运行与维护提供信息化支撑。
[0003]相比输电网中的自动化设备,配电自动化终端运行环境复杂得多。如作为配电自动化终端的一种主要类型,安装于架空线路的馈线终端单元往往在高空放置,运维检修非常不便。另外一方面,海量的配电自动化终端也必然导致配电网运维人员压力过大,其突出的一方面为大量的现场巡视人员技术培训不足,无法判断配电自动化终端所处的运行状态,也无法给出相应的维护建议。
[0004]为减轻目前的配电自动化终端运维人员的压力,现有的措施往往是延长配电自动化终端的巡视周期,这会导致配电自动化终端失效概率大大增加。另外一种措施则是采用在线监测方法来实现配电自动化终端的状态检修,但如何实现配电自动化终端的信息采集以及准确的状态评价,仍处于前期研究阶段,近期无法达到实用化水平。

技术实现思路

[0005]本专利技术要解决的技术问题是:提供语义分析知识库构建方法和配电自动化终端运维知识库,用于实现自动采集配电自动化终端的信息以及准确评价运维状态的功能。
[0006]本专利技术为解决上述技术问题所采取的技术方案为:语义分析知识库构建方法,包括以下步骤:
[0007]S1:获取关于配电自动化终端的运行巡视信息和维护信息的自然语言描述资料;
[0008]S2:对步骤S1得到的自然语言描述资料进行去停用词处理,用于过滤对配电自动化终端运维知识库无帮助的字词;
[0009]S3:设C1、C2、

、C
m
分别表示第1个、第2个、

、第m个词,每个词至少包括1个中文字符,组建配电自动化终端运维知识库词典{C1,C2,

,C
m
};
[0010]S4:利用双向匹配最大算法对步骤S2得到的自然语言描述资料进行分词处理,得到分词结果;
[0011]S5:根据步骤S4得到的分词结果和基于注意力机制的长短期记忆神经网络,形成配电自动化终端运维知识库。
[0012]按上述方案,所述的步骤S1中,自然语言描述资料的形式包括语音和文字。
[0013]按上述方案,所述的步骤S2中,具体步骤为:过滤自然语言中包括“的、地、得、是、如下、了、吃饭、休息”的字。
[0014]按上述方案,所述的步骤S3中,具体步骤为:
[0015]S31:根据现有的配电网运维检修规程提取描述设备运行和维护的词条,形成配电自动化终端运行巡视和维护自然语言描述的词典{C1,C2,

,C
n
};
[0016]S32:设x
i
为自然语言描述中得到的2个中文字、3个中文字和4个中文字的第i个字符串,N(x
i
)为第i个字符串出现的频次,N
set
为设定的裕度;统计分析2个中文字、3个中文字、4个中文字在现场巡视人员形成的所有历史自然语言描述资料中出现的频率,若N(x
i
)≥N
set
,则在专家校验通过后加入词典,形成配电自动化终端运维知识库词典{C1,C2,

,C
n


,C
m
},m≥n。
[0017]进一步的,所述的步骤S4中,具体步骤为:
[0018]S41:选择步骤S2得到的自然语言描述资料中的任意一条语句;
[0019]S42:在语句中从左往右取字符串,设字符串的最大长度为步骤S3得到的词典中所有词的最大长度max{leng(C
i
),1≤i≤m},leng(C
i
)为第i个词C
i
的字符数;
[0020]S43:扫描词典,若字符串在词典中匹配到至少一个词条,则在语句中去掉该字符串,跳转至步骤S42对该语句的其他字符串进行处理;若字符串无法匹配词典中的任意一个词条,则进入步骤S44;
[0021]S44:删除字符串最右边的1个字符,形成新的字符串a,跳转至步骤S43;直至对语句完成所有分割,并得到该分割结果中词的最大长度L
a

[0022]S46:在语句中从左往右取字符串,字符串的最大长度设置方法与步骤S42相同;
[0023]S47:扫描词典,若字符串在词典中匹配到至少一个词条,则在语句中去掉该字符串,跳转至步骤S46对该语句的其他字符串进行处理;若字符串无法匹配词典中的任意一个词条,则进入步骤S48;
[0024]S48:删除字符串最左边的1个字符,形成新的字符串a,跳转至步骤S47;直至对语句完成所有分割,并得到该分割结果中词的最大长度L
b

[0025]S49:若步骤S44和步骤S48得到的语句分割结果相同,则分割结果即为分词结果;
[0026]若步骤S44和步骤S48得到的语句分割结果不同,且L
a
>L
b
,则选取步骤S44得到的语句分割结果;
[0027]若步骤S44和步骤S48得到的语句分割结果不同,且L
a
<L
b
,则选取步骤S46得到的语句分割结果。
[0028]按上述方案,所述的步骤S5中,具体步骤为:
[0029]S51:对每一次配电自动化终端的运维信息的自然语言进行分词处理,形成该次配电自动化终端的运行巡视信息的自然语言的分词结果和维护信息的自然语言的分词结果;
[0030]S52:利用词向量Word2Vec的Skip

Gram模型对运行巡视信息的自然语言的分词结果进行编码,得到Ins向量;
[0031]S53:利用词向量Word2Vec的Skip

Gram模型对维护信息的自然语言的分词结果进行编码,得到Mnt向量;
[0032]S54:构建基于注意力机制的LSTM

Attention长短期记忆神经网络,将Ins向量作为输入变量,将Mnt向量做为输出结果;
[0033]S55:根据配电自动化终端的历史运维信息得到的典型Ins向量与典型Mnt向量,对步骤S54构建的LSTM

Attention长短期记忆神经网络进行训练,实现连接配电自动化终端的运行巡视本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.语义分析知识库构建方法,其特征在于:包括以下步骤:S1:获取关于配电自动化终端的运行巡视信息和维护信息的自然语言描述资料;S2:对步骤S1得到的自然语言描述资料进行去停用词处理,用于过滤对配电自动化终端运维知识库无帮助的字词;S3:设C1、C2、

、C
m
分别表示第1个、第2个、

、第m个词,每个词至少包括1个中文字符,组建配电自动化终端运维知识库词典{C1,C2,

,C
m
};S4:利用双向匹配最大算法对步骤S2得到的自然语言描述资料进行分词处理,得到分词结果;S5:根据步骤S4得到的分词结果和基于注意力机制的长短期记忆神经网络,形成配电自动化终端运维知识库。2.根据权利要求1所述的语义分析知识库构建方法,其特征在于:所述的步骤S1中,自然语言描述资料的形式包括语音和文字。3.根据权利要求1所述的语义分析知识库构建方法,其特征在于:所述的步骤S2中,具体步骤为:过滤自然语言中包括“的、地、得、是、如下、了、吃饭、休息”的字。4.根据权利要求1所述的语义分析知识库构建方法,其特征在于:所述的步骤S3中,具体步骤为:S31:根据现有的配电网运维检修规程提取描述设备运行和维护的词条,形成配电自动化终端运行巡视和维护自然语言描述的词典{C1,C2,

,C
n
};S32:设x
i
为自然语言描述中得到的2个中文字、3个中文字和4个中文字的第i个字符串,N(x
i
)为第i个字符串出现的频次,N
set
为设定的裕度;统计分析2个中文字、3个中文字、4个中文字在现场巡视人员形成的所有历史自然语言描述资料中出现的频率,若N(x
i
)≥N
set
,则在专家校验通过后加入词典,形成配电自动化终端运维知识库词典{C1,C2,

,C
n


,C
m
},m≥n。5.根据权利要求4所述的语义分析知识库构建方法,其特征在于:所述的步骤S4中,具体步骤为:S41:选择步骤S2得到的自然语言描述资料中的任意一条语句;S42:在语句中从左往右取字符串,设字符串的最大长度为步骤S3得到的词典中所有词的最大长度max{leng(C
i
),1≤i≤m},leng(C
i
)为第i个词C
i
的字符数;S43:扫描词典,若字符串在词典中匹配到至少一个词条,则在语句中去掉该字符串,跳转至步骤S42对该语句的其他字符串进行处理;若字符串无法匹配词典中的任意一个词条,则进入步骤S44;S44:删除字符串最右边的1个字符,形成新的字符串a,跳转至步骤S43;直至对语句完成所有分割,并得到该分割结果中词的最大长度L
a
;S46:在语句中从左往右取字符串,字符串的最大长度设置方法与步骤S42相同;S47:扫描词典,若字符串在词典中匹配到至少一个词条,则在语句中去掉该字符串,跳转至步骤S46对该语句的其他字符串进行处理;若字符串无法匹配词典中的任意一个词条,则进入步骤S48;S48:删除字符串最左边的1个字符,形成新的字符串a,跳转至步骤S47;直至对语句完成所有分割,并得到该分割结果中词的最大长度L
b

S49:若步骤S44和步骤S48得到的语句分割结果相同,则分割结果...

【专利技术属性】
技术研发人员:杨晨陈聪吴烜汪洋唐金锐
申请(专利权)人:武汉电力职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1