电网设备名称匹配方法及系统技术方案

技术编号:24092949 阅读:21 留言:0更新日期:2020-05-09 08:54
本发明专利技术公开了一种电网设备名称匹配方法,包括根据预设的拼接规则,将采集的待匹配电网设备名称进行重新拼接;基于电力术语库,对重新拼接的电网设备名称进行分词;基于属性约束规则,进行电网设备名称初步匹配;将初步匹配的电网设备名称进行分词相似度计算,获得最终的匹配结果。同时公开了相应的系统。本发明专利技术对重新拼接的电网设备名称进行精准分词,在此基础上通过分词后的词条集合进行相似度计算,实现多源异构电网中电网设备名称的精准匹配,效率和匹配率高。

Name matching method and system of power grid equipment

【技术实现步骤摘要】
电网设备名称匹配方法及系统
本专利技术涉及一种电网设备名称匹配方法及系统,属于智能电网输变电设备模型匹配的研究、应用

技术介绍
随着国网调控云平台系统建设的深化,需要对云端电网模型与属地EMS系统中设备模型进行设备台帐ID关系映射,设备台帐匹配就是在多源系统之间,确定设备的唯一性及建立多源系统中设备台帐的映射关系。进行设备台帐ID关系映射主要是进行电网设备名称匹配,由于各属地EMS系统在电网设备的命名方式存在差异,导致云端和属地EMS系统中相同电网设备的名称不尽相同,无法快速、准确的进行设备台帐ID映射。现有的匹配方法主要包括以下两种:1、通过人工筛选、比对方式。这种方式虽匹配度高,但是在实施过程中效率较低,并且耗费人力;2、通过设备名称相互包含方式。这种方式虽降低了人力成本,但是对设备名称的规范性需要较高的要求,不同系统中设备名称的命名规则存在差异,采用相互包含方式的匹配率较低。
技术实现思路
本专利技术提供了一种电网设备名称匹配方法及系统,解决了
技术介绍
中披露的问题。为了解决上述技术问题,本专利技术所采用的技术方案是:电网设备名称匹配方法,包括,根据预设的拼接规则,将采集的待匹配电网设备名称进行重新拼接;基于电力术语库,对重新拼接的电网设备名称进行分词;基于属性约束规则,进行电网设备名称初步匹配;将初步匹配的电网设备名称进行分词相似度计算,获得最终的匹配结果。拼接规则包括站内设备名称拼接规则和站间设备名称拼接规则;站内设备名称拼接规则:设备名称从前往后依次为所属区域、所属场站、电压等级、设备编号、设备类型;站间设备名称拼接规则:设备名称从前往后依次为所属区域、首端场站、末端场站、设备编号、设备类型。采用正向迭代最细粒度切分算法对重新拼接的电网设备名称进行分词,分词时优先匹配电力术语库中的词条。属性约束规则为,从所有重新拼接的电网设备名称中,筛选出具备相同属性的若干电网设备名称。依次两两计算各电网设备名称分词结果之间的相似度,相似度最高值对应的两个电网设备名称匹配。相似度计算过程为,通过电网设备名称分词结果计算词频向量;采用余弦相似度算法,计算两个电网设备名称分词结果的相似度。电网设备名称匹配系统,包括,重新拼接模块:根据预设的拼接规则,将采集的待匹配电网设备名称进行重新拼接;分词模块:基于电力术语库,对重新拼接的电网设备名称进行分词;初步匹配模块:基于属性约束规则,进行电网设备名称初步匹配;相似度计算模块:将初步匹配的电网设备名称进行分词相似度计算,获得最终的匹配结果。相似度计算模块包括,词频向量计算模块:通过电网设备名称分词结果计算词频向量;余弦相似度模块:采用余弦相似度算法,计算两个电网设备名称分词结果的相似度。一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行电网设备名称匹配方法。一种计算设备,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行电网设备名称匹配方法的指令。本专利技术所达到的有益效果:本专利技术对重新拼接的电网设备名称进行精准分词,在此基础上通过分词后的词条集合进行相似度计算,实现多源异构电网中电网设备名称的精准匹配,效率和匹配率高。附图说明图1为本专利技术的流程图。具体实施方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。实施例1如图1所示,电网设备名称匹配方法,包括以下步骤:步骤1,根据预设的拼接规则,将采集的待匹配电网设备名称进行重新拼接。各属地EMS系统在电网设备的命名方式存在差异,各类电网设备都具有名称或者编号等,单独使用名称或者编号并不能确保设备在全网的唯一性,因此需要合理的选择多个属性,重新拼接成新的名称,这样可有效提升匹配效率及准确性。步骤2,基于电力术语库,对重新拼接的电网设备名称进行分词。自然语言分词可将重新拼接的电网设备名称进行有效划分,由于电网设备名称中包含很多电力术语,在分词时往往会将一个专业术语分成若干个词,这样不利于语义的理解,因此分词要结合电力术语库,优先按照电力术语库分词,提高分词准确性。步骤3,基于属性约束规则,进行电网设备名称初步匹配。不同系统中,虽然相同电网设备命名规则不同,但是都具备若干相同的属性,通过属性约束规则降低无效的匹配计算,即剔除一些明显不匹配的,从而提高计算效率和匹配度。步骤4,将初步匹配的电网设备名称进行分词相似度计算,获得最终的匹配结果。上述方法对重新拼接的电网设备名称进行精准分词,在此基础上通过分词后的词条集合进行相似度计算,实现多源异构电网中电网设备名称的精准匹配,效率和匹配率高。实施例2电网设备名称匹配方法,在实施例1的基础上增加了具体的拼接规则,具体如下:站内电网设备主要包括变压器、母线、开关、刀闸等,跨场站电网设备主要是连接两侧厂站的输电线路。各类电网设备都具有名称(旧名称)或者编号等,例如50331刀闸,#1主变,Ⅰ线/Ⅱ线。但是,单独使用电网设备名称或者编号并不能确保电网设备在全网的唯一性,因此,需要通过多个属性特征的拼接成新名称,实现电网设备名称的唯一性,有效提升匹配效率及准确性。拼接规则包括站内设备名称拼接规则和站间设备名称拼接规则。站内设备名称拼接规则:设备名称从前往后依次为所属区域、所属场站、电压等级、设备编号、设备类型,具体如表1;表1站内设备名称拼接规则所属区域所属场站电压等级设备编号设备类型例如:山东.滨州站/500kV.#1母线,菏泽.巨野营里站/10kV#1接地变。站间设备名称拼接规则:设备名称从前往后依次为所属区域、首端场站、末端场站、设备编号、设备类型,具体如表2;表1站间设备名称拼接规则所属区域首端场站末端场站设备编号设备类型例如:山东.城勺Ⅰ线,山东.苍岩线。实施例3电网设备名称匹配方法,在实施例1的基础上增加了具体的分词方法,具体如下:采用正向迭代最细粒度切分算法对重新拼接的电网设备名称进行分词,分词时优先匹配电力术语库中的词条;通过电力术语的优先匹配,提高分词准确性。例如:山东.胶东换流站/500kV.极Ⅰ换流变5061开关,该电网设备名称不使用电力术语库进行分词结果为:[山东,胶东,换,流,站,5本文档来自技高网...

【技术保护点】
1.电网设备名称匹配方法,其特征在于:包括,/n根据预设的拼接规则,将采集的待匹配电网设备名称进行重新拼接;/n基于电力术语库,对重新拼接的电网设备名称进行分词;/n基于属性约束规则,进行电网设备名称初步匹配;/n将初步匹配的电网设备名称进行分词相似度计算,获得最终的匹配结果。/n

【技术特征摘要】
1.电网设备名称匹配方法,其特征在于:包括,
根据预设的拼接规则,将采集的待匹配电网设备名称进行重新拼接;
基于电力术语库,对重新拼接的电网设备名称进行分词;
基于属性约束规则,进行电网设备名称初步匹配;
将初步匹配的电网设备名称进行分词相似度计算,获得最终的匹配结果。


2.根据权利要求1所述的电网设备名称匹配方法,其特征在于:拼接规则包括站内设备名称拼接规则和站间设备名称拼接规则;
站内设备名称拼接规则:设备名称从前往后依次为所属区域、所属场站、电压等级、设备编号、设备类型;
站间设备名称拼接规则:设备名称从前往后依次为所属区域、首端场站、末端场站、设备编号、设备类型。


3.根据权利要求1所述的电网设备名称匹配方法,其特征在于:采用正向迭代最细粒度切分算法对重新拼接的电网设备名称进行分词,分词时优先匹配电力术语库中的词条。


4.根据权利要求1所述的电网设备名称匹配方法,其特征在于:属性约束规则为,从所有重新拼接的电网设备名称中,筛选出具备相同属性的若干电网设备名称。


5.根据权利要求1所述的电网设备名称匹配方法,其特征在于:依次两两计算各电网设备名称分词结果之间的相似度,相似度最高值对应的两个电网设备名称匹配。


6.根据权利要求1或5所述的电网设备名称匹配方法,其...

【专利技术属性】
技术研发人员:彭晖刘琪张杰孙云枫韩强赵京虎王刚季学纯郭凌旭杨启京范广民
申请(专利权)人:国电南瑞科技股份有限公司国电南瑞南京控制系统有限公司国家电网有限公司国网天津市电力公司南瑞集团有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1