风电故障信息的相似度确定方法和装置制造方法及图纸

技术编号:32028186 阅读:16 留言:0更新日期:2022-01-27 12:41
提供一种风电故障信息的相似度确定方法和装置,该相似度确定方法包括:获取关于风电故障的第一故障描述语句和第二故障描述语句;对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息;确定第一抽取信息与第二抽取信息的相似度匹配结果;基于第一抽取信息与第二抽取信息的相似度匹配结果,确定第一故障描述语句与第二故障描述语句的相似度匹配结果。采用本发明专利技术示例性实施例的风电故障信息的相似度确定方法和装置,有助于实现风电行业文本数据中信息融合的目的。中信息融合的目的。中信息融合的目的。

【技术实现步骤摘要】
风电故障信息的相似度确定方法和装置


[0001]本专利技术总体说来涉及风力发电
,更具体地讲,涉及一种风电故障信息的相似度确定方法和装置。

技术介绍

[0002]信息融合也称为知识融合,实质就是将相同或者相似的信息融合到一起,其主要的算法就是相似文本信息匹配。信息融合有助于从内容庞杂的海量电子文本数据中快速、准确地获取有价值的信息,信息融合可以将各种杂乱的数据进行规范处理,从而达到数据治理的目的。
[0003]在从风电行业的海量工单数据中,挖掘出专家知识库以及解决方案,信息融合是非常重要的步骤。

技术实现思路

[0004]本专利技术的示例性实施例的目的在于提供一种风电故障信息的相似度确定方法和装置,以克服上述至少一种缺陷。
[0005]在一个总体方面,提供一种风电故障信息的相似度确定方法,所述相似度确定方法包括:获取关于风电故障的第一故障描述语句和第二故障描述语句;对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息;确定第一抽取信息与第二抽取信息的相似度匹配结果;基于第一抽取信息与第二抽取信息的相似度匹配结果,确定第一故障描述语句与第二故障描述语句的相似度匹配结果。
[0006]可选地,对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息的步骤可包括:从第一故障描述语句中抽取第一实体名词,并将第一实体名词确定为第一抽取信息;从第二故障描述语句中抽取第二实体名词,并将第二实体名词确定为第二抽取信息。
[0007]可选地,对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息的步骤可包括:基于第一故障描述语句以及针对第一故障描述语句进行实体名词抽取处理获得的第一实体名词,获得第一抽取信息;基于第二故障描述语句以及针对第二故障描述语句进行实体名词抽取处理获得的第二实体名词,获得第二抽取信息。
[0008]可选地,第一实体名词可包括用于指示故障点的至少一个第一实体词和用于故障描述的至少一个第二实体词,第一抽取信息可包括第一故障点信息和第一故障描述信息,其中,获得第一抽取信息的步骤可包括:根据第一故障描述语句,基于所述至少一个第一实体词进行拼接获得第一故障点信息,基于所述至少一个第二实体词进行拼接获得第一故障描述信息。
[0009]可选地,第二实体名词可包括用于指示故障点的至少一个第三实体词和用于故障描述的至少一个第四实体词,第二抽取信息可包括第二故障点信息和第二故障描述信息,
其中,获得第二抽取信息的步骤可包括:根据第二故障描述语句,基于所述至少一个第三实体词进行拼接获得第二故障点信息,基于所述至少一个第四实体词进行拼接获得第二故障描述信息。
[0010]可选地,第一抽取信息可包括第一故障点信息和第一故障描述信息,第二抽取信息可包括第二故障点信息和第二故障描述信息,其中,确定第一抽取信息与第二抽取信息的相似度匹配结果的步骤可包括:确定第一故障点信息与第二故障点信息的第一相似度值,确定第一故障描述信息与第二故障描述信息的第二相似度值,基于第一相似度值和第二相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果。
[0011]可选地,基于第一相似度值和第二相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果的步骤可包括:将第一相似度值与第二相似度值的平均值,确定为第一抽取信息与第二抽取信息的相似度值;基于第一抽取信息与第二抽取信息的相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果。
[0012]可选地,确定第一故障点信息与第二故障点信息的第一相似度值的步骤可包括:基于BERT算法,计算第一故障点信息的第一向量,基于BERT算法,计算第二故障点信息的第二向量,计算第一向量与第二向量的相似度值,并将计算得到的相似度值确定为第一相似度值,和/或,确定第一故障描述信息与第二故障描述信息的第二相似度值的步骤可包括:基于BERT算法,计算第一故障描述信息的第三向量,基于BERT算法,计算第二故障描述信息的第四向量,计算第三向量与第四向量的相似度值,并将计算得到的相似度值确定为第二相似度值。
[0013]可选地,基于第一抽取信息与第二抽取信息的相似度匹配结果,确定第一故障描述语句与第二故障描述语句的相似度匹配结果的步骤可包括:确定第一抽取信息与第二抽取信息的相似度值是否满足分类条件;如果满足分类条件,则确定第一故障描述语句与第二故障描述语句为相似语句;如果不满足分类条件,则确定第一故障描述语句与第二故障描述语句为不同语句。
[0014]可选地,确定第一抽取信息与第二抽取信息的相似度值是否满足分类条件的步骤可包括:确定所述相似度值是否小于相似判断阈值,如果所述相似度值不小于相似判断阈值,则确定满足分类条件,如果所述相似度值小于相似判断阈值,则确定不满足分类条件,或者,确定第一抽取信息与第二抽取信息的相似度值是否满足分类条件的步骤可包括:计算所述相似度值与参考相似度值的差值,确定所述差值是否小于零,如果所述差值不小于零,则确定满足分类条件,如果所述差值小于零,则确定不满足分类条件。
[0015]可选地,所述参考相似度值可为第一故障描述语句与第二故障描述语句的相似度值,和/或,可通过以下方式确定所述参考相似度值:基于BERT算法,计算第一故障描述语句的第五向量,基于BERT算法,计算第二故障描述语句的第六向量,计算第五向量与第六向量的相似度值,并将计算得到的相似度值确定为所述参考相似度值。
[0016]可选地,所述相似度确定方法可还包括:基于第一故障描述语句与第二故障描述语句的相似度匹配结果,对第一故障描述语句和第二故障描述语句进行信息融合。
[0017]可选地,第一故障描述语句可通过文字输入或者语音输入方式来获得,第二故障描述语句可从语句数据库中获得,所述语句数据库中可存储有故障描述语句以及对应的故障原因分析,其中,所述相似度确定方法可还包括:如果第一故障描述语句与第二故障描述
语句为相似语句,则从所述语句数据库中获取与第二故障描述语句对应的故障原因分析,并进行显示。
[0018]在另一总体方面,提供一种风电故障信息的相似度确定装置,所述相似度确定装置包括:语句获取模块,获取关于风电故障的第一故障描述语句和第二故障描述语句;信息抽取模块,对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息;信息匹配模块,确定第一抽取信息与第二抽取信息的相似度匹配结果;语句匹配模块,基于第一抽取信息与第二抽取信息的相似度匹配结果,确定第一故障描述语句与第二故障描述语句的相似度匹配结果。
[0019]在另一总体方面,提供一种控制器,包括:处理器;存储器,用于存储计算机程序,所述计算机程序在被所述处理器执行时实现上述的风电故障信息的相似度确定方法。
[0020]在另一总体方面,提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序在被处理器执行时实现如上述的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风电故障信息的相似度确定方法,其特征在于,所述相似度确定方法包括:获取关于风电故障的第一故障描述语句和第二故障描述语句;对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息;确定第一抽取信息与第二抽取信息的相似度匹配结果;基于第一抽取信息与第二抽取信息的相似度匹配结果,确定第一故障描述语句与第二故障描述语句的相似度匹配结果。2.根据权利要求1所述的相似度确定方法,其特征在于,对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息的步骤包括:从第一故障描述语句中抽取第一实体名词,并将第一实体名词确定为第一抽取信息;从第二故障描述语句中抽取第二实体名词,并将第二实体名词确定为第二抽取信息。3.根据权利要求1或2所述的相似度确定方法,其特征在于,对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息的步骤包括:基于第一故障描述语句以及针对第一故障描述语句进行实体名词抽取处理获得的第一实体名词,获得第一抽取信息;基于第二故障描述语句以及针对第二故障描述语句进行实体名词抽取处理获得的第二实体名词,获得第二抽取信息。4.根据权利要求3所述的相似度确定方法,其特征在于,第一实体名词包括用于指示故障点的至少一个第一实体词和用于故障描述的至少一个第二实体词,第一抽取信息包括第一故障点信息和第一故障描述信息,其中,获得第一抽取信息的步骤包括:根据第一故障描述语句,基于所述至少一个第一实体词进行拼接获得第一故障点信息,基于所述至少一个第二实体词进行拼接获得第一故障描述信息。5.根据权利要求3所述的相似度确定方法,其特征在于,第二实体名词包括用于指示故障点的至少一个第三实体词和用于故障描述的至少一个第四实体词,第二抽取信息包括第二故障点信息和第二故障描述信息,其中,获得第二抽取信息的步骤包括:根据第二故障描述语句,基于所述至少一个第三实体词进行拼接获得第二故障点信息,基于所述至少一个第四实体词进行拼接获得第二故障描述信息。6.根据权利要求1所述的相似度确定方法,其特征在于,第一抽取信息包括第一故障点信息和第一故障描述信息,第二抽取信息包括第二故障点信息和第二故障描述信息,其中,确定第一抽取信息与第二抽取信息的相似度匹配结果的步骤包括:确定第一故障点信息与第二故障点信息的第一相似度值,确定第一故障描述信息与第二故障描述信息的第二相似度值,基于第一相似度值和第二相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果。7.根据权利要求6所述的相似度确定方法,其特征在于,基于第一相似度值和第二相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果的步骤包括:
将第一相似度值与第二相似度值的平均值,确定为第一抽取信息与第二抽取信息的相似度值;基于第一抽取信息与第二抽取信息的相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果。8.根据权利要求6所述的相似度确定方法,其特征在于,确定第一故障点信息与第二故障点信息的第一相似度值的步骤包括:基于BERT算法,计算第一故障点信息的第一向量,基于BERT算法,计算第二故障点信息的第二向量,计算第一向量与第二向量的相似度值,并将计算得到的相似度值确定为第一相似度值,和/或,确...

【专利技术属性】
技术研发人员:历莹宋建军田亨
申请(专利权)人:新疆金风科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1