【技术实现步骤摘要】
风电故障信息的相似度确定方法和装置
[0001]本专利技术总体说来涉及风力发电
,更具体地讲,涉及一种风电故障信息的相似度确定方法和装置。
技术介绍
[0002]信息融合也称为知识融合,实质就是将相同或者相似的信息融合到一起,其主要的算法就是相似文本信息匹配。信息融合有助于从内容庞杂的海量电子文本数据中快速、准确地获取有价值的信息,信息融合可以将各种杂乱的数据进行规范处理,从而达到数据治理的目的。
[0003]在从风电行业的海量工单数据中,挖掘出专家知识库以及解决方案,信息融合是非常重要的步骤。
技术实现思路
[0004]本专利技术的示例性实施例的目的在于提供一种风电故障信息的相似度确定方法和装置,以克服上述至少一种缺陷。
[0005]在一个总体方面,提供一种风电故障信息的相似度确定方法,所述相似度确定方法包括:获取关于风电故障的第一故障描述语句和第二故障描述语句;对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息;确定第一抽取信息与第二抽取信息的相似度匹配结果;基于第一抽取信息与第二抽取信息的相似度匹配结果,确定第一故障描述语句与第二故障描述语句的相似度匹配结果。
[0006]可选地,对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息的步骤可包括:从第一故障描述语句中抽取第一实体名词,并将第一实体名词确定为第一抽取信息;从第二故障描述语句中抽取第二实体名词,并将第二实体名词确定为第二抽取 ...
【技术保护点】
【技术特征摘要】
1.一种风电故障信息的相似度确定方法,其特征在于,所述相似度确定方法包括:获取关于风电故障的第一故障描述语句和第二故障描述语句;对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息;确定第一抽取信息与第二抽取信息的相似度匹配结果;基于第一抽取信息与第二抽取信息的相似度匹配结果,确定第一故障描述语句与第二故障描述语句的相似度匹配结果。2.根据权利要求1所述的相似度确定方法,其特征在于,对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息的步骤包括:从第一故障描述语句中抽取第一实体名词,并将第一实体名词确定为第一抽取信息;从第二故障描述语句中抽取第二实体名词,并将第二实体名词确定为第二抽取信息。3.根据权利要求1或2所述的相似度确定方法,其特征在于,对第一故障描述语句和第二故障描述语句分别进行实体名词抽取处理,获得第一抽取信息和第二抽取信息的步骤包括:基于第一故障描述语句以及针对第一故障描述语句进行实体名词抽取处理获得的第一实体名词,获得第一抽取信息;基于第二故障描述语句以及针对第二故障描述语句进行实体名词抽取处理获得的第二实体名词,获得第二抽取信息。4.根据权利要求3所述的相似度确定方法,其特征在于,第一实体名词包括用于指示故障点的至少一个第一实体词和用于故障描述的至少一个第二实体词,第一抽取信息包括第一故障点信息和第一故障描述信息,其中,获得第一抽取信息的步骤包括:根据第一故障描述语句,基于所述至少一个第一实体词进行拼接获得第一故障点信息,基于所述至少一个第二实体词进行拼接获得第一故障描述信息。5.根据权利要求3所述的相似度确定方法,其特征在于,第二实体名词包括用于指示故障点的至少一个第三实体词和用于故障描述的至少一个第四实体词,第二抽取信息包括第二故障点信息和第二故障描述信息,其中,获得第二抽取信息的步骤包括:根据第二故障描述语句,基于所述至少一个第三实体词进行拼接获得第二故障点信息,基于所述至少一个第四实体词进行拼接获得第二故障描述信息。6.根据权利要求1所述的相似度确定方法,其特征在于,第一抽取信息包括第一故障点信息和第一故障描述信息,第二抽取信息包括第二故障点信息和第二故障描述信息,其中,确定第一抽取信息与第二抽取信息的相似度匹配结果的步骤包括:确定第一故障点信息与第二故障点信息的第一相似度值,确定第一故障描述信息与第二故障描述信息的第二相似度值,基于第一相似度值和第二相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果。7.根据权利要求6所述的相似度确定方法,其特征在于,基于第一相似度值和第二相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果的步骤包括:
将第一相似度值与第二相似度值的平均值,确定为第一抽取信息与第二抽取信息的相似度值;基于第一抽取信息与第二抽取信息的相似度值,确定第一抽取信息与第二抽取信息的相似度匹配结果。8.根据权利要求6所述的相似度确定方法,其特征在于,确定第一故障点信息与第二故障点信息的第一相似度值的步骤包括:基于BERT算法,计算第一故障点信息的第一向量,基于BERT算法,计算第二故障点信息的第二向量,计算第一向量与第二向量的相似度值,并将计算得到的相似度值确定为第一相似度值,和/或,确...
【专利技术属性】
技术研发人员:历莹,宋建军,田亨,
申请(专利权)人:新疆金风科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。