【技术实现步骤摘要】
一种基于电机故障知识的众包采集系统及方法
[0001]本专利技术属于知识图谱
,具体是涉及一种基于电机故障知识的众包采集方法及系统。
技术介绍
[0002]随着科技的不断进步和发展,各领域用到的电动机自动化程度逐渐提高,电动机的内部结构也逐渐趋于复杂化,针对不同场景的发电机的种类越来越多。包括水力发电机,涡轮发电机等,同时会有很多不同的型号的发电机。针对上述各种电机的维护与诊断是当下的难题。同时,电机作为各种生产领域内重要的动力设备,具有价格低廉、整体结构相对简单,较为可靠等优点,承担了现代工业、农业生产过程中80%以上的动能输出。尤其是在冶金、采矿、机械加工、轨道交通等工业生产领域,装机量巨大,应用广泛。电机及其相关的动力设备是企业的重要资产,其在运行过程中可靠性和稳定性是保障机械设备长时间安全、稳定运行的关键。
[0003]目前,许多电机的维护只有相关领域的专家才能掌握其对应电机的知识。这些知识碎片化,没有相关规范和行业标准,不具有相关领域的认证,无法正常使用,甚至会对发电机的故障知识整理与诊断造成严重的干扰。并且客户无法自身电机出现的问题提问并得到响应,在最短的时间内解决问题,来保证电机的安全性和运行稳定,减少由于电机故障而造成的损失。
[0004]因此,如何通过电机故障知识的众包采集方法及系统,科学的、快速的及准确的解决电机中的故障是非常有意义的。
[0005]经过检索,申请公开号CN112000791A,一种电机故障知识抽取系统及方法,尤其涉及神经网络模型对电机故障判断的技术领 ...
【技术保护点】
【技术特征摘要】
1.一种基于电机故障知识的众包采集系统,其特征在于,包括:数据采集模块、模型训练模块及知识构建模块;其中,所述数据采集模块,用于通过人机交互收集专家关于电机故障知识的答案,并完成众包采集即通过多种途径收集数据的任务;所述模型训练模块:用于采用BIO标注:将每个元素标注为“B
‑
X”、“I
‑
X”或者“O”,其中,“B
‑
X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I
‑
X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型;标注法对采集的电机故障文章进行标注并采用BERT Transformer的双向编码器表征模型进行训练,进行命名实体识别操作,从文章中提取关键实体,并将这些实体进行匹配,构建电机故障知识图谱;所述知识构建模块:用于在系统知识训练之后,根据谓词和编辑距离进行匹配,谓词是一种简单的库,用于解析和评估;将故障描述、故障元件、故障原因、故障解决方式、原文进行匹配,存入附表当中展示给用户,用户对这些抽取后的知识进行修改、增加、删除,用户确认修改后,将确认后的信息添加到数据库当中,形成故障知识库,将多种相同的故障的描述进行本体对齐,采用加权平均的方式将多个故障描述信息进行融合。2.根据权利要求1所述的一种基于电机故障知识的众包采集系统,其特征在于,所述数据采集模块中,人机交互部分主要分为三大模块:小程序部分、故障调查问卷部分、论文知识抽取部分;小程序部分用于用户手动或语音输入电机故障描述信息,故障调查问卷部分用于在网站上传故障描述文件并存入服务器,论文知识抽取部分用于将预测的知识抽取出来,将结果交给数据存储层。3.根据权利要求2所述的一种基于电机故障知识的众包采集系统,其特征在于,所述数据采集模块中小程序部分采用的是微信开发者工具进行开发,利用js开发方式,可以方便专家或者用户利用语音进行输入,一段故障描述性语句输入后直接存储到数据库中;在管理员进行基础信息配置后,系统可以根据这些配置形成电机故障知识问卷;论文抽取部分通过django框架进行开发,通过上传文章采用BERT Transformer的双向编码器表征模型进行抽取之后,展示在网页界面之上,用户可以在网页上进行编辑,将最终结果存储到电机故障知识图谱中。4.根据权利要求1所述的一种基于电机故障知识的众包采集系统,其特征在于,所述模型训练模块中,采用BIO标注:将每个元素标注为“B
‑
X”、“I
‑
X”或者“O”。其中,“B
‑
X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I
‑
X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型,标注法对采集的电机故障文章进行标注并采用BERT模型进行训练,具体包括:利用YEDDA标注工具将故障元件标注为B
‑
ele,I
‑
ele;故障描述标记为B
‑
des,I
‑
des;故障解决方案标注为B
‑
solu,I
‑
solu,其他标注为O;将文章中的信息标注后,导入BERT模型。BERT语言模型训练中,每个词都会赋予一个向量值;在模型训练初始阶段,会利用one
‑
hot编码,随机为每个词赋一个初始值;这时模型会利用这个值进行矩阵计算,在维护三个矩阵的同时,三个矩阵也在进行点乘计算,计算结果与目标结果比对,两者的差距值作为损失,采用反向递归的方式逐步求导,并修改初始的赋值,最终得到每个词的词向量;矩阵计算公式如下所示:
MultiHead(Q,K,V)=Concat(head1,
…
,head
n
)w
o
其中,Q,K,V分别代表一个矩阵,每个字都在维护的三个矩阵。5.根据...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。