基于非结构化文本数据的OPCUA信息模型构建方法技术

技术编号：38077358 阅读：22 留言：0更新日期：2023-07-06 08:45

本发明专利技术公开了一种基于非结构化文本数据的OPC UA信息模型构建方法，主要解决现有OPC UA信息模型建模往往依赖于结构化数据并且缺乏来自文本数据的描述信息等问题，实现步骤包括：设计基于语料文本特征的、符合工业现场建模需求的标注标签，并设计标签的组织关系；为提取的样本文本素材进行BIO序列化标注，得到训练样本；构造基于BERT模型的中文预训练模型提取词向量；基于CRF技术，处理、分类并标注词向量；利用训练完成的模型提取文本中有效实体，并按预先定义的组织规则进行模型组织。本发明专利技术构建了工业非结构化文本样本数据，设计了利用文本语料的实体标签提取方法并用于信息模型构建，拓宽了信息模型构建方法的应用场景，操作方法简单明了，有实用价值。有实用价值。有实用价值。

全部详细技术资料下载

【技术实现步骤摘要】
基于非结构化文本数据的OPC UA信息模型构建方法

[0001]本专利技术属于工业自动化
，尤其涉及OPC UA信息模型的构建方法，具体是一种基于非结构化文本数据的OPC UA信息模型构建方法，可用于工业现场环境智能化模型抽象构造，实现工业智能化。

技术介绍

[0002][0003]生产线设备的数字化转型变得越来越有必要。OPC是一项应用于自动化行业及其他行业的数据安全交换可互操作性标准，由行业供应商、终端用户和软件开发者共同制定。这些规范定义了客户端与服务器之间以及服务器与服务器之间的接口，比如访问实时数据、监控报警和事件、访问历史数据和其他应用程序等。OPC标准于1996年首次发布，其目的是把可编程逻辑控制器(programmable logic controller，PLC)特定的协议(如Modbus，Profibus等)抽象成为标准化的接口，作为“中间人”的角色把通用的OPC“读写”请求转换成具体的设备协议来与HMI/SCADA系统直接对接，反之亦然。就此出现了一个完整的产品行业，终端用户可以借助其来最优化产品，通过OPC协议来实现系统的无缝交互。当前，OPC统一架构(OPC UA)信息模型已被用作在各个工业领域构建物理设备数字图像的有效方法，从而可以实现通过虚拟副本进行传感和控制。
[0004]由于OPC UA信息模型是面向对象的，因此构建信息模型的常用方法是由经验丰富的工程师自己手动定义节点。因为他们对整个产品线的了解，只要在生产线上的设备属性就知道了。此外，使用模型构建工具也是一种选择。也...

【技术保护点】

【技术特征摘要】
1.一种基于非结构化文本数据的OPC UA信息模型构建方法，其特征在于，包含以下步骤：(1)设计基于语料文本特征的、符合工业现场建模需求的标注标签，并设计标签的组织关系，即使用不同层级的描述标签，最高级为模型描述对象，其下为对象的属性以及属性值；(2)为设备描述说明文档中提取得到的样本文本素材基于不同层级的描述标签进行BIO序列化标注，得到训练样本；(3)构造基于BERT模型的中文预训练模型对步骤(2)标注后的样本文本进行词向量提取；(4)基于CRF技术，处理、分类并标注步骤(3)提取的词向量；(5)利用步骤(2)得到的训练样本对BERT和CRF结合的文本处理模型进行训练；(6)利用训练完成的文本处理模型提取文本中有效的实体，并按预先定义的组织规则进行模型组织，即使用文本处理模型提取标签中的实体文本，并按照预先定义的标签关系进行实体组织，针对相关的实体标签，最终构建面向对象的OPC UA信息模型。2.根据权利要求1所述的基于非结构化文本数据的OPC UA信息模型构建方法，其特征在于，步骤(1)中，面向对象的OPC UA的信息模型节点被抽象为实体的标签，并按照信息模型节点原有的组织结构进行实体标签关系的定义，后续即可按照预定义的关系进行模型构建。3.根据权利要求1所述的基于非结构化文本数据的OPC UA信息模型构建方法，其特征在于，步骤(1)中，对于OPC UA的信息模型，设计包含对象、对象属性特性以及属性值这三个层次的标签，具体地，包括模型描述对象OBJ、组件COM、属性ATT和属性值VAL这四类标签。4.根据权利要求1所述的基于非结构化文本数据的OPC UA信息模型构建方法，其特征在于，步骤(2)中描述的BIO标注样本数据对于工业领域数据的标注，具体如下：
①
使用符合工业领域建模要求的标签对工业领域非结构化文本数据进行BIO标注；
②
标注本身考虑到了信息模型的标签组织关系，定义了符合OPC UA信息模型结构要求的标签关系，模型标签按照对象、属性特征和相关属性值这三层设计，能够直接对应于OPC UA信息模型的对象、节点和变量。5.根据权利要求3所述的基于非结构化文本数据的OPC UA信息模型构建方法，其特征在于，步骤(2)中，文本素材采用设计的模型描述对象OBJ、组件COM、属性ATT和属性值VAL这四类标签对其一一标注，非目标信息的冗余字词被划分为O标签，目标信息的首字被标注为B，后续的字被标注为I。6.根据权利要求5所述的基于非结构化文本数据的OPC UA信息模型构建方法，其特征在于，步骤(2)中，标注完成后进一步对原文本进行增强：通过回译含有目标信息文本的方法将标注标签文本进行翻译，根据O标签的分布情况，将回译文本插入原文本中合适的位置，插入方法如下：通过计算某一段落中O标签出现的频率，如果频率值超过设定的阈值，则将待插入的回译文本插入当前段落位置；所有段落遍历完成后，如果仍有回译文本剩余，则将剩余部...

【专利技术属性】
技术研发人员：刘洋，史治国，贺诗波，顾超杰，陈彩莲，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人