一种产品模型描述对比方法及系统技术方案

技术编号:27477988 阅读:15 留言:0更新日期:2021-03-02 17:47
本发明专利技术公开了一种产品模型描述对比方法及系统。该方法包括:将对第一产品模型描述文本和第二产品模型描述文本进行处理得到的待对比词向量分别输入相关信息分类器和差异信息分类器中,得到第一产品模型描述文本和第二产品模型描述文本之间的关联信息和差异信息;将拼接后的待对比整体信息输入训练好的相似度计算器中,得到两个产品模型描述文本和的语义相似度;相关信息分类器、差异信息分类器和训练好的相似度计算器是采用训练样本数据对第一生成器、第二生成器和判别器进行对抗训练,同时采用训练样本数据对第一生成器、第二生成器和相似度计算器进行训练得到的。本发明专利技术能提高对比效率和对比准确度,从而更好地实现产品信息的交换与共享。产品信息的交换与共享。产品信息的交换与共享。

【技术实现步骤摘要】
一种产品模型描述对比方法及系统


[0001]本专利技术涉及产品信息交换领域,特别是涉及一种产品模型描述对比方法及系统。

技术介绍

[0002]产品数据模型交换标准(Standard for the Exchange of Product Model Data,STEP)是一套关于产品整个生命周期中产品数据的表达与交换的国际标准,目的是提供一种不依赖于具体系统的中性机制,能够描述整个生命周期中的产品数据,同时保持数据的一致性和完整性。随着互联网技术的不断发展,全球协同合作已经成为工业设计和制造的必然趋势,产品信息的交换与共享已由数据共享上升为知识和语义共享,传统的产品信息表达方式和处理模式已无法适应现代企业的需求。
[0003]本体是面向计算机形式化的一种知识表达与描述框架,拥有形式化语言和开发工具,具有强大的知识表达、赋值机制与语义推理能力。不仅可以描述信息资源体系十分复杂的概念、属性和关系,形成语义知识网络,还能实现具有语义推理功能的知识检索。因此它可以统一专业领域内各个专业内部的信息术语,实现各专业间知识的共享、重用和互操作,解决各系统之间专业知识使用不一致的情况和应用集成难的问题,因此使用本体可以实现产品数据的语义层次的共享与交换。
[0004]然而,由于STEP已经被广泛应用于机械、电子、航空航天、汽车、船舶等各个工程领域,并且许多计算机辅助设计(Computer Aided Design,CAD)/计算机辅助制造(Computer Aided Manufacturing,CAM)软件系统均已把STEP列为数据交换接口,因此无法直接弃用STEP并直接使用本体来进行产品数据的表达与交换,于是研究人员提出了将STEP产品数据转换为本体从而来实现产品数据的语义层次的共享与交换的想法。
[0005]EXPRESS是STEP的标准描述语言,网络本体语言(Web Ontology Language,OWL)为由万维网联盟(World Wide Web Consortium,W3C)提出的本体描述语言。要实现将STEP产品数据转换为本体,首先得找寻EXPRESS语言到OWL语言的映射关系。传统的映射关系找寻依赖于人工方式来对比产品模型描述,从而来判断其语法是否具有对应关系,但由于EXPRESS和OWL的官方文档描述结构复杂且内容繁多,以人工的方式来对比存在着耗时久、易遗漏且易出错的问题。

技术实现思路

[0006]基于此,有必要提供一种产品模型描述对比方法及系统,以解决现有的产品模型描述对比依赖于非自动化的人工判断从而导致效率低且准确度低的问题,从而提高对比效率和对比准确度,更好地实现产品信息的交换与共享。
[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]一种产品模型描述对比方法,包括:
[0009]获取第一产品模型描述文本和第二产品模型描述文本;
[0010]对所述第一产品模型描述文本和所述第二产品模型描述文本进行处理,得到待对
比词向量;
[0011]将所述待对比词向量分别输入相关信息分类器和差异信息分类器中,得到所述第一产品模型描述文本和所述第二产品模型描述文本之间的关联信息和差异信息;
[0012]将所述第一产品模型描述文本和所述第二产品模型描述文本之间的关联信息和差异信息进行拼接得到待对比整体信息;
[0013]将所述待对比整体信息输入训练好的相似度计算器中,得到所述第一产品模型描述文本和所述第二产品模型描述文本的语义相似度;
[0014]其中,所述相关信息分类器、所述差异信息分类器和所述训练好的相似度计算器是采用训练样本数据分别作为第一生成器和第二生成器的输入,以所述第一生成器输出的关联信息和所述第二生成器输出的差异信息作为判别器的输入进行对抗训练,同时以所述第一生成器输出的关联信息和所述第二生成器输出的差异信息作为相似度计算器的输入进行训练得到的。
[0015]可选的,所述相关信息分类器和所述差异信息分类器的确定方法,具体包括:
[0016]获取训练样本数据;所述训练样本数据包括语义相近的第一训练描述文本和第二训练描述文本;
[0017]对所述第一训练描述文本和所述第二训练描述文本依次进行处理得到第一训练词向量,对所述第二训练描述文本和所述第一训练描述文本依次进行处理得到第二训练词向量;
[0018]构建第一生成器、第二生成器和判别器;所述第一生成器和所述第二生成器的输出端均与所述判别器连接;所述第一生成器和所述第二生成器的输出端均与所述相似度计算器连接;
[0019]将所述第一训练词向量和所述第二训练词向量分别输入所述第一生成器,将所述第一训练词向量和所述第二训练词向量分别输入所述第二生成器,将所述第一生成器输出的第一关联信息、所述第一生成器输出的第二关联信息、所述第二生成器输出的第一差异信息、所述第二生成器输出的第二差异信息排列组合后得到多组样本及各组对应的类标签,并将多组所述样本及对应的类标签输入所述判别器进行对抗训练,得到训练好的第一生成器和训练好的第二生成器;
[0020]将所述训练好的第一生成器确定为相关信息分类器,将训练好的第二生成器确定为差异信息分类器。
[0021]可选的,所述训练好的相似度计算器的确定方法,具体包括:
[0022]构建相似度计算器;
[0023]将所述第一训练词向量或所述第二训练词向量分别作为所述第一生成器和所述第二生成器的输入,并将所述第一生成器输出的关联信息和所述第二生成器输出的差异信息进行拼接得到训练整体信息;
[0024]将所述训练整体信息及对应的语义相似度标签输入所述相似度计算器进行训练,得到训练好的相似度计算器。
[0025]可选的,所述第一生成器和所述第二生成器均由多层Transformer神经网络的编码器堆叠而成;所述判别器由多层卷积神经网络与一层全连接层依次堆叠而成;所述相似度计算器是由多层双向长短时记忆网络和一层全连接层依次堆叠而成。
[0026]可选的,所述对所述第一产品模型描述文本和所述第二产品模型描述文本进行处理,得到待对比词向量,具体包括:
[0027]对所述第一产品模型描述文本和所述第二产品模型描述文本进行分词处理;
[0028]采用Word2Vec算法对分词后的第一产品模型描述文本和分词后的第二产品模型描述文本依次进行转换,得到待对比词向量。
[0029]本专利技术还提供了一种产品模型描述对比系统,包括:
[0030]对比文本获取模块,用于获取第一产品模型描述文本和第二产品模型描述文本;
[0031]对比词向量确定模块,用于对所述第一产品模型描述文本和所述第二产品模型描述文本进行处理,得到待对比词向量;
[0032]信息分类模块,用于将所述待对比词向量分别输入相关信息分类器和差异信息分类器中,得到所述第一产品模型描述文本和所述第二产品模型描述文本之间的关联信息和差异信息;
[0033]拼接模块,用于将所述第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种产品模型描述对比方法,其特征在于,包括:获取第一产品模型描述文本和第二产品模型描述文本;对所述第一产品模型描述文本和所述第二产品模型描述文本进行处理,得到待对比词向量;将所述待对比词向量分别输入相关信息分类器和差异信息分类器中,得到所述第一产品模型描述文本和所述第二产品模型描述文本之间的关联信息和差异信息;将所述第一产品模型描述文本和所述第二产品模型描述文本之间的关联信息和差异信息进行拼接得到待对比整体信息;将所述待对比整体信息输入训练好的相似度计算器中,得到所述第一产品模型描述文本和所述第二产品模型描述文本的语义相似度;其中,所述相关信息分类器、所述差异信息分类器和所述训练好的相似度计算器是采用训练样本数据分别作为第一生成器和第二生成器的输入,以所述第一生成器输出的关联信息和所述第二生成器输出的差异信息作为判别器的输入进行对抗训练,同时以所述第一生成器输出的关联信息和所述第二生成器输出的差异信息作为相似度计算器的输入进行训练得到的。2.根据权利要求1所述的一种产品模型描述对比方法,其特征在于,所述相关信息分类器和所述差异信息分类器的确定方法,具体包括:获取训练样本数据;所述训练样本数据包括语义相近的第一训练描述文本和第二训练描述文本;对所述第一训练描述文本和所述第二训练描述文本依次进行处理得到第一训练词向量,对所述第二训练描述文本和所述第一训练描述文本依次进行处理得到第二训练词向量;构建第一生成器、第二生成器和判别器;所述第一生成器和所述第二生成器的输出端均与所述判别器连接;所述第一生成器和所述第二生成器的输出端均与所述相似度计算器连接;将所述第一训练词向量和所述第二训练词向量分别输入所述第一生成器,将所述第一训练词向量和所述第二训练词向量分别输入所述第二生成器,将所述第一生成器输出的第一关联信息、所述第一生成器输出的第二关联信息、所述第二生成器输出的第一差异信息、所述第二生成器输出的第二差异信息排列组合后得到多组样本及各组对应的类标签,并将多组所述样本及对应的类标签输入所述判别器进行对抗训练,得到训练好的第一生成器和训练好的第二生成器;将所述训练好的第一生成器确定为相关信息分类器,将训练好的第二生成器确定为差异信息分类器。3.根据权利要求2所述的一种产品模型描述对比方法,其特征在于,所述训练好的相似度计算器的确定方法,具体包括:构建相似度计算器;将所述第一训练词向量或所述第二训练词向量分别作为所述第一生成器和所述第二生成器的输入,并将所述第一生成器输出的关联信息和所述第二生成器输出的差异信息进行拼接得到训练整体信息;
将所述训练整体信息及对应的语义相似度标签输入所述相似度计算器进行训练,得到训练好的相似度计算器。4.根据权利要求3所述的一种产品模型描述对比方法,其特征在于,所述第一生成器和所述第二生成器均由多层Transformer神经网络的编码器堆叠而成;所述判别器由多层卷积神经网络与一层全连接层依次堆叠而成;所述相似度计算器是由多层双向长短时记忆网络和一层全连接层依次堆叠而成。5.根据权利要求1所述的一种产品模型描述对比方法,其特征在于,所述对所述第一产品模型描述文本和所述第二产品模型描述文本进行处理,得到待对比词向量,具体包括:对所述第一产品模型描述文本和所述第二产品模型描述文本进行分词处理;采用Word2Vec算法对分词后的第一产品模型描述文本和分词后的第二产品模型描述文本依次进行转换,得到待对比词向量。6.一种产品模型描述对比系统,其特征在于,包括:对比文本获取模块,用于获取第一产品模型描述文本和第二产品模型描述文本;对比词向量确定模块,用于对所述第一产品模型描述文本和所述第二产品模型描述文本进行处理...

【专利技术属性】
技术研发人员:刘妍简青泉郭兴乐林泽
申请(专利权)人:长春理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1