System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及化工,尤其涉及一种融合深度学习和知识图谱的化工知识库构建方法。
技术介绍
1、在现有的化工行业中,没有专门针对化工实际工艺生产中用到的专业知识图谱设计的结构,因此在实际根据工艺设计解决流程解决方案的时候需要查阅大量书籍与相关规定而耗费大量的时间。
2、另外,现有的方案仅包括将化工的各类常见问题通过实体抽取关系抽取、属性抽取等技术将对应知识杂乱地放入知识图谱,不具备垂直领域的专业性,因此错误率高。
3、因此,本专利技术亟需一种融合深度学习和知识图谱的化工知识库构建方法。
技术实现思路
1、(一)要解决的技术问题
2、鉴于现有技术的上述缺点、不足,本专利技术提供一种融合深度学习和知识图谱的化工知识库构建方法,其解决了现有技术中设计解决方案时查阅数据复杂问题,并解决了维护工艺设备知识图谱,耗时长,成本高的问题。
3、(二)技术方案
4、为了达到上述目的,本专利技术采用的主要技术方案包括:
5、本专利技术实施例提供一种融合深度学习和知识图谱的化工知识库构建方法,包括:
6、s100、获取待输入的化工类自然语言语句;对所述化工类自然语言语句进行预处理,获取预处理后的化工类自然语言向量;
7、s200、根据提前构建的知识图谱,获取所述预处理后的化工类自然语言向量对应的第一子图;
8、s300、将所述预处理后的化工类自然语言向量以及预处理后的化工类自然语言向量对应的第一子图输
9、s400、将所述待输入的化工类自然语言语句以及对应的最终的子图三元组保存在预先构建的化工知识库中,获取化工知识库。
10、所述子图获取模型包括:嵌入矩阵获取子模型、子图获取子模型。
11、可选地,所述s100之前还包括:
12、s000、使用训练数据集对所述子图获取模型进行训练,得到训练后的子图获取模型;
13、所述训练数据集是将化工数据集进行预处理得到的;
14、所述化工数据集包括:各种化工类自然语言语句以及每一化工类自然语言语句对应的子图三元组;
15、其中,化工数据集中每一化工类自然语言语句对应的子图三元组通过查阅大量书籍以及相关规定获取。
16、可选地,所述s000具体包括:
17、采用交叉熵损失函数与adam优化器,学习率设定为0.001,每次训练批量大小为200,进行100次重复,获取训练后的子图获取模型。
18、可选地,所述s100中,对所述化工类自然语言语句进行预处理,获取预处理后的化工类自然语言向量包括:
19、s110、将所述化工类自然语言语句进行文本清洗与标准化,清除无关字符,统一文本格式,去除多余的空格和换行,获取第一自然语言;
20、s120、将所述第一自然语言进行分词与词汇归一化,将第一自然语言分割为单词,去除停用词,通过词干提取或词形还原将词汇形式标准化,获取第二自然语言;
21、s130、对所述第二自然语言进行向量化处理,获取预处理后的化工类自然语言向量。
22、可选地,所述s300具体包括:
23、s310、将所述预处理后的化工类自然语言向量以及预处理后的化工类自然语言向量对应的第一子图输入嵌入矩阵获取子模型中,获取对应的嵌入矩阵;
24、s320、将所述嵌入矩阵输入子图获取子模型中,获取最终的子图三元组;
25、所述子图获取子模型包括:混合图注意力层、第一前馈网络层、残差连接层、层归一化层、第二前馈网络层以及softmax层。
26、可选地,所述s310具体包括:
27、s311、根据词嵌入方法,将所述预处理后的化工类自然语言向量转化为嵌入向量,并利用注意力机制获取所述嵌入向量的文字注意力矩阵;
28、s312、获取第一子图的实体特征向量和邻接矩阵,根据所述文字注意力矩阵、实体特征向量以及邻接矩阵,获取对应的嵌入矩阵。
29、可选地,所述s312包括:
30、将所述实体特征向量以及邻接矩阵输入下述公式,获取对应的嵌入矩阵:
31、
32、其中,fr为嵌入矩阵,er为邻接矩阵,qa为实体特征向量的查询矩阵,为实体特征向量的键矩阵,vc为实体特征向量的值矩阵,d为缩放因子,softmax为软最大函数。
33、可选地,所述s320包括:
34、s321、将所述嵌入矩阵输入混合图注意力层,对嵌入矩阵进行加权融合,获取第一特征;
35、s322、将混合图注意力模块输出的第一特征输入第一前馈网络层,进行线性变换以及线性激活,获取第二特征;
36、s333、将所述第二特征输入残差连接层以及层归一化层,进行残差处理和标准化处理,获取初步输出值。
37、可选地,所述s320还包括:
38、s334、将所述初步输出值输入第二前馈网络层,进行特征增强,获取中间输出值;
39、s335、将所述中间输出值输入softmax层,获取每个中间输出值对应的概率分布,获取概率最大的中间输出值作为最终的子图三元组。
40、可选地,所述方法还包括:
41、s500、根据最新的化工行业标准以及研究成果,定期对所述化工知识库中的化工类自然语言语句以及对应的子图三元组进行校验更新,将不匹配的内容进行修正或替换。
42、(三)有益效果
43、本专利技术的有益效果是:本专利技术的一种融合深度学习和知识图谱的化工知识库构建方法,由于将深度学习和知识图谱进行融合,相对于现有技术而言,其能够新增化工工艺流程之间的联动性,起到了及时提供解决防范装置潜在选项的功能;另外,本专利技术实现自然语言与图谱的端到端信息交互。
本文档来自技高网...【技术保护点】
1.一种融合深度学习和知识图谱的化工知识库构建方法,其特征在于,包括:
2.根据权利要求1所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述S100之前还包括:
3.根据权利要求2所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述S000具体包括:
4.根据权利要求1所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述S100中,对所述化工类自然语言语句进行预处理,获取预处理后的化工类自然语言向量包括:
5.根据权利要求1所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述S300具体包括:
6.根据权利要求5所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述S310具体包括:
7.根据权利要求6所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述S312包括:
8.根据权利要求5所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述S320包括:
9.根据权利要求8所述的融合深度学习
10.根据权利要求1所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述方法还包括:
...【技术特征摘要】
1.一种融合深度学习和知识图谱的化工知识库构建方法,其特征在于,包括:
2.根据权利要求1所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述s100之前还包括:
3.根据权利要求2所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述s000具体包括:
4.根据权利要求1所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述s100中,对所述化工类自然语言语句进行预处理,获取预处理后的化工类自然语言向量包括:
5.根据权利要求1所述的融合深度学习和知识图谱的化工知识库构建方法,其特征在于,所述...
【专利技术属性】
技术研发人员:卓家雨,尹鹏衡,毛俊杰,叶良,王佳楠,
申请(专利权)人:中控技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。