当前位置: 首页 > 专利查询>东华大学专利>正文

一种基于知识图谱的智能制造问答方法技术

技术编号:39395139 阅读:12 留言:0更新日期:2023-11-19 15:50
本发明专利技术涉及一种基于知识图谱的智能制造问答方法

【技术实现步骤摘要】
一种基于知识图谱的智能制造问答方法、装置及存储介质


[0001]本专利技术涉及知识图谱领域,尤其是涉及一种基于知识图谱的智能制造问答方法

装置及存储介质


技术介绍

[0002]知识图谱以
<
实体,关系,实体
>
的三元组形式保存信息,能够对现实世界的事物及其关系进行形式化的描述,提高了知识表达能力

基于知识图谱的问答系统利用自然语言处理技术,根据用户提出的问题自动检索,理解和整合相关信息,生成并返回准确

简介的答案

因此,基于知识图谱的问答系统在医疗

安全

制造业等领域被广泛使用

[0003]目前,大部分知识图谱问答系统是基于语义解析的方式,使用命名实体识别对用户问题中的实体和关系进行识别,然后与知识图谱中的实体进行链接,根据预定义的规则模板转化为形式化的逻辑表达式,例如
SPARQL、CQL
语句,最后直接从图数据库中进行检索;或者使用编码

解码技术对用户问题进行处理,获取特征向量,然后根据问题特征向量去知识图谱中获取候选答案子图,最后进行过滤剪枝得到问题答案

其主要缺陷在于:
[0004](1)
基于知识图谱的问答系统在各个领域被广泛使用,但是在智能制造领域没有公开的大型知识图谱和对应的问答数据集;
[0005](2)/>使用命名实体识别或编码的方式从用户问题中获取到的实体与知识图谱进行实体链接时会产生歧义,导致链接准确率低,因为自然语言中一个谓词可以有多种不同的表达形式;
[0006](3)
以上方法对于涉及多跳推理的问题的准确率较低;
[0007](4)
目前知识图谱问答算法对于问题答案的选取是固定的,但是实际问题的答案数量通常是不确定的


技术实现思路

[0008]本专利技术的目的是为了提供一种基于知识图谱的智能制造问答方法

装置及存储介质,通过为问题添加连续标识符的方法避免用户问题语义信息的歧义,将问答任务转化为头实体向量

问题向量和知识图谱中所有实体向量的相似度匹配,提高涉及多跳推理问题的准确率,同时,使用一阶差分的方式对答案数量进行灵活选择

[0009]本专利技术的目的可以通过以下技术方案来实现:
[0010]一种基于知识图谱的智能制造问答方法,包括以下步骤:
[0011]获取智能制造数据集,并利用实体抽取模块提取实体;
[0012]根据提取到的实体以及实体间的对应关系,构建智能制造知识图谱和问答数据集;
[0013]采用双线性词嵌入算法对知识图谱进行嵌入训练,构建知识图谱实体嵌入字典;
[0014]构建问答模型,所述问答模型将输入的问题和问题中的关键实体转化为嵌入向量表示,并与知识图谱实体嵌入字典中的向量进行评分计算,根据评分结果选择答案并输出;
[0015]以知识图谱实体嵌入字典和问答数据集中的问题作为模型输入,以问答数据集中的答案作为模型输出,对问答模型进行训练;
[0016]获取用户输入的问题;
[0017]利用实体抽取模块抽取问题中的关键实体;
[0018]将关键实体和问题输入问答模型,得到候选答案评分列表,根据答案评分选择答案并输出

[0019]所述构建智能制造知识图谱的具体方法为:将实体和关系一一对应,生成知识三元组并进行去重处理,根据去重后的三元组构建知识图谱

[0020]所述问答数据集的构建方法为:创建问题模板和对应的
CQL
语句,检索创建的知识图谱,将实体放入问题模板的空缺处,并根据模板对应
CQL
从知识图谱中查找答案,完成问答对的制作;重复上述步骤,直到知识图谱中所有的实体都被放入到对应的问题模板中,完成智能制造问答数据集的制作;其中,当出现实体放入问题模板后形成的问题在知识图谱中不存在答案的情况时,自动清除对应问题

[0021]所述采用双线性词嵌入算法对知识图谱进行嵌入训练,构建知识图谱实体嵌入字典具体为:采用双线性词嵌入算法将知识图谱中的所有实体转化为低维向量进行表示,构建知识图谱实体嵌入字典,所述字典为实体和对应低维向量的键值对列表

[0022]所述问答模型将输入的问题和问题中的关键实体转化为嵌入向量表示采用的模型为
Bi

LSTM
神经网络

[0023]所述问答模型进行评分计算采用的评分函数为:
[0024][0025]其中,
h
表示关键实体,
r
表示问题,
t
表示知识图谱中的实体,
e
表示嵌入向量,
<
·
,
·
>
表示向量点积,
Re(
·
)
表示取括号中计算结果的实数部分

[0026]所述根据评分结果选择答案的具体方法为:根据候选答案评分特征进行对应问题答案的选择,所述评分特征指根据评分列表的一阶差分结果特征,具体描述为:假设候选实体评分序列为
x1,x2,

,x
n
,则其一阶差分序列为
y1,y2,

,y
n
‑1,其中
y
i

x
i+1

x
i
,计算一阶差分序列的均值
μ
和标准差
σ
,并定义阈值
α
,确定异常点:
[0027]i
*

argmin
i

2,

,n
‑1(y
i

μ
<y
i
‑1‑
μ

ασ
)
[0028]其中,
i
*
表示异常点,
argmin
表示使括号内表达式取最小值;
[0029]选择异常点位置索引之前的候选答案作为对用户问题的回答答案

[0030]用户输入的问题在输入实体抽取模块前,事先为问题中的关键实体添加连续标识符,其中,所述连续标识符是指在问题中关键实体两侧添加的任意标识符

[0031]一种基于知识图谱的智能制造问答装置,包括存储器

处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法

[0032]一种存储介质,其上存储有程序,所述程本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于知识图谱的智能制造问答方法,其特征在于,包括以下步骤:获取智能制造数据集,并利用实体抽取模块提取实体;根据提取到的实体以及实体间的对应关系,构建智能制造知识图谱和问答数据集;采用双线性词嵌入算法对知识图谱进行嵌入训练,构建知识图谱实体嵌入字典;构建问答模型,所述问答模型将输入的问题和问题中的关键实体转化为嵌入向量表示,并与知识图谱实体嵌入字典中的向量进行评分计算,根据评分结果选择答案并输出;以知识图谱实体嵌入字典和问答数据集中的问题作为模型输入,以问答数据集中的答案作为模型输出,对问答模型进行训练;获取用户输入的问题;利用实体抽取模块抽取问题中的关键实体;将关键实体和问题输入问答模型,得到候选答案评分列表,根据答案评分选择答案并输出
。2.
根据权利要求1所述的一种基于知识图谱的智能制造问答方法,其特征在于,所述构建智能制造知识图谱的具体方法为:将实体和关系一一对应,生成知识三元组并进行去重处理,根据去重后的三元组构建知识图谱
。3.
根据权利要求1所述的一种基于知识图谱的智能制造问答方法,其特征在于,所述问答数据集的构建方法为:创建问题模板和对应的
CQL
语句,检索创建的知识图谱,将实体放入问题模板的空缺处,并根据模板对应
CQL
从知识图谱中查找答案,完成问答对的制作;重复上述步骤,直到知识图谱中所有的实体都被放入到对应的问题模板中,完成智能制造问答数据集的制作;其中,当出现实体放入问题模板后形成的问题在知识图谱中不存在答案的情况时,自动清除对应问题
。4.
根据权利要求1所述的一种基于知识图谱的智能制造问答方法,其特征在于,所述采用双线性词嵌入算法对知识图谱进行嵌入训练,构建知识图谱实体嵌入字典具体为:采用双线性词嵌入算法将知识图谱中的所有实体转化为低维向量进行表示,构建知识图谱实体嵌入字典,所述字典为实体和对应低维向量的键值对列表
。5.
根据权利要求1所述的一种基于知识图谱的智能制造问答方法,其特征在于,所述问答模型将输入的问题和问题中的关键实体转化为嵌入向量表示采用的模型为
Bi

LSTM
神经网络
。6.
根据权利要求1所述的一种基于知识图谱的智能制造问答方法,其特征在于,所述问答模型进行评分计算采用的评分函数为:其中,
h
表示关键实体,
r
表示问题,
t
表示知识图...

【专利技术属性】
技术研发人员:罗辛韩金玉许猛陶然史有群
申请(专利权)人:东华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1