当前位置: 首页 > 专利查询>四川大学专利>正文

一种空管领域知识图谱的智能问答系统构建方法技术方案

技术编号:30641310 阅读:12 留言:0更新日期:2021-11-04 00:38
本发明专利技术公开了一种空管领域知识图谱的智能问答系统构建方法,第一步,实体识别,用于识别自然语言问句中出现的实体名。第二步,实体链接,通过判断问句中与知识图谱中两个实体语义相似度,建立问句中实体到知识图谱中实体的链接关系。第三步:采用编码器

【技术实现步骤摘要】
一种空管领域知识图谱的智能问答系统构建方法


[0001]本专利技术具体涉及一种空管领域知识图谱的智能问答系统构建方法。

技术介绍

[0002]谷歌公司在2012年提出知识图谱这个概念,用于增强其搜索引擎的功能。传统的搜索引擎根据用户输入的字符进行筛选和排序网页,由于其方式缺乏语义关系,在目前互联网知识爆炸性增长的情况下,越来越不能满足用户的需求,知识图谱的出现为解决这一难题提供了可行的方案。知识图谱本质上是一种由具有属性的实体通过关系链接而成的语义网络。根据面向的领域,知识图谱被分为通用知识图谱与领域知识图谱,通用知识图谱包含大量常识,覆盖面极广。领域知识图谱基于行业数据构建,通常有着严格而丰富的数据模式,对该领域知识的深度、准确性有着更高的要求。
[0003]问答系统是信息检索的一种高级形式,其简答、准确的互动方式使得问答系统成为人工智能应用领域的研究热点。问答系统通过自然语言对话的形式帮助人们从知识库中获取知识,是知识图谱的核心应用之一。与传统的搜索引擎不同,问答系统通过对用户输入的自然语言进行处理,从知识图谱中查找出用户问题的准确回答。
[0004]目前,随着国民经济的快速发展,空中交通管理领域的信息数据持续快速增长,空管信息使用方式趋于复杂,在这中情况下,传统的空管信息检索方式往往不能满足用户要求。因此,建立基于知识图谱的空管领域问答系统,能有效提高空管信息的使用效率,对推动空管信息智能化处理具有重要意义。
[0005]本专利提出了一种空管领域知识图谱的智能问答系统构建方法,来为空管领域的知识检索与查询建立起专业且高效的问答系统。输入是自然语言式的问句,输出是空管领域知识实体数据。

技术实现思路

[0006]本部分的目的在于概述本专利技术的实施例的一些方面及简要介绍一些较佳实施例。在本部分及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明数摘要和专利技术名称的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0007]鉴于上述和/或现有技术中存在的问题,提出了本专利技术。
[0008]因此,本专利技术其中一个目的是提供一种空管领域知识图谱的智能问答系统构建方法。
[0009]一种空管领域知识图谱的智能问答系统构建方法,包括:
[0010]步骤1:实体识别,识别出自然语言问句中出现的实体名;
[0011]步骤2:实体链接,通过判断问句中与知识图谱中实体语义相似度,建立问句中实体到知识图谱中实体ID的链接关系,同时找出知识图谱中该实体的ID与类型;
[0012]步骤3:关系预测,采用编码器

解码器Encoder

Decoder模型预测问句中实体与答案实体之间的关系,并利用步骤2中实体类型的额外信息进一步提高模型的关系预测精度;
[0013]步骤4:重排名,利用步骤3预测出的具体关系,进一步修正实体链接结果;
[0014]步骤5:答案检索,利用步骤2得到的实体ID与步骤3预测出的关系在空管知识图谱中检索出对应的答案实体。
[0015]进一步的,步骤1实体识别,方法包括构建空管领域实体数据集、建立实体识别数据集(包含:训练集、验证集与测试集)。
[0016]进一步的,抽取出空管领域知识图谱中所有实体,整理形成空管领域实体数据集。
[0017]进一步的,根据已有的实体数据集,然后采用BIO序列标注方法对自然语言问句进行标注,最后建立起实体识别数据集。
[0018]进一步的,采用双向长短期记忆网络+条件随机场BiLSTM+CRF深度学习模型识别问句中出现的实体。
[0019]进一步的,步骤2采用莱文斯坦距离Levenshtein Distance衡量问句中与知识图谱中的实体字符串相似度,其中定义一个相似度阈值(如:0.7),大于或等于阈值则建立链接反之则不建立。
[0020]进一步的,步骤2根据链接到知识图谱的实体,查询出该实体在知识图谱中具体实体 ID与实体类型。
[0021]进一步的,步骤3采用2层自注意力机制模块堆叠形成Encoder模块,采用3层自注意力机制模块堆叠形成Decoder模块。
[0022]进一步的,步骤3将实体类型作为辅助特征信息送入到Decoder模块,进一步提高模型预测精度。
[0023]进一步的,步骤4采用最终得分进行实体链接重排名,排名公式如下,其中sim表示问句中与知识图谱中的实体字符串相似度,e表示链接实体周围的关系集合是否包含步骤3 中预测出的关系,包含则为1反之为0,α和β为权重参数。Score=α*sim+β*e
[0024]进一步的,步骤5采用SPARQL查询语言,将实体ID和步骤3中预测关系整合为 SPARQL语句,随后在空管知识图谱中检索出答案实体。
[0025]一种空管领域知识图谱的自动化构建系统,包括:
[0026]实体识别模块:用于识别出自然语言问句中出现的实体名;
[0027]实体链接模块:用于建立问句中实体到知识图谱中实体的链接关系,同时找出知识图谱中该实体ID与类型。
[0028]关系预测模块:采用Encoder

Decoder模型预测问句中实体与答案实体之间的关系;
[0029]重排名模块:利用步骤3预测出的具体关系,进一步修正实体链接结果;
[0030]答案检索模块:根据步骤2得到的实体ID与步骤3预测出的关系在空管知识图谱中检索出对应的答案实体。
[0031]本专利技术搭建的空管领域知识图谱的智能问答系统,能够加速知识数据在人与机器之间的交互速度,文本式的自然语言问句通过深度学习手段让机器理解人类的语言,使得人们在获取空管领域知识图谱中的相应的知识时更加高效与便捷,同时该问答系统知识检索的方式同样适用于空管机器人(如:智能管制员)获取知识的方式,专业的知识图谱以及智能高效的知识获取为智能管制员的构建奠定基础。
附图说明
[0032]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0033]图1为本专利技术的一种空管领域知识图谱的智能问答系统构建方法流程图;
[0034]图2为本专利技术的实体识别模块的深度学习模型架构图;
[0035]图3为本专利技术的关系预测模块的深度学习模型架构图。
具体实施方式
[0036]为了对本专利技术的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本专利技术的具体实施方式。
[0037]一种空管领域知识图谱的智能问答系统构建方法,如图1所示,实现该方法的具体步骤如下:
[0038]步骤1.实体识别,识别出自然语言问句中出现的实体名;
[0039]步骤2.实体链接,通过判断问句中与知识图谱中实体语义相似度,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种空管领域知识图谱的智能问答系统构建方法,其特征在于,包括:步骤1:实体识别,识别出自然语言问句中出现的实体名;步骤2:实体链接,通过判断问句中与知识图谱中实体语义相似度,建立问句中实体到知识图谱中实体ID的链接关系,同时找出知识图谱中该实体的ID与类型;步骤3:关系预测,采用编码器

解码器Encoder

Decoder模型预测问句中实体与答案实体之间的关系,并利用步骤2中实体类型的额外信息进一步提高模型关系预测精度;步骤4:重排名,利用步骤3预测出的具体关系,进一步修正实体链接结果;步骤5:答案检索,利用步骤2得到的实体ID与步骤3预测出的关系在空管知识图谱中检索出对应的答案实体。2.根据权利要求1所述的一种空管领域知识图谱的智能问答系统构建方法,其特征在于,步骤1实体识别,所述方法包括构建空管领域实体数据集、建立实体识别数据集(包含:训练集、验证集与测试集)。3.根据权利要求1所述的一种空管领域知识图谱的智能问答系统构建方法,其特征在于,步骤1中利用双向长短期记忆网络+条件随机场BiLSTM+CRF模型进行命名实体识别。4.根据权利要求1所述的一种空管领域知识图谱的智能问答系统构建方法,其特征在于,步骤2中采用莱文斯坦距离Levenshtein Distance衡量问句中与知识图谱中的实体字符串相似度,其中定义一个相似度阈值(如:0.7),大于或等于阈值则建立链接反之则不建立。5.根据权利...

【专利技术属性】
技术研发人员:韩云祥张建伟张森
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1