基于计量知识的语义查询方法、装置和计算机设备制造方法及图纸

技术编号:29933580 阅读:35 留言:0更新日期:2021-09-04 19:06
本申请涉及一种基于计量知识的语义查询方法、装置、计算机设备和存储介质。所述方法包括:获取用户输入的查询问题;对所述查询问题进行复述转写,生成同义问题集合;所述同义问题集合包括多个与所述查询问题的语义相匹配的同义问题;基于预先建立的问题模板库,分别生成所述同义问题集合中各个同义问题对应的目标问题模板,并根据各同义问题中的关键词,确定与各所述目标问题模板分别相匹配的目标查询语句;基于预先建立的计量知识图谱,利用所述目标查询语句进行图谱查询,得到与所述目标查询语句相匹配的目标图谱元素,并将所述目标图谱元素作为所述查询问题的答案。采用本方法能够准确理解用户语义,实现知识与文档的混合检索。合检索。合检索。

【技术实现步骤摘要】
基于计量知识的语义查询方法、装置和计算机设备


[0001]本申请涉及语义查询
,特别是涉及一种基于计量知识的语义查询方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着电网数字化的深入,计量自动化系统的采集数据日益增加,计量自动化相关制度文档日益复杂。当原始数据有着多样化的来源和形式时,急需一套查询流程便利、且查询结果准确的查询方法,从而实现对计量数据与文档的查询。现有的计量自动化系统查询方法基于关键词进行查询,然而,若输入少量关键词,则查询结果中包含大量无关信息;若输入大量关键词,则很容易造成无法返回任何结果。因此,现有的查询方法存在无法分析用户语义、无法识别关键词歧义的缺点,无法正确理解用户的查询意图,不能适应新一代计量自动化系统的发展。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够准确分析用户语义以提高查询准确性的基于计量知识的语义查询方法、装置、计算机设备和存储介质。
[0004]一种基于计量知识的语义查询方法,所述方法包括:
[0005]获取用户输入的查询问题;
[0006]对所述查询问题进行复述转写,生成同义问题集合;所述同义问题集合包括多个与所述查询问题的语义相匹配的同义问题;
[0007]基于预先建立的问题模板库,分别生成所述同义问题集合中各个同义问题对应的目标问题模板,并根据各同义问题中的关键词,确定与各所述目标问题模板分别相匹配的目标查询语句;
[0008]基于预先建立的计量知识图谱,利用所述目标查询语句进行图谱查询,得到与所述目标查询语句相匹配的目标图谱元素,并将所述目标图谱元素作为所述查询问题的答案;其中,所述计量知识图谱中包括有多个图谱元素,图谱元素包括实体、与所述实体相关联的属性、以及关系。
[0009]在其中一个实施例中,所述对所述查询问题进行复述转写,生成同义问题集合,包括:
[0010]将所述查询问题输入至机器翻译模型中,由所述机器翻译模型对所述查询问题进行编码解码,得到同义问题集合;其中,所述机器翻译模型为预先训练好的双向循环神经网络模型。
[0011]在其中一个实施例中,所述基于预先建立的问题模板库,分别生成所述同义问题集合中各个同义问题对应的目标问题模板,并根据各同义问题中的关键词,确定与各所述目标问题模板分别相匹配的目标查询语句,包括:
[0012]获取预先建立的问题模板库,所述问题模板库中的问题模板用于规定一类问题的
问句形式,并预先关联有对应的查询模板;所述查询模板中具有至少一个待填充的槽位;
[0013]在所述问题模板库中进行查询,分别确定与所述同义语句集合中各个同义语句相匹配的目标问题模板;
[0014]确定与各目标问题模板分别相关联的目标查询模板;
[0015]将各所述目标问题模板中的关键词,分别与预先建立的计量知识图谱中的图谱元素进行匹配,将匹配上的图谱元素作为与相应问题模板对应的相关图谱元素;
[0016]将所述相关图谱元素填充至对应的目标查询模板的槽位中,得到目标查询语句。
[0017]在其中一个实施例中,所述计量知识图谱的建立步骤包括:
[0018]获取结构化的计量知识信息和非结构化的计量知识信息;
[0019]对所述非结构化的计量知识信息进行第一知识抽取处理,得到至少一组的第一图谱元素;
[0020]对所述结构化的计量知识信息进行第二知识抽取处理,得到至少一组的第二图谱元素;
[0021]根据所述第一图谱元素和所述第二图谱元素,构建计量知识图谱。
[0022]在其中一个实施例中,所述非结构化的计量知识信息包括与计量领域相关的文档信息,所述对所述非结构化的计量知识信息进行第一知识抽取处理,得到至少一组的第一图谱元素,包括:
[0023]对所述非结构化的计量知识信息进行分词处理,获得多个实词序列;
[0024]分别依次提取所述多个实词序列中的图谱元素,得到至少一组的第一图谱元素。
[0025]在其中一个实施例中,所述结构化的计量知识信息为具有特定格式、并利用关系型数据库进行存储的计量知识信息,所述对所述结构化的计量知识信息进行第二知识抽取处理,得到至少一组的第二图谱元素,包括:
[0026]利用知识提取工具,对存储有结构化的计量知识信息的关系型数据库进行提取,得到至少一组的第二图谱元素。
[0027]在其中一个实施例中,所述利用所述目标查询语句进行图谱查询,得到与所述目标查询语句相匹配的目标图谱元素,并将所述目标图谱元素作为所述查询问题的答案,包括:
[0028]利用所述目标查询语句,通过图匹配的方式在所述计量知识图谱中进行查询,得到至少一个实体或至少一个关系;
[0029]将所得到的所述至少一个实体或至少一个关系作为所述查询问题的答案。
[0030]一种基于计量知识的语义查询装置,所述装置包括:
[0031]获取模块,用于获取用户输入的查询问题;
[0032]处理模块,用于对所述查询问题进行复述转写,生成同义问题集合;所述同义问题集合包括多个与所述查询问题的语义相匹配的同义问题;
[0033]所述处理模块,还用于基于预先建立的问题模板库,分别生成所述同义问题集合中各个同义问题对应的目标问题模板,并根据各同义问题中的关键词,确定与各所述目标问题模板分别相匹配的目标查询语句;
[0034]所述处理模块,还用于基于预先建立的计量知识图谱,利用所述目标查询语句进行图谱查询,得到与所述目标查询语句相匹配的目标图谱元素,并将所述目标图谱元素作
为所述查询问题的答案;其中,所述计量知识图谱中包括有多个图谱元素,图谱元素包括实体、与所述实体相关联的属性、以及关系。
[0035]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0036]获取用户输入的查询问题;
[0037]对所述查询问题进行复述转写,生成同义问题集合;所述同义问题集合包括多个与所述查询问题的语义相匹配的同义问题;
[0038]基于预先建立的问题模板库,分别生成所述同义问题集合中各个同义问题对应的目标问题模板,并根据各同义问题中的关键词,确定与各所述目标问题模板分别相匹配的目标查询语句;
[0039]基于预先建立的计量知识图谱,利用所述目标查询语句进行图谱查询,得到与所述目标查询语句相匹配的目标图谱元素,并将所述目标图谱元素作为所述查询问题的答案;其中,所述计量知识图谱中包括有多个图谱元素,图谱元素包括实体、与所述实体相关联的属性、以及关系。
[0040]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0041]获取用户输入的查询问题;
[0042]对所述查询问题进行复述转写,生成同义问题集合;所述同义问题集合包括多个与所述查询问题的语义相匹配的同义问题;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于计量知识的语义查询方法,其特征在于,所述方法包括:获取用户输入的查询问题;对所述查询问题进行复述转写,生成同义问题集合;所述同义问题集合包括多个与所述查询问题的语义相匹配的同义问题;基于预先建立的问题模板库,分别生成所述同义问题集合中各个同义问题对应的目标问题模板,并根据各同义问题中的关键词,确定与各所述目标问题模板分别相匹配的目标查询语句;基于预先建立的计量知识图谱,利用所述目标查询语句进行图谱查询,得到与所述目标查询语句相匹配的目标图谱元素,并将所述目标图谱元素作为所述查询问题的答案;其中,所述计量知识图谱中包括有多个图谱元素,图谱元素包括实体、与所述实体相关联的属性、以及关系。2.根据权利要求1所述的方法,其特征在于,所述对所述查询问题进行复述转写,生成同义问题集合,包括:将所述查询问题输入至机器翻译模型中,由所述机器翻译模型对所述查询问题进行编码解码,得到同义问题集合;其中,所述机器翻译模型为预先训练好的双向循环神经网络模型。3.根据权利要求1所述的方法,其特征在于,所述基于预先建立的问题模板库,分别生成所述同义问题集合中各个同义问题对应的目标问题模板,并根据各同义问题中的关键词,确定与各所述目标问题模板分别相匹配的目标查询语句,包括:获取预先建立的问题模板库,所述问题模板库中的问题模板用于规定一类问题的问句形式,并预先关联有对应的查询模板;所述查询模板中具有至少一个待填充的槽位;在所述问题模板库中进行查询,分别确定与所述同义语句集合中各个同义语句相匹配的目标问题模板;确定与各目标问题模板分别相关联的目标查询模板;将各所述目标问题模板中的关键词,分别与预先建立的计量知识图谱中的图谱元素进行匹配,将匹配上的图谱元素作为与相应问题模板对应的相关图谱元素;将所述相关图谱元素填充至对应的目标查询模板的槽位中,得到目标查询语句。4.根据权利要求1所述的方法,其特征在于,所述计量知识图谱的建立步骤包括:获取结构化的计量知识信息和非结构化的计量知识信息;对所述非结构化的计量知识信息进行第一知识抽取处理,得到至少一组的第一图谱元素;对所述结构化的计量知识信息进行第二知识抽取处理,得到至少一组的第二图谱元素;根据所述第一图谱元素和所述第二图谱元素,构建计量知识图谱。5.根据权利要求4所述的...

【专利技术属性】
技术研发人员:龚起航杨劲锋郑楷洪周尚礼曾璐琨李胜
申请(专利权)人:中国南方电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1