基于知识图谱子图检索的智能问答方法及系统技术方案

技术编号:38767356 阅读:18 留言:0更新日期:2023-09-10 10:40
本发明专利技术涉及数据检索技术领域,具体公开了一种基于知识图谱子图检索的智能问答方法及系统,所述方法包括遍历预设的应答库,提取关键词,建立并更新关键词表;在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。本发明专利技术基于选取频率将关键词转换为集成度更高的图数据,当需要检索时,借鉴图数据比对过程,即可快速地定位关键词,进而确定应答语句,极大地降低了检索过程的设计复杂性,提高了检索效率。率。率。

【技术实现步骤摘要】
基于知识图谱子图检索的智能问答方法及系统


[0001]本专利技术涉及数据检索
,具体是一种基于知识图谱子图检索的智能问答方法及系统。

技术介绍

[0002]知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
[0003]知识图谱在智能问答领域中契合度很高,尤其是检索过程,现有技术中关于检索过程的设计,几乎都基于文本识别比对技术,这种方式虽然便捷,但是无法集成式比对,也即,一次比对过程只能比对两个文本,比对效率较低;此外,文本比对过程的规则设定较为复杂,需要人工根据具体情况进行判定;因此,如何借助知识图谱优化现有的文本比对检索过程是本专利技术技术方案想要解决的技术问题。

技术实现思路

[0004]本专利技术的目的在于提供一种基于知识图谱子图检索的智能问答方法及系统,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种基于知识图谱子图检索的智能问答方法,所述方法包括:遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
[0006]作为本专利技术进一步的方案:所述遍历预设的应答库,提取关键词,建立并更新关键词表的步骤包括:遍历预设的应答库,读取应答语句;将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;更新目标数据项中的语句数量。
[0007]作为本专利技术进一步的方案:所述在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据的步骤包括:遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;
基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;根据词串中各关键词对应的语句数量确定映射点尺寸;连接映射点,得到图数据;其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
[0008]作为本专利技术进一步的方案:所述实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词的步骤包括:实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。
[0009]作为本专利技术进一步的方案:所述根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示的步骤包括:读取反馈模型输出的反馈关键词,统计所述反馈关键词,创建图像特征;基于图像特征遍历图数据,确定匹配图数据及匹配度;将所述匹配度与预设的匹配阈值进行比对,当所述匹配度达到预设的匹配阈值时,标记对应的匹配图数据;基于所述匹配图数据查询对应的关键词,根据关键词的语句数量的倒序查询应答语句,作为匹配语句;将问句信息和匹配语句输入预设的筛选模型,确定语句对并显示。
[0010]作为本专利技术进一步的方案:所述基于图像特征遍历图数据,确定匹配图数据及匹配度的步骤包括:根据预设的递增密度对图像特征进行切分,得到待比对单元;所述待比对单元的最小单元为映射点;根据待比对单元遍历图数据,确定最大匹配度;当最大匹配度达到预设的数值条件时,确定匹配图数据。
[0011]本专利技术技术方案还提供了一种基于知识图谱子图检索的智能问答系统,所述系统包括:词表创建模块,用于遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;图数据生成模块,用于在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;问句反馈模块,用于实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;遍历匹配模块,用于根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。
[0012]作为本专利技术进一步的方案:所述词表创建模块包括:应答语句读取单元,用于遍历预设的应答库,读取应答语句;
类型判定单元,用于将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;目标定位单元,用于根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;数量更新单元,用于更新目标数据项中的语句数量。
[0013]作为本专利技术进一步的方案:所述图数据生成模块包括:频率计算单元,用于遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;词串生成单元,用于基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;尺寸确定单元,用于根据词串中各关键词对应的语句数量确定映射点尺寸;映射点连接单元,用于连接映射点,得到图数据;其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。
[0014]作为本专利技术进一步的方案:所述问句反馈模块包括:信息输入单元,用于实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;确认信息接收单元,用于接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;模型更新单元,用于根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。
[0015]与现有技术相比,本专利技术的有益效果是:本专利技术对已有的应答数据进行关键词提取,创建关键词表,根据关键词在应答数据中出现的数量确定选取频率,基于选取频率将关键词转换为集成度更高的图数据,当需要检索时,借鉴图数据比对过程,即可快速地定位关键词,进而确定应答语句,极大地降低了检索过程的设计复杂性,提高了检索效率。
附图说明
[0016]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例。
[0017]图1为基于知识图谱子图检索的智能问答方法的流程框图。
[0018]图2为基于知识图谱子图检索的智能问答方法的第一子流程框图。
[0019]图3为基于知识图谱子图检索的智能问答方法的第二子流程框图。
[0020]图4为基于知识图谱子图检索的智能问答方法的第三子流程框图。
[0021]图5为基于知识图谱子图检索的智能问答方法的第四子流程框图。
实施方式
[0022]为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅
用以解释本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱子图检索的智能问答方法,其特征在于,所述方法包括:遍历预设的应答库,提取关键词,建立并更新关键词表;所述关键词表中含有关键词项和语句数量项;在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据;实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词;根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示。2.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述遍历预设的应答库,提取关键词,建立并更新关键词表的步骤包括:遍历预设的应答库,读取应答语句;将所述应答语句输入预设的词性分析模型,确定应答语句中各字词的类型;根据所述类型选取关键词,根据选取的关键词在预设的关键词表中定位目标数据项;更新目标数据项中的语句数量。3.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述在关键词表中选取关键词及其选取频率,基于选取频率选取关键词,得到词串,并将所述词串转换为图数据的步骤包括:遍历所述关键词表,读取语句数量,根据所述语句数量计算各个关键词的选取频率;基于所述选取频率随机选取预设数量的关键词,得到词串;其中,预设数量通过调节端口获取;根据词串中各关键词对应的语句数量确定映射点尺寸;连接映射点,得到图数据;其中,所述映射点中含有色值端口,用于接收用户输入的色值,标记对应的关键词。4.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述实时获取用户发送的问句信息,输入预设的反馈模型,确定反馈关键词的步骤包括:实时获取用户发送的问句信息,将所述问句信息输入预设的反馈模型;接收反馈模型输出的反馈关键词,向人工端发送,接收人工端返回的确认信息;根据所述确认信息实时更新所述反馈模型;其中,所述反馈模型为训练好的神经网络识别模型。5.根据权利要求1所述的基于知识图谱子图检索的智能问答方法,其特征在于,所述根据所述反馈关键词遍历图数据,确定匹配语句并进行筛选显示的步骤包括:读取反馈模型输出的反馈关键词,统计所述反馈关键词,创建图像特征;基于图像特征遍历图数据,确定匹配图数据及匹配度;将所述匹配度与预设的匹配阈值进行比对,当所述匹配度达到预设的匹配阈值时,标记对应的匹配图数据;基于所述匹配图数据查询对应的关键词,根据关键词的语句数量的倒序查询应答语句,作为匹配语句;将问句信息和匹配语句输入预设的...

【专利技术属性】
技术研发人员:张薇
申请(专利权)人:南京瑞海文信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1