一种基于知识图谱推理的医疗智能问答处理方法及系统技术方案

技术编号:28054722 阅读:14 留言:0更新日期:2021-04-14 13:22
本发明专利技术提供了一种基于知识图谱推理的医疗智能问答处理方法及系统。本发明专利技术通过解析用户的原始问题得到用户意图以及用户意图对应的语义特征并进行目标实体识别,根据得到的目标实体生成包含正确答案的路径,并对于每个候选答案路径进行排序,将生成的答案返回给用户,能够准确的理解用户的意图,更加准确的将结果反馈给用户,让用户更加准确快速的获得所需要的结果,提升用户的体验。提升用户的体验。提升用户的体验。

【技术实现步骤摘要】
一种基于知识图谱推理的医疗智能问答处理方法及系统


[0001]本专利技术属于知识图谱自然语言处理领域,尤其是涉及一种基于知识图谱推理的医疗智能问答处理系统及系统。

技术介绍

[0002]现有的医疗管理系统,均是面向于搜索来实现医疗信息检索的,其原理是通过搜索的方式来实现字符的比对,以此满足用户的需求。因此现有的产品的搜索功能不是很精准,难以处理较为复杂的数据,以至于最后提供给用户的信息可能达不到用户的要求,出现“答非所问”的情况;再者此类产品仍然不能做到对用户的智能问答。所以目前还没有产品可以将智能搜索、智能推荐、智能问答结合到一起形成一个较为完善的系统。

技术实现思路

[0003]有鉴于此,本专利技术旨在提出一种基于知识图谱的医疗智能问答系统,具有方便、精准的优点。
[0004]为达到上述目的,本专利技术的技术方案是这样实现的:
[0005]一种基于知识图谱推理的医疗智能问答处理方法,包括如下步骤:
[0006]步骤1:获取用户的原始问题;
[0007]步骤2:将用户的原始问题解析成用户意图以及用户意图对应的语义特征;
[0008]步骤3:对用户的原始问题中的多种语义特征进行目标实体识别得到目标实体;
[0009]步骤4:根据得到的目标实体生成包含正确答案的路径;
[0010]步骤5:对于每个候选答案路径进行排序,将生成的答案返回给用户。
[0011]进一步的,所述步骤2中,解析用户意图包括判断输入的问题的领域,所述领域包括医疗领域和通用领域,通过将预训练模型ALBert与Bi

GRU模型结合,再将其结果输入到Attention结构中,最后将特征重标定以后的向量输入到全连接层进行分类。
[0012]进一步的,所述步骤2中,解析用户意图还包括平衡样本数据的步骤,通过使用SeqGAN文本生成模型对医疗问句进行续写增加医疗问句的数量,将医疗问句的句内次序打乱生成更多的医疗问句数据,以及引入Focal Loss损失函数。
[0013]进一步的,所述步骤2中,解析用户意图对应的语义特征中,通过单多跳分类模型得到单多跳语义特征,然后通过主谓宾分类模型得到主谓宾语义特征,最后通过链式分类模型得到链式特征。
[0014]进一步的,所述步骤3中目标实体识别包括实体提及识别、属性提及识别、以及实体链接;
[0015]所述实体提及识别包括通过词典分词进行实体的识别,通过实体命名识别模型去召回实体提及,以及通过启发式的方案去识别实体提及;
[0016]所述属性提及识别中针对不同类型的属性值,采用不同的方式进行识别,包括书籍名称、数字,时间属性以及模糊属性匹配;
[0017]所述实体链接中包括对候选实体挖掘多组特征,基于多组特征使用排序模型找到问题中的焦点实体。
[0018]进一步的,所述步骤4中,首先根据单多跳分类模型、链式分类模型、主谓宾分类模型结果,确定召回实体的n度关系:
[0019]单跳:召回所有实体的一度关系;
[0020]多跳:召回所有实体的二度关系;
[0021]然后根据问句经过链式分类模型和主谓宾分类模型输出的结果,召回不同模板的候选查询路径。
[0022]进一步的,所述步骤5中采用learn

to

rank排序模型对路径进行排序,对于每个候选答案路径,抽取n个特征进行得分计算,得到最后的查询路径。
[0023]本专利技术还提供一种计算设备,包括:存储器以及处理器;
[0024]存储器,用于存储程序指令;
[0025]处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行所述的基于知识图谱推理的医疗智能问答处理方法。
[0026]本专利技术还提供一种基于知识图谱推理的医疗智能问答系统,包括
[0027]前端模块,用于接收用户的问句输入,并将数据传输至后端服务器,同时,接受后端服务器的响应的数据,进行数据展示;
[0028]后端模块,用于对前端模块传输的数据进行处理,所述后端模块包括在后端服务器运行下的问句分类模块、问句处理模块、以及基于知识图谱的查询模块;
[0029]所述问句分类模块用于对输入问句划分领域以及得到问句的多种语义特征;
[0030]所述问句处理模块用于对输入问句中的问题进行实体识别;
[0031]所述基于知识图谱的查询模块用于生成包含正确答案的路径并返回用于最终的结果。
[0032]进一步的,所述后端服务器还包括构建多个词典,所述词典用于分词、词频的计算、实体提及的抽取,包括
[0033]医疗实体链接词典:医疗实体链接词典为文本中的实体提及到医学知识库中的实体的映射;
[0034]分词词典:按照实体链接词典中的实体提及将医学知识库中的实体进行分割,只保留实体的主干部分;
[0035]词频词典:用于计算实体提及以及属性值提及的词频特征,使用搜狗开源的中文词频词典工具构建;
[0036]倒排索引词典:用于识别属性值的模糊匹配,使用医学知识库中的所有属性值,构建字到词的映射;
[0037]中英文映射词典:用于提取问句中的英文简称并将其链接到其对应的汉语实体;
[0038]专业名称编码词典:提取问句中的专业名称编码并将其链接到对应的汉语实体。
[0039]相对于现有技术,本专利技术所述的一种基于知识图谱的医疗智能问答处理方法及系统具有以下优势:
[0040]本专利技术通过解析用户的原始问题得到用户意图以及用户意图对应的语义特征并进行目标实体识别,根据得到的目标实体生成包含正确答案的路径,并对于每个候选答案
路径进行排序,将生成的答案返回给用户,能够准确的理解用户的意图,更加准确的将结果反馈给用户,让用户更加准确快速的获得所需要的结果,提升用户的体验。
附图说明
[0041]构成本专利技术的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0042]图1是本专利技术的基于知识图谱的医疗智能问答处理方法架构流程图;
[0043]图2是本专利技术的基于知识图谱的医疗智能问答系统的框图;
[0044]图3是本专利技术的面向通用领域实体命名识别模型结构示意图;
[0045]图4是本专利技术的面向医学领域实体命名识别模型结构示意图;
[0046]图5是本专利技术的生成候选路径的模板、路径样例以及相应的问题示意图;
[0047]图6是本专利技术的实施例示意图。
具体实施方式
[0048]需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0049]在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:包括如下步骤:步骤1:获取用户的原始问题;步骤2:将用户的原始问题解析成用户意图以及用户意图对应的语义特征;步骤3:对用户的原始问题中的多种语义特征进行目标实体识别得到目标实体;步骤4:根据得到的目标实体生成包含正确答案的路径;步骤5:对于每个候选答案路径进行排序,将生成的答案返回给用户。2.根据权利要求1所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤2中,解析用户意图包括判断输入的问题的领域,所述领域包括医疗领域和通用领域,通过将预训练模型ALBert与Bi

GRU模型结合,再将其结果输入到Attention结构中,最后将特征重标定以后的向量输入到全连接层进行分类。3.根据权利要求1所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤2中,解析用户意图还包括平衡样本数据的步骤,通过使用SeqGAN文本生成模型对医疗问句进行续写增加医疗问句的数量,将医疗问句的句内次序打乱生成更多的医疗问句数据,以及引入Focal Loss损失函数。4.根据权利要求1所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤2中,解析用户意图对应的语义特征中,通过单多跳分类模型得到单多跳语义特征,然后通过主谓宾分类模型得到主谓宾语义特征,最后通过链式分类模型得到链式特征。5.根据权利要求1所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤3中目标实体识别包括实体提及识别、属性提及识别、以及实体链接;所述实体提及识别包括通过词典分词进行实体的识别,通过实体命名识别模型去召回实体提及,以及通过启发式的方案去识别实体提及;所述属性提及识别中针对不同类型的属性值,采用不同的方式进行识别,包括书籍名称、数字,时间属性以及模糊属性匹配;所述实体链接中包括对候选实体挖掘多组特征,基于多组特征使用排序模型找到问题中的焦点实体。6.根据权利要求4所述的一种基于知识图谱推理的医疗智能问答处理方法,其特征在于:所述步骤4中,首先根据单多跳分类模型、链式分类模型、主谓宾分类...

【专利技术属性】
技术研发人员:贾勇哲马国宁王林徐大为贺斌
申请(专利权)人:天津泰凡科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1