内容输出方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号:36743790 阅读:20 留言:0更新日期:2023-03-04 10:24
本公开涉及一种内容输出方法、装置、可读存储介质及电子设备,该方法包括:通过预先训练的关系分类模型抽取输入文本中的关系分类,通过预先训练的命名实体识别模型获取输入文本中的实体及实体的类别,基于关系分类、实体和实体的类别从医学知识图谱中筛选出目标三元组,医学知识图谱是对胃恶性肿瘤相关的参考知识文本进行命名实体识别与关系抽取,根据得到的实体识别结果和关系分类结果构建的,医学知识图谱包括胃恶性肿瘤相关的主体、客体及主体与客体之间的关系,将目标三元组整合为文本形式作为输出内容;通过构建相关疾病知识的知识图谱,结合输入文本中的相关的、系统的临床知识、患者信息及病情信息,给临床医务工作者提供了决策参考。提供了决策参考。提供了决策参考。

【技术实现步骤摘要】
内容输出方法、装置、可读存储介质及电子设备


[0001]本公开涉及计算机
,具体地,涉及一种内容输出方法、装置、可读存储介质及电子设备。

技术介绍

[0002]随着技术的进步和市场的逐渐成熟,人工智能在医疗领域的应用日益广泛和深入,而知识图谱作为一种从海量文本和图像中抽取结构化知识的手段,正在成为推动人工智能发展的核心驱动力之一。医学知识图谱是一种重要的领域知识图谱,它在语义搜索、知识问答和临床决策智慧医疗领域都有很好的发展前景。基于上述背景,亟需一种基于胃恶性肿瘤知识图谱的诊断知识推荐方法。

技术实现思路

[0003]本公开的目的是提供一种内容输出方法、装置、电子设备及计算机可读存储介介质。
[0004]根据本公开实施例的第一方面,提供一种内容输出方法,包括:通过预先训练的关系分类模型抽取输入文本中的关系分类;通过预先训练的命名实体识别模型获取所述输入文本中的实体及所述实体的类别;基于所述关系分类、所述实体和所述实体的类别从医学知识图谱中筛选出目标三元组;所述医学知识图谱是对胃恶性肿瘤相关的参考知识文本进行命名实体识别与关系抽取,根据得到的实体识别结果和关系分类结果构建的,所述医学知识图谱包括胃恶性肿瘤相关的主体、客体及主体与客体之间的关系;将所述目标三元组整合为文本形式作为输出内容。
[0005]可选地,所述基于所述关系分类、所述实体和所述实体的类别从所述医学知识图谱中筛选出目标三元组,包括:根据所述关系分类从所述医学知识图谱中筛选出包含所述关系分类的候选三元组;根据所述实体和所述实体的类别从所述候选三元组中筛选出包含所述实体的所述目标三元组。
[0006]可选地,所述根据所述实体和所述实体的类别从所述候选三元组中筛选出包含所述实体的所述目标三元组,包括:在所述实体命中所述候选三元组中的单个主体的情况下,将命中的所述单个主体的客体作为新的主体,将所述新的主体所对应的三元组作为所述目标三元组;或在所述实体命中所述候选三元组中的单个客体的情况下,将与命中的所述单个客体具有相同主体和相同关系的三元组作为所述目标三元组。
[0007]可选地,所述基于所述关系分类、所述实体和所述实体的类别从所述医学知识图谱中筛选出目标三元组,包括:在所述输入文本中有多个实体命中所述医学知识图谱中的实体的情况下,将所述多个实体进行两两组合,得到多个组合;对于所述多个组合中的每一个组合:从所述医学知识图谱中筛选出节点数量在指定范围内,且以所述组合中的两个实体作为知识图谱路径的头节点和尾节点的候选知识图谱路径;将有至少一个路径关系属于所述关系分类的所述候选知识图谱路径作为所述目标三元组。
[0008]可选地,所述将所述目标三元组整合为文本形式作为待输出内容,包括:通过伪句转换函数将所述目标三元组整合为文本形式作为输出内容。
[0009]可选地,所述关系分类模型的训练方法包括:将样本文本中的每个字映射为第一多维稠密向量,通过双向LSTM模型获取每个所述第一多维稠密向量的隐状态特征;将预先确定的关系标签中的每个字映射为第二多维稠密向量,根据所述第二多维稠密向量获取所述关系标签的平均字向量,将所述平均字向量作为所述关系标签的向量表示;所述关系标签是基于所述参考知识文本确定的;根据所述隐状态特征和所述关系标签的向量表示,获取所述样本文本中每个词语对于每个所述关系标签的权重;根据所述权重得到预测关系分类的概率,基于所述预测关系分类的概率和实际关系分类得到损失函数;利用所述损失函数训练预分类模型,得到所述关系分类模型。
[0010]可选地,所述损失函数的计算公式包括:
[0011][0012]其中,L为所述损失函数,m为所述样本文本的数量,n为所述关系标签的数量,y
ij
为第i个样本文本的第j个关系标签的实际关系分类,为第i个样本文本的第j个关系标签的预测关系分类。
[0013]根据本公开实施例的第二方面,提供一种内容输出装置,包括:分类模块,用于通过预先训练的关系分类模型抽取输入文本中的关系分类;识别模块,用于通过预先训练的命名实体识别模型获取所述输入文本中的实体及所述实体的类别;筛选模块,用于基于所述关系分类、所述实体和所述实体的类别从医学知识图谱中筛选出目标三元组;所述医学知识图谱是对胃恶性肿瘤相关的参考知识文本进行命名实体识别与关系抽取,根据得到的实体识别结果和关系分类结果构建的,所述医学知识图谱包括胃恶性肿瘤相关的主体、客体及主体与客体之间的关系;知识整合模块,用于将所述目标三元组整合为文本形式作为输出内容。
[0014]根据本公开实施例的第三方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现前述的内容输出方法的步骤。
[0015]根据本公开实施例的第四方面,提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现前述的内容输出方法的步骤。
[0016]本公开的实施例提供的技术方案可以包括以下有益效果:通过预先训练的关系分类模型抽取输入文本中的关系分类,通过预先训练的命名实体识别模型获取输入文本中的实体及实体的类别,基于关系分类、实体和实体的类别从医学知识图谱中筛选出目标三元组,医学知识图谱是对参考知识文本进行命名实体识别与关系抽取,根据得到的实体识别结果和关系分类结果构建的,医学知识图谱包括主体、客体及主体与客体之间的关系,将目标三元组整合为文本形式作为输出内容;通过构建相关疾病知识的知识图谱,结合输入文本中的相关的、系统的临床知识、患者信息及病情信息,向临床医务工作者输出与输入文本有关的关联内容,给临床医务工作者提供了决策参考,提高了医疗质量和医疗服务水平。
[0017]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0018]附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
[0019]图1是本公开示例性实施例示出的计算机系统的结构示意图。
[0020]图2是本公开示例性实施例示出的知识图谱的局部示意图。
[0021]图3是本公开示例性实施例示出的一种内容输出方法的流程图。
[0022]图4是本公开示例性实施例示出的命中知识图谱主体的框图。
[0023]图5是本公开示例性实施例示出的命中知识图谱客体的框图。
[0024]图6是本公开示例性实施例示出的一种内容输出装置框图。
[0025]图7是本公开示例性实施例示出的一种电子设备的框图。
[0026]图8是本公开示例性实施例示出的另一种电子设备的框图。
[0027]附图标记说明
[0028]120

终端;140

服务器;20

内容输出装置;201

分类模块;203

...

【技术保护点】

【技术特征摘要】
1.一种内容输出方法,其特征在于,包括:通过预先训练的关系分类模型抽取输入文本中的关系分类;通过预先训练的命名实体识别模型获取所述输入文本中的实体及所述实体的类别;基于所述关系分类、所述实体和所述实体的类别从医学知识图谱中筛选出目标三元组;所述医学知识图谱是对胃恶性肿瘤相关的参考知识文本进行命名实体识别与关系抽取,根据得到的实体识别结果和关系分类结果构建的,所述医学知识图谱包括胃恶性肿瘤相关的主体、客体及主体与客体之间的关系;将所述目标三元组整合为文本形式作为输出内容。2.根据权利要求1所述的方法,其特征在于,所述基于所述关系分类、所述实体和所述实体的类别从所述医学知识图谱中筛选出目标三元组,包括:根据所述关系分类从所述医学知识图谱中筛选出包含所述关系分类的候选三元组;根据所述实体和所述实体的类别从所述候选三元组中筛选出包含所述实体的所述目标三元组。3.根据权利要求2所述的方法,其特征在于,所述根据所述实体和所述实体的类别从所述候选三元组中筛选出包含所述实体的所述目标三元组,包括:在所述实体命中所述候选三元组中的单个主体的情况下,将命中的所述单个主体的客体作为新的主体,将所述新的主体所对应的三元组作为所述目标三元组;或在所述实体命中所述候选三元组中的单个客体的情况下,将与命中的所述单个客体具有相同主体和相同关系的三元组作为所述目标三元组。4.根据权利要求1所述的方法,其特征在于,所述基于所述关系分类、所述实体和所述实体的类别从所述医学知识图谱中筛选出目标三元组,包括:在所述输入文本中有多个实体命中所述医学知识图谱中的实体的情况下,将所述多个实体进行两两组合,得到多个组合;对于所述多个组合中的每一个组合:从所述医学知识图谱中筛选出节点数量在指定范围内,且以所述组合中的两个实体作为知识图谱路径的头节点和尾节点的候选知识图谱路径;将有至少一个路径关系属于所述关系分类的所述候选知识图谱路径作为所述目标三元组。5.根据权利要求1所述的方法,其特征在于,所述将所述目标三元组整合为文本形式作为待输出内容,包括:通过伪句转换函数将所述目标三元组整合为文本形式作为输出内容。6.根据...

【专利技术属性】
技术研发人员:孙小婉蔡巍招一强张霞
申请(专利权)人:沈阳东软智能医疗科技研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1