体检知识图谱构建方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:35917899 阅读:14 留言:0更新日期:2022-12-10 11:00
本发明专利技术实施例涉及一种体检知识图谱构建方法、装置、计算机设备及存储介质,包括:对现有医疗文档中的医疗概念实体进行抽取,得到多个目标医疗概念实体,其中,目标医疗概念实体包括疾病实体和特征实体;抽取疾病实体和特征实体之间的多种预设参数;基于多种预设参数将多个目标医疗概念实体与第一体检知识图谱中的医疗概念实体进行链接,得到第二体检知识图谱;对第二体检知识图谱中的体检知识进行数据处理,得到第三体检知识图谱;对第三体检知识图谱进行质量评估,在质量评估结果满足预设条件时,得到目标体检知识图谱,由此,可以避免体检知识图谱构建过程中较多人工干预,降低构建成本的问题。成本的问题。成本的问题。

【技术实现步骤摘要】
体检知识图谱构建方法、装置、计算机设备及存储介质


[0001]本专利技术实施例涉及数据处理领域,尤其涉及一种体检知识图谱构建方法、装置、计算机设备及存储介质。

技术介绍

[0002]健康体检是通过医学手段和方法对受检者进行身体的全面检查,了解受检者早期身体健康状况,及早的发现疾病线索和健康隐患的医疗行为。体检内容包括临床各科室的基本检查,如超声、心电、放射等医疗设备检查,还包括围绕人体的血液、尿液等的化验检查。健康体检是以健康而非单纯疾病为中心的身体检查,故又称之为预防保健性体检。因此,一个精准,涵盖知识量高的体检知识图谱可以提高体检效率。
[0003]现有的体检知识图谱的构建方法是基于规则从基础知识图谱中推理出推理知识图谱,再将基础知识图谱和推理知识图谱合并形成新的基础知识图谱。但是,基于规则的方式需要较多的人工制定规则,成本较高,并且知识获取的范围比较局限。

技术实现思路

[0004]鉴于此,为解决上述体检知识图谱构建方法成本高和局限性高的技术问题,本专利技术实施例提供一种体检知识图谱构建方法、装置、计算机设备及存储介质。
[0005]第一方面,本专利技术实施例提供一种体检知识图谱构建方法,包括:
[0006]对现有医疗文档中的医疗概念实体进行抽取,得到多个目标医疗概念实体,其中,所述目标医疗概念实体包括疾病实体和特征实体;
[0007]抽取所述疾病实体和特征实体之间的多种预设参数;
[0008]基于所述多种预设参数将所述多个目标医疗概念实体与第一体检知识图谱中的医疗概念实体进行链接,得到第二体检知识图谱;
[0009]对所述第二体检知识图谱中的体检知识进行数据处理,得到第三体检知识图谱;
[0010]对所述第三体检知识图谱进行质量评估,在质量评估结果满足预设条件时,得到目标体检知识图谱。
[0011]在一个可能的实施方式中,所述方法还包括:
[0012]基于预训练的关系分类模型,抽取所述疾病实体和特征实体之间的关联关系;
[0013]基于槽填充方法,抽取所述特征实体的属性信息。
[0014]在一个可能的实施方式中,所述方法还包括:
[0015]对所述现有医疗文档中的医疗信息语句添加预设字符,得到目标医疗信息语句;
[0016]将所述目标医疗语句输入至所述关系分类模型,得到疾病实体和特征实体对应的目标向量;
[0017]基于所述目标向量计算所述疾病实体和特征实体之间的关联关系。
[0018]在一个可能的实施方式中,所述方法还包括:
[0019]基于所述槽填充方法,对所述现有医疗文档中的医疗信息语句进行语义识别,识
别所述特征实体的属性信息。
[0020]在一个可能的实施方式中,所述方法还包括:
[0021]基于实体链接方法,将所述多个目标医疗概念实体与所述第一体检知识图谱中的医疗概念实体进行链接,确定所述多个目标医疗概念实体与所述第一体检知识图谱中的医疗概念实体之间的层级关系;
[0022]基于所述层级关系,将所述多个目标医疗概念实体链接到所述第一体检知识图谱中对应的医疗概念实体下,得到第二体检知识图谱。
[0023]在一个可能的实施方式中,所述方法还包括:
[0024]基于语义相似度,在所述第一体检知识图谱中的医疗概念实体中选择与所述多个目标医疗概念实体对应的多个候选医疗概念实体;
[0025]基于预训练的关系分类模型预测所述多个目标医疗概念实体和对应的多个候选实体之间的层级关系。
[0026]在一个可能的实施方式中,所述方法还包括:
[0027]采用规则推理方法获取所述第二体检知识图谱中存在的隐含医疗概念实体;
[0028]采用链接预测方法预测所述隐含医疗概念实体之间的关联关系;
[0029]采用槽填充方法补充所述隐含医疗概念实体缺失的属性信息;
[0030]基于所述隐含医疗概念实体之间的关联关系和所述隐含医疗概念实体缺失的属性信息对所述第二体检知识图谱进行更新,得到第三体检知识图谱。
[0031]第二方面,本专利技术实施例提供一种体检知识图谱构建装置,包括:
[0032]抽取模块,用于对现有医疗文档中的医疗概念实体进行抽取,得到多个目标医疗概念实体,其中,所述目标医疗概念实体包括疾病实体和特征实体;
[0033]所述抽取模块,还用于抽取所述疾病实体和特征实体之间的多种预设参数;
[0034]链接模块,用于基于所述多种预设参数将所述多个目标医疗概念实体与第一体检知识图谱中的医疗概念实体进行链接,得到第二体检知识图谱;
[0035]处理模块,用于对所述第二体检知识图谱中的体检知识进行数据处理,得到第三体检知识图谱;
[0036]评估模块,用于对所述第三体检知识图谱进行质量评估,在质量评估结果满足预设条件时,得到目标体检知识图谱。
[0037]第三方面,本专利技术实施例提供一种计算机设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的体检知识图谱构建程序,以实现上述第一方面中所述的体检知识图谱构建方法。
[0038]第四方面,本专利技术实施例提供一种存储介质,包括:所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面中所述的体检知识图谱构建方法。
[0039]本专利技术实施例提供的体检知识图谱构建方案,通过对现有医疗文档中的医疗概念实体进行抽取,得到多个目标医疗概念实体,其中,所述目标医疗概念实体包括疾病实体和特征实体;抽取所述疾病实体和特征实体之间的多种预设参数;基于所述多种预设参数将所述多个目标医疗概念实体与第一体检知识图谱中的医疗概念实体进行链接,得到第二体检知识图谱;对所述第二体检知识图谱中的体检知识进行数据处理,得到第三体检知识图
谱;对所述第三体检知识图谱进行质量评估,在质量评估结果满足预设条件时,得到目标体检知识图谱,相比于现有技术基于规则从基础知识图谱中推理出推理知识图谱,再将基础知识图谱和推理知识图谱合并形成新的基础知识图谱;基于规则的方式需要较多的人工制定规则,成本较高,并且知识获取的范围比较局限的问题,由本方案,可以避免体检知识图谱构建过程中较多人工干预,降低构建成本的问题,本方案构建的体检知识图谱涵盖知识范围广,提高应用效率。
附图说明
[0040]图1为本专利技术实施例提供的一种体检知识图谱构建方法的流程示意图;
[0041]图2为本专利技术实施例提供的另一种体检知识图谱构建方法的流程示意图;
[0042]图3为本专利技术实施例提供的一种体检知识图谱构建装置的结构示意图;
[0043]图4为本专利技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0044]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种体检知识图谱构建方法,其特征在于,包括:对现有医疗文档中的医疗概念实体进行抽取,得到多个目标医疗概念实体,其中,所述目标医疗概念实体包括疾病实体和特征实体;抽取所述疾病实体和特征实体之间的多种预设参数;基于所述多种预设参数将所述多个目标医疗概念实体与第一体检知识图谱中的医疗概念实体进行链接,得到第二体检知识图谱;对所述第二体检知识图谱中的体检知识进行数据处理,得到第三体检知识图谱;对所述第三体检知识图谱进行质量评估,在质量评估结果满足预设条件时,得到目标体检知识图谱。2.根据权利要求1所述的方法,其特征在于,所述抽取所述疾病实体和特征实体之间的多种预设参数,包括:基于预训练的关系分类模型,抽取所述疾病实体和特征实体之间的关联关系;基于槽填充方法,抽取所述特征实体的属性信息。3.根据权利要求2所述的方法,其特征在于,所述基于预训练的关系分类模型,抽取所述疾病实体和特征实体之间的关联关系,包括:对所述现有医疗文档中的医疗信息语句添加预设字符,得到目标医疗信息语句;将所述目标医疗语句输入至所述关系分类模型,得到疾病实体和特征实体对应的目标向量;基于所述目标向量计算所述疾病实体和特征实体之间的关联关系。4.根据权利要求2所述的方法,其特征在于,所述基于槽填充方法,抽取所述特征实体的属性信息,包括:基于所述槽填充方法,对所述现有医疗文档中的医疗信息语句进行语义识别,识别所述特征实体的属性信息。5.根据所述权利要求2~4任一所述的方法,其特征在于,所述基于所述多种预设参数将所述多个目标医疗概念实体与第一体检知识图谱中的医疗概念实体进行链接,得到第二体检知识图谱,包括:基于实体链接方法,将所述多个目标医疗概念实体与所述第一体检知识图谱中的医疗概念实体进行链接,确定所述多个目标医疗概念实体与所述第一体检知识图谱中的医疗概念实体之间的层级关系;基于所述层级关系,将所述多个目标医疗概念实体链接到所述第一体检知识图谱中对应的医疗概念实体下,得到第二体检知识图谱。6.根据所述权利要求5所述的方法,其特征在于,所述基...

【专利技术属性】
技术研发人员:张江涛史亚飞
申请(专利权)人:中国人民解放军第三〇五医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1