医疗知识图谱的构建方法和装置制造方法及图纸

技术编号:15691288 阅读:86 留言:0更新日期:2017-06-24 04:22
本发明专利技术公开了一种医疗知识图谱的构建方法和装置。其中,该方法包括:获取样本数据中的各医疗关键词以及各所述医疗关键词之间的关联关系;根据所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度;基于各所述医疗关键词以及所述关联强度,构建医疗知识图谱。采用本发明专利技术的技术方案,通过样本数据以及从样本数据中获取到的各医疗关键词以及各医疗关键词之间的关联关系,先计算出各医疗关键词之间的关联强度,然后根据各医疗关键词以及关联强度构建医疗知识图谱,不仅能直观反映出各医疗关键词之间的关联,而且能够确定各医疗关键词之间的关联强弱,有利于梳理样本数据中的医疗知识,总结经验,推动医学的发展。

Method and device for constructing medical knowledge map

The invention discloses a method and a device for constructing a medical knowledge spectrum. Among them, the method includes: obtaining the relationship between the sample data of various medical keywords and each of the medical keywords; according to the sample data and the correlation relation, calculated the strength of association between each of the medical keywords; each of the medical key words and the strength of the association based on the construction of medical knowledge map. The technical scheme of the invention, the relationship between the sample data and access to the data from the sample in the medical and health key words, first to calculate the strength of association between the various medical keywords, then according to the construction of medical knowledge of the medical related keywords and strength, not only can directly reflect the relationship between the various medical keywords, and to determine the relationship between the various medical keywords, is conducive to the combing of the sample data of medical knowledge, experience, promote the development of medicine.

【技术实现步骤摘要】
医疗知识图谱的构建方法和装置
本专利技术实施例涉及计算机应用
,尤其涉及一种医疗知识图谱的构建方法和装置。
技术介绍
病历是医务人员对患者疾病的发生、发展、转归,进行检查、诊断、治疗等医学活动过程所作的文字记录。病历既是临床实践工作的总结,又是探索疾病规律及处理医学纠纷的法律依据,是国家的宝贵财富。在临床医学中,有效整理病历,从中挖掘医生临床经验,对医学进步具有重大意义。在实际诊疗中,由于医务人员本身存在知识储备和临床经验等方面的差异性,往往不同的医务人员针对同一种疾病或者症状的诊断方式以及用药习惯等也不尽相同,而出现有的收效显著有的却见效甚微。而通过组织业内医务人员的进行治疗经验交流,不仅需要大量的人力物力,且不具有实时性和普遍共享性。因此,如何有效地从病历中整理出医学知识,实现医学知识共享显得尤为重要。
技术实现思路
本专利技术提供了一种医疗知识图谱的构建方法和装置,以有效地从样本数据中整理出医学知识,实现医学知识共享。第一方面,本专利技术实施例提供了一种医疗知识图谱的构建方法,该方法包括:获取样本数据中的各医疗关键词以及各所述医疗关键词之间的关联关系;根据所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度;基于各所述医疗关键词以及所述关联强度,构建医疗知识图谱。第二方面,本专利技术实施例还提供了一种医疗知识图谱的构建装置,该装置包括:医疗关键词获取模块,用于获取样本数据中的各医疗关键词以及各所述医疗关键词之间的关联关系;关联强度计算模块,用于根据所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度;医疗知识图谱构建模块,用于基于各所述医疗关键词以及所述关联强度,构建医疗知识图谱。本专利技术实施例的技术方案,通过样本数据以及从样本数据中获取到的各医疗关键词以及各医疗关键词之间的关联关系,先计算出各医疗关键词之间的关联强度,然后根据各医疗关键词以及关联强度构建医疗知识图谱,通过图谱的形式将样本数据中的医疗知识进行汇集,不仅能直观反映出各医疗关键词之间的关联,而且能够确定各医疗关键词之间的关联强弱,有利于梳理样本数据中的医疗知识,总结样本数据中的医学经验,进而推动医学的发展。附图说明为了更加清楚地说明本专利技术示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本专利技术所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。图1为本专利技术实施例一所提供的一种医疗知识图谱的构建方法的流程图;图2为本专利技术实施例二所提供的一种医疗知识图谱的构建方法的流程图;图3为本专利技术实施例三所提供的一种医疗知识图谱的构建方法的流程图;图4为本专利技术实施例四所提供的一种医疗知识图谱的构建方法的流程图;图5为本专利技术实施例三所提供的一种医疗知识图谱的构建装置的结构图。具体实施方式下面结合附图并通过具体实施方式来进一步说明本专利技术的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一图1为本专利技术实施例一所提供的一种医疗知识图谱的构建方法的流程图。如图1所示,本实施例的方法可以由医疗知识图谱的构建装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可独立的配置在服务器中或者由终端和服务器配合实现本实施例的方法。本实施例的方法具体包括:S110、获取样本数据中的各医疗关键词以及各所述医疗关键词之间的关联关系。示例性地,样本数据可以是医学文献、医学实验报告以及病历等包含医学知识的资源。医疗关键词可以是用于描述医学知识的医学标准术语或者各医学标准术语的同义词、近义词、缩写等。具体地,各医疗关键词至少包括以下四种类型:症状(Symptom)、化验指标和检查标志物(Lab)、诊断(Diagnosis)、治疗(Therapy)等。其中,治疗主要包括药品和手术等。进一步地,各医疗关键词之间的关联关系具体可包括,症状与其它症状之间的关联关系、症状与诊断之间的关联关系、症状与检查之间的关联关系、症状与治疗之间的关联关系、诊断与其它诊断(并发症)之间的关联关系、诊断与症状之间的关联关系、诊断与检查之间的关联关系、诊断与治疗之间的关联关系、检查与其它检查之间的关联关系、检查与症状之间的关联关系、检查与诊断之间的关联关系、治疗与其它治疗(如多种药品之间产生的相辅或冲突的作用)之间的关联关系、治疗与症状之间的关联关系以及治疗与诊断之间的关联关系等。可选地,可以请医学专业人士预先人工整理出或者借助人工智能技术整理出各医疗关键词,以及各医疗关键词的各种属性等医学知识,先录入数据库中,然后建立搜索索引,并且把相关知识条目连缀起来,生成医学知识库。即,医学知识库中存储有各医疗关键词以及各医疗关键词之间的关联关系的数据库,将各种医疗关键词及其关联关系,组成网状结构,方便存储和调用。为了便于查询,医学知识库还可以增加智能文字处理与检索功能。其中,医学知识一般有两个来源,医学文献和某一领域专家的临床经验。医学知识库可以理解为一个由点(Vertex)和边(Edge)组成的初级的医疗知识图谱,其中,点用来描述医疗知识图谱中的各医疗关键词,譬如各种症状、各种器官和组织等;边用来描述各医疗关键词之间的关系,譬如“位于”、“包含”以及“数量”等等。点和边都是预先定义的有限集合。其中,各医疗关键词之间的拓扑关系可以理解为医疗知识图谱的边,用于描述各医疗关键词之间的关联关系。例如,各个器官之间的位置关系以及各种症状的数量关系等。为了便于对各医疗关键词进行整理,可以将原生态病历转换成结构化病历以后,获取用各标准化医学术语对应的各医疗关键词以及各医疗关键词之间的关联关系。S120、根据所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度。在本实施例中,根据样本数据以及关联关系,计算出各医疗关键词之间的关联强度,具体可以包括:根据关联关系确定出各医疗关键词的共现样本数据的数量;分别统计出各医疗关键词所在的样本数据,作为各医疗关键词的关联样本数据;基于各医疗关键词的关联样本数据的数量、共现样本数据的数量以及样本数据的总数,计算出各医疗关键词之间的关联强度。或者,基于各医疗关键词的属性以及从属关系构建至少一个树形结构,其中,树形结构中的各节点为同一属性且具有从属关系的各医疗关键词;根据样本数据、关联关系以及树形结构,计算出各医疗关键词之间的关联强度。进一步地,具体可根据样本数据以及关联关系,计算出树形结构中的最后一层叶节点与各医疗关键词之间的关联强度;根据最后一层叶节点与各医疗关键词之间的关联强度,计算出树形结构中各个节点与各医疗关键词之间的关联强度。为了进一步精准描述各医疗关键词本文档来自技高网...
医疗知识图谱的构建方法和装置

【技术保护点】
一种医疗知识图谱的构建方法,其特征在于,包括:获取样本数据中的各医疗关键词以及各所述医疗关键词之间的关联关系;根据所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度;基于各所述医疗关键词以及所述关联强度,构建医疗知识图谱。

【技术特征摘要】
1.一种医疗知识图谱的构建方法,其特征在于,包括:获取样本数据中的各医疗关键词以及各所述医疗关键词之间的关联关系;根据所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度;基于各所述医疗关键词以及所述关联强度,构建医疗知识图谱。2.根据权利要求1所述的方法,其特征在于,所述根据各所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度,包括:基于各所述医疗关键词的属性以及从属关系构建至少一个树形结构,其中,所述树形结构中的各节点为同一属性且具有从属关系的各所述医疗关键词;根据所述样本数据、所述关联关系以及所述树形结构,计算出各所述医疗关键词之间的关联强度。3.根据权利要求2所述的方法,其特征在于,所述根据所述样本数据、所述关联关系以及所述树形结构,计算出各所述医疗关键词之间的关联强度,包括:根据所述样本数据以及所述关联关系,计算出所述树形结构中的最后一层叶节点与各所述医疗关键词之间的关联强度;根据所述最后一层叶节点与各所述医疗关键词之间的关联强度,计算出所述树形结构中各个节点与各所述医疗关键词之间的关联强度。4.根据权利要求1所述的方法,其特征在于,所述根据所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度,包括:根据所述关联关系,确定出各所述医疗关键词之间的关联方向,其中,所述关联方向包括正向关联和逆向关联;根据所述样本数据以及所述关联方向,分别计算出各所述医疗关键词之间的正向关联强度和逆向关联强度。5.根据权利要求1所述的方法,其特征在于,所述根据所述样本数据以及所述关联关系,计算出各所述医疗关键词之间的关联强度,包括:根据所述关联关系确定出各所述医疗关键词的共现样本数据的数量;分别统计出各医疗关键词所在的样本数据,作为各所述医疗关键词的关联样本数据;基于各所述医疗关键词的所述关联样本数据的数量、所述共现样本数据的数...

【专利技术属性】
技术研发人员:邓侃邱鹏飞刘旭涛孙俊
申请(专利权)人:北京大数医达科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1