一种基于知识图谱的数据分析系统技术方案

技术编号:36382380 阅读:38 留言:0更新日期:2023-01-18 09:44
本申请涉及一种基于知识图谱的数据分析系统。所述系统包括:通过数据库对获取到的传输数据进行预处理,并通过服务器利用预处理后得到的处理数据更新预设知识图谱,且服务器利用更新后的预设知识图谱确定传输数据对应的分析结果,由于预设知识图谱包含多维度的专业知识数据潜在关联关系,利用预设知识图谱挖掘传输数据与多维度不同专业知识数据之间的关联关系,从而确定传输数据对应的分析结果,相较于仅依据医疗人员的学识经验确定分析结果,基于上述基于知识图谱的数据分析系统所得的分析结果提高了分析结果的规范性、精准性和可靠性。靠性。靠性。

【技术实现步骤摘要】
一种基于知识图谱的数据分析系统


[0001]本申请涉及计算机
,尤其涉及一种基于知识图谱的数据分析系统。

技术介绍

[0002]根据世界卫生组织国际癌症研究机构(IARC)近日发布的全球最新肿瘤负担数据,中国新发病例和死亡人数全球第一,肿瘤已经成为我国第一大死因。因肿瘤具有治疗周期较长、治疗方案多样化、治疗成本偏高等特点,为治愈肿瘤带来了挑战。在患者的治疗过程中可能因为环境、身体等原因出现病情变化,通过医疗人员的学识经验实现更新治疗方案建议,但不同医疗人员的学识经验专业程度不同,无法为患者提供科学可靠的病情分析结果。

技术实现思路

[0003]为了解决上述技术问题,本申请提供了一种基于知识图谱的数据分析系统。
[0004]在一个实施例中,提供了一种基于知识图谱的数据分析系统,包括:
[0005]数据库,用于对通过通信接口获取到的传输数据进行预处理,得到相应的处理数据;
[0006]服务器,与所述数据库连接,用于在检测到所述数据库中存在处理数据的情况下,根据所述处理数据更新本地存储的预设知识图谱,并根据更新后的预设知识图谱确定所述传输数据对应的分析结果;
[0007]交互设备,与所述服务器连接,用于显示所述分析结果。
[0008]在一个实施例中,所述数据库用于对通过通信接口获取到的传输数据进行预处理,得到相应的处理数据之前,
[0009]所述数据库还通过通信接口获取多源异构数据;
[0010]所述数据库对所述多源异构数据进行清洗过滤处理,得到有效数据;
[0011]所述服务器在检测到所述数据库中的有效数据的情况下,对所述有效数据进行特征提取,得到多个挖掘实体和挖掘实体关系;
[0012]所述服务器根据所述多个挖掘实体和挖掘实体关系构建所述预设知识图谱。
[0013]在一个实施例中,所述有效数据包括多种不同数据格式的内容数据,所述服务器对所述有效数据进行特征提取,得到多个挖掘实体和挖掘实体关系,包括:
[0014]所述服务器按照各个数据格式对应的数据处理方案分别对相应所述内容数据进行识别标注处理,得到相应的分类数据,其中,所述分类数据为带有分类标注的内容数据;
[0015]所述服务器对同一分类标注对应的所述分类数据进行特征提取处理,得到各个所述分类标注对应的所述挖掘实体和所述挖掘实体关系。
[0016]在一个实施例中,所述服务器根据所述多个挖掘实体和挖掘实体关系构建所述预设知识图谱,包括:
[0017]所述服务器通过所述数据库获取医学实体数据集和医学实体关系数据集,其中,
所述医学实体数据集包括多个医学实体,所述医学实体关系数据集包括多个医学实体关系;
[0018]所述服务器建立各个所述分类标注相应所述挖掘实体与所述医学实体数据集中医学实体之间的第一关联关系;
[0019]所述服务器建立各个所述分类标注相应所述挖掘实体关系与所述医学实体关系数据集中医学实体关系之间的第二关联关系;
[0020]所述服务器基于所述医学实体数据集、所述医学实体关系数据集、所述挖掘实体、所述挖掘实体关系、所述第一关联关系和所述第二关联关系,构建所述预设知识图谱。
[0021]在一个实施例中,所述服务器用于在检测到所述数据库中存在处理数据的情况下,根据所述处理数据更新预设知识图谱,并根据更新后的预设知识图谱确定所述传输数据对应的分析结果,包括:
[0022]所述服务器在检测到所述数据库中存在处理数据的情况下,对所述处理数据进行特征提取处理,得到目标特征;
[0023]所述服务器基于所述目标特征在预设知识图谱中的查询结果,将所述目标特征作为图谱元素添加至所述预设知识图谱中,得到更新后的预设知识图谱;
[0024]所述服务器基于所述更新后的预设知识图谱中与所述目标特征相关联的图谱元素,确定所述传输数据对应的分析结果。
[0025]在一个实施例中,所述目标特征包括至少一个目标实体以及与所述目标实体关联的目标实体关系,所述图谱元素包括节点和边,所述服务器基于所述目标特征在预设知识图谱中的查询结果,将所述目标特征作为图谱元素添加至所述预设知识图谱中,得到更新后的预设知识图谱,包括:
[0026]所述服务器在所述预设知识图谱中未查询到所述目标实体相应节点的情况下,将所述目标实体作为节点、所述目标实体关系作为边添加至所述预设知识图谱中,得到更新后的预设知识图谱。
[0027]在一个实施例中,所述服务器基于所述目标特征在预设知识图谱中的查询结果,将所述目标特征作为图谱元素添加至所述预设知识图谱中,得到更新后的预设知识图谱,包括以下至少之一:
[0028]所述服务器在所述预设知识图谱中查询到第一实体相应节点、但未查询到第二实体相应节点以及第一实体关系相应边的情况下,将所述第二实体作为节点、所述第一实体关系作为边添加至预设知识图谱中,得到更新后的预设知识图谱,其中,所述第一实体和所述第二实体为不同的所述目标实体,所述第一实体关系用于所述第一实体与所述第二实体之间的关联关系;
[0029]所述服务器在所述预设知识图谱中查询到所述第一实体相应节点、未查询到第二实体相应节点、但所述第一实体关系相应边的数量为1的情况下,将所述第二实体作为节点、所述第一实体关系作为边以及第一聚合节点添加至预设知识图谱中,得到更新后的预设知识图谱,其中,所述第一实体相应节点基于所述第一实体关系相应边依次与所述第一聚合节点、所述第二实体相应节点相连;
[0030]所述服务器在所述预设知识图谱中查询到所述第一实体相应节点、未查询到第二实体相应节点、但所述第一实体关系相应边的数量大于1的情况下,在所述预设知识图谱中
将所述第二实体作为节点、以所述第一实体关系作为边与第二聚合节点建立关联关系,得到更新后的预设知识图谱,其中,所述第二聚合节点为所述预设知识图谱中基于所述第一关系相应边,与所述第一实体相应节点相连的节点。
[0031]在一个实施例中,所述服务器基于所述目标特征在预设知识图谱中的查询结果,将所述目标特征作为图谱元素添加至所述预设知识图谱中,得到更新后的预设知识图谱,包括:
[0032]所述服务器在所述预设知识图谱中查询到各个所述目标实体的情况下,确定各个所述目标实体在所述预设知识图谱中的关联边的类型;
[0033]所述服务器基于各个所述目标实体对应关联边的类型,确定与所述目标实体关系类型相同的边数量;
[0034]所述服务器按照不同边数量对应的添加方案,将所述目标实体关系作为边添加至所述预设知识图谱中,得到更新后的预设知识图谱。
[0035]在一个实施例中,所述交互设备用于显示所述分析结果,包括:
[0036]所述交互设备用于显示目标子图谱,其中,所述目标子图谱为所述分析结果,所述目标子图谱包含所述更新后的预设知识图谱中与所述目标特征相关联的图谱元素。
[0037]在一个实施例中,所述交互设备还用于在接收到关于所述目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的数据分析系统,其特征在于,所述系统包括:数据库,用于对通过通信接口获取到的传输数据进行预处理,得到相应的处理数据;服务器,与所述数据库连接,用于在检测到所述数据库中存在处理数据的情况下,根据所述处理数据更新本地存储的预设知识图谱,并根据更新后的预设知识图谱确定所述传输数据对应的分析结果;交互设备,与所述服务器连接,用于显示所述分析结果。2.根据权利要求1所述的系统,其特征在于,所述数据库用于对通过通信接口获取到的传输数据进行预处理,得到相应的处理数据之前,所述数据库还通过通信接口获取多源异构数据;所述数据库对所述多源异构数据进行清洗过滤处理,得到有效数据;所述服务器在检测到所述数据库中的有效数据的情况下,对所述有效数据进行特征提取,得到多个挖掘实体和挖掘实体关系;所述服务器根据所述多个挖掘实体和挖掘实体关系构建所述预设知识图谱。3.根据权利要求2所述的系统,其特征在于,所述有效数据包括多种不同数据格式的内容数据,所述服务器对所述有效数据进行特征提取,得到多个挖掘实体和挖掘实体关系,包括:所述服务器按照各个数据格式对应的数据处理方案分别对相应所述内容数据进行识别标注处理,得到相应的分类数据,其中,所述分类数据为带有分类标注的内容数据;所述服务器对同一分类标注对应的所述分类数据进行特征提取处理,得到各个所述分类标注对应的所述挖掘实体和所述挖掘实体关系。4.根据权利要求3所述的系统,其特征在于,所述服务器根据所述多个挖掘实体和挖掘实体关系构建所述预设知识图谱,包括:所述服务器通过所述数据库获取医学实体数据集和医学实体关系数据集,其中,所述医学实体数据集包括多个医学实体,所述医学实体关系数据集包括多个医学实体关系;所述服务器建立各个所述分类标注相应所述挖掘实体与所述医学实体数据集中医学实体之间的第一关联关系;所述服务器建立各个所述分类标注相应所述挖掘实体关系与所述医学实体关系数据集中医学实体关系之间的第二关联关系;所述服务器基于所述医学实体数据集、所述医学实体关系数据集、所述挖掘实体、所述挖掘实体关系、所述第一关联关系和所述第二关联关系,构建所述预设知识图谱。5.根据权利要求1所述的系统,其特征在于,所述服务器用于在检测到所述数据库中存在处理数据的情况下,根据所述处理数据更新预设知识图谱,并根据更新后的预设知识图谱确定所述传输数据对应的分析结果,包括:所述服务器在检测到所述数据库中存在处理数据的情况下,对所述处理数据进行特征提取处理,得到目标特征;所述服务器基于所述目标特征在预设知识图谱中的查询结果,将所述目标特征作为图谱元素添加至所述预设知识图谱中,得到更新后的预设知识图谱;所述服务器基于所述更新后的预设知识图谱中与所述目标特征相关联的图谱元素,确定所述传输数据对应的分析结果。
6.根据权利要求5所述的系统,其特征在于,所述目标特征包括至少一个目标实体以及与所述目标实体关联的目标实体关系,所述图谱元素包括节点和边,所述服务器基于所述目标特征...

【专利技术属性】
技术研发人员:杨智陈冬涛张建孙鑫尧黄望攀
申请(专利权)人:骊拓上海数字科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1