【技术实现步骤摘要】
一种基于知识图谱的数据分析系统
[0001]本申请涉及计算机
,尤其涉及一种基于知识图谱的数据分析系统。
技术介绍
[0002]根据世界卫生组织国际癌症研究机构(IARC)近日发布的全球最新肿瘤负担数据,中国新发病例和死亡人数全球第一,肿瘤已经成为我国第一大死因。因肿瘤具有治疗周期较长、治疗方案多样化、治疗成本偏高等特点,为治愈肿瘤带来了挑战。在患者的治疗过程中可能因为环境、身体等原因出现病情变化,通过医疗人员的学识经验实现更新治疗方案建议,但不同医疗人员的学识经验专业程度不同,无法为患者提供科学可靠的病情分析结果。
技术实现思路
[0003]为了解决上述技术问题,本申请提供了一种基于知识图谱的数据分析系统。
[0004]在一个实施例中,提供了一种基于知识图谱的数据分析系统,包括:
[0005]数据库,用于对通过通信接口获取到的传输数据进行预处理,得到相应的处理数据;
[0006]服务器,与所述数据库连接,用于在检测到所述数据库中存在处理数据的情况下,根据所述处理数据更新本地存储的预设知识图谱,并根据更新后的预设知识图谱确定所述传输数据对应的分析结果;
[0007]交互设备,与所述服务器连接,用于显示所述分析结果。
[0008]在一个实施例中,所述数据库用于对通过通信接口获取到的传输数据进行预处理,得到相应的处理数据之前,
[0009]所述数据库还通过通信接口获取多源异构数据;
[0010]所述数据库对所述多源异构数据进行清洗过滤处理,得到 ...
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱的数据分析系统,其特征在于,所述系统包括:数据库,用于对通过通信接口获取到的传输数据进行预处理,得到相应的处理数据;服务器,与所述数据库连接,用于在检测到所述数据库中存在处理数据的情况下,根据所述处理数据更新本地存储的预设知识图谱,并根据更新后的预设知识图谱确定所述传输数据对应的分析结果;交互设备,与所述服务器连接,用于显示所述分析结果。2.根据权利要求1所述的系统,其特征在于,所述数据库用于对通过通信接口获取到的传输数据进行预处理,得到相应的处理数据之前,所述数据库还通过通信接口获取多源异构数据;所述数据库对所述多源异构数据进行清洗过滤处理,得到有效数据;所述服务器在检测到所述数据库中的有效数据的情况下,对所述有效数据进行特征提取,得到多个挖掘实体和挖掘实体关系;所述服务器根据所述多个挖掘实体和挖掘实体关系构建所述预设知识图谱。3.根据权利要求2所述的系统,其特征在于,所述有效数据包括多种不同数据格式的内容数据,所述服务器对所述有效数据进行特征提取,得到多个挖掘实体和挖掘实体关系,包括:所述服务器按照各个数据格式对应的数据处理方案分别对相应所述内容数据进行识别标注处理,得到相应的分类数据,其中,所述分类数据为带有分类标注的内容数据;所述服务器对同一分类标注对应的所述分类数据进行特征提取处理,得到各个所述分类标注对应的所述挖掘实体和所述挖掘实体关系。4.根据权利要求3所述的系统,其特征在于,所述服务器根据所述多个挖掘实体和挖掘实体关系构建所述预设知识图谱,包括:所述服务器通过所述数据库获取医学实体数据集和医学实体关系数据集,其中,所述医学实体数据集包括多个医学实体,所述医学实体关系数据集包括多个医学实体关系;所述服务器建立各个所述分类标注相应所述挖掘实体与所述医学实体数据集中医学实体之间的第一关联关系;所述服务器建立各个所述分类标注相应所述挖掘实体关系与所述医学实体关系数据集中医学实体关系之间的第二关联关系;所述服务器基于所述医学实体数据集、所述医学实体关系数据集、所述挖掘实体、所述挖掘实体关系、所述第一关联关系和所述第二关联关系,构建所述预设知识图谱。5.根据权利要求1所述的系统,其特征在于,所述服务器用于在检测到所述数据库中存在处理数据的情况下,根据所述处理数据更新预设知识图谱,并根据更新后的预设知识图谱确定所述传输数据对应的分析结果,包括:所述服务器在检测到所述数据库中存在处理数据的情况下,对所述处理数据进行特征提取处理,得到目标特征;所述服务器基于所述目标特征在预设知识图谱中的查询结果,将所述目标特征作为图谱元素添加至所述预设知识图谱中,得到更新后的预设知识图谱;所述服务器基于所述更新后的预设知识图谱中与所述目标特征相关联的图谱元素,确定所述传输数据对应的分析结果。
6.根据权利要求5所述的系统,其特征在于,所述目标特征包括至少一个目标实体以及与所述目标实体关联的目标实体关系,所述图谱元素包括节点和边,所述服务器基于所述目标特征...
【专利技术属性】
技术研发人员:杨智,陈冬涛,张建,孙鑫尧,黄望攀,
申请(专利权)人:骊拓上海数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。