多平台相似医疗数据去除方法、装置及设备制造方法及图纸

技术编号:28627969 阅读:22 留言:0更新日期:2021-05-28 16:24
本发明专利技术涉及一种多平台相似医疗数据去除方法、装置及设备,属于数据过滤技术领域,方法包括通过多个目标医疗平台获取患者基础信息,并建立所述患者基础信息的患者主索引;通过所述患者主索引,定位单一患者的诊断信息;根据马氏距离计算所述诊断信息之间的相似度;判断所述相似度与相似阈值的大小,获取相似度高于所述相似阈值的患者基础信息。本发明专利技术通过扩展患者主索引建立方式以及通过内容相似性算法,对医院内部多平台进行互联互通时产生的大量相似医疗数据进行有效判定,根据业务需要进行清除或修改,保证数据分析的准确性,以解决现有技术中重复数据清洗方法存在数据清洗不彻底、依然存在很多重复数据的技术问题。

【技术实现步骤摘要】
多平台相似医疗数据去除方法、装置及设备
本专利技术属于数据过滤
,具体涉及一种多平台相似医疗数据去除方法、装置及设备。
技术介绍
通过在医院内部各个系统建立患者主索引(EnterpriseMasterPatientIndex,EMPI),打破医疗信息化中的孤岛效应实现区域乃至跨区域的医疗信息整合,其中尤为重要的是对大量重复数据可以进行定位清洗。在现有的医疗卫生行业内通常通过EMPI去除重复数据,主要为先判断患者是否是同一人,再进行诊断内容匹配。其中判断患者是否同一人目前主流的技术方案有3种:采集患者的自然信息,如姓名、出生日期和住宿地址;采集患者身份识别信息,如身份证、社保卡、护照以及军人证等;采集服务记录,如门诊流水号、住院流水号等。对于内容重复判定,通常是通过关键字匹配、ICD(internationalClassificationofdiseases,国际疾病分类)编码匹配等传统方案进行验证。现有技术虽然能清除部分重复数据,但遇到诸如不同系统对病种描述有区别,诊断医生手动录入有缩写或者病案编码人员对病案理解的不同等情况,一些内容相似的重复数据就只能靠人工进行识别。因此,现有技术中重复数据清洗方法存在数据清洗不彻底、依然存在很多重复数据的技术问题。
技术实现思路
本专利技术提供了一种多平台相似医疗数据去除方法、装置及设备,通过扩展患者主索引建立方式以及通过内容相似性算法,对医院内部多平台进行互联互通时产生的大量相似医疗数据进行有效判定,根据业务需要进行清除或修改,保证数据分析的准确性,以解决现有技术中重复数据清洗方法存在数据清洗不彻底、依然存在很多重复数据的技术问题。本专利技术提供的技术方案如下:一方面,一种多平台相似医疗数据去除方法,包括:通过多个目标医疗平台获取患者基础信息,并建立所述患者基础信息的患者主索引,所述患者主索引,包括:基础患者主索引和扩展患者主索引,所述患者基础信息包括:自然信息、身份识别信息和服务信息;所述建立所述患者基础信息的患者主索引,包括:判断所述目标医疗平台是否关联生物特征采集设备;若所述目标医疗平台未关联生物特征采集设备,则建立所述患者基础信息的基础患者主索引;若所述目标医疗平台关联生物特征采集设备,则建立所述患者基础信息的扩展患者主索引;通过所述患者主索引,定位单一患者的诊断信息,所述诊断信息包括诊疗信息和辅助诊疗信息;根据马氏距离计算所述诊断信息之间的相似度;判断所述相似度与相似阈值的大小,获取相似度高于所述相似阈值的诊断信息,以使用户人工去除患者相似的诊断信息。可选的,所述判断所述目标医疗平台是否关联生物特征采集设备,包括:判断所述患者基础信息中是否包含生物特征信息,所述生物特征信息包括:掌静脉信息和指纹信息;所述若所述目标医疗平台未关联生物特征采集设备,则建立所述患者基础信息的基础患者主索引,包括:若所述患者基础信息中不包含生物特征信息,则建立所述患者基础信息的基础患者主索引;所述若所述目标医疗平台关联生物特征采集设备,则建立所述患者基础信息的扩展患者主索引,包括:若所述患者基础信息中包含生物特征信息,则建立所述患者基础信息的扩展患者主索引。可选的,所述根据马氏距离计算所述诊断信息之间的相似度,还包括:判断预先构建的逆矩阵是否满秩;若所述预先构建的逆矩阵不满秩,则通过主成分分析对所述患者基础信息进行降维。可选的,还包括:基于测试集,确定所述相似阈值。又一方面,一种多平台相似医疗数据去除装置,包括:获取模块、定位确定模块、计算模块和判断模块;所述获取模块,用于通过多个目标医疗平台获取患者基础信息,并建立所述患者基础信息的患者主索引,所述患者主索引,包括:基础患者主索引和扩展患者主索引,所述患者基础信息包括:自然信息、身份识别信息和服务信息;用于判断所述目标医疗平台是否关联生物特征采集设备;若所述目标医疗平台未关联生物特征采集设备,则建立所述患者基础信息的基础患者主索引;若所述目标医疗平台关联生物特征采集设备,则建立所述患者基础信息的扩展患者主索引;所述定位确定模块,用于通过所述患者主索引,定位单一患者的诊断信息,所述诊断信息包括诊疗信息和辅助诊疗信息;所述计算模块,用于根据马氏距离计算所述诊断信息之间的相似度;所述判断模块,用于判断所述相似度与相似阈值的大小,获取相似度高于所述相似阈值的诊断信息,以使用户人工去除患者相似的诊断信息。可选的,所述定位确定模块,用于判断所述患者基础信息中是否包含生物特征信息,所述生物特征信息包括:掌静脉信息和指纹信息;若所述患者基础信息中不包含生物特征信息,则建立所述患者基础信息的基础患者主索引;若所述患者基础信息中包含生物特征信息,则建立所述患者基础信息的扩展患者主索引。可选的,所述计算模块,用于判断预先构建的逆矩阵是否满秩;若所述预先构建的逆矩阵不满秩,则通过主成分分析对所述患者基础信息进行降维。又一方面,一种多平台相似医疗数据去除设备,包括:处理器,以及与所述处理器相连接的存储器;所述存储器用于存储计算机程序,所述计算机程序至少用于执行上述任一项所述的多平台相似医疗数据去除方法;所述处理器用于调用并执行所述存储器中的所述计算机程序。本专利技术的有益效果为:本专利技术实施例提供的多平台相似医疗数据去除方法、装置及设备,通过多个目标医疗平台获取患者基础信息,并建立所述患者基础信息的患者主索引,所述患者基础信息包括:自然信息、身份识别信息和服务信息;通过所述患者主索引,定位单一患者的诊断信息,所述诊断信息包括诊疗信息和辅助诊疗信息;根据马氏距离计算所述诊断信息之间的相似度;判断所述相似度与相似阈值的大小,获取相似度高于所述相似阈值的患者基础信息。本专利技术通过扩展患者主索引建立方式以及通过内容相似性算法,对医院内部多平台进行互联互通时产生的大量相似医疗数据进行有效判定,根据业务需要进行清除或修改,保证数据分析的准确性,以解决现有技术中重复数据清洗方法存在数据清洗不彻底、依然存在很多重复数据的技术问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种多平台相似医疗数据去除方法的流程示意图;图2为本专利技术实施例提供的一种多平台相似医疗数据去除装置的结构示意图;图3为本专利技术实施例提供的一种多平台相似医疗数据去除设备的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有本文档来自技高网...

【技术保护点】
1.一种多平台相似医疗数据去除方法,其特征在于,包括:/n通过多个目标医疗平台获取患者基础信息,并建立所述患者基础信息的患者主索引,所述患者主索引,包括:基础患者主索引和扩展患者主索引,所述患者基础信息包括:自然信息、身份识别信息和服务信息;/n所述建立所述患者基础信息的患者主索引,包括:判断所述目标医疗平台是否关联生物特征采集设备;若所述目标医疗平台未关联生物特征采集设备,则建立所述患者基础信息的基础患者主索引;若所述目标医疗平台关联生物特征采集设备,则建立所述患者基础信息的扩展患者主索引;/n通过所述患者主索引,定位单一患者的诊断信息,所述诊断信息包括诊疗信息和辅助诊疗信息;/n根据马氏距离计算所述诊断信息之间的相似度;/n判断所述相似度与相似阈值的大小,获取相似度高于所述相似阈值的诊断信息,以使用户人工去除患者相似的诊断信息。/n

【技术特征摘要】
1.一种多平台相似医疗数据去除方法,其特征在于,包括:
通过多个目标医疗平台获取患者基础信息,并建立所述患者基础信息的患者主索引,所述患者主索引,包括:基础患者主索引和扩展患者主索引,所述患者基础信息包括:自然信息、身份识别信息和服务信息;
所述建立所述患者基础信息的患者主索引,包括:判断所述目标医疗平台是否关联生物特征采集设备;若所述目标医疗平台未关联生物特征采集设备,则建立所述患者基础信息的基础患者主索引;若所述目标医疗平台关联生物特征采集设备,则建立所述患者基础信息的扩展患者主索引;
通过所述患者主索引,定位单一患者的诊断信息,所述诊断信息包括诊疗信息和辅助诊疗信息;
根据马氏距离计算所述诊断信息之间的相似度;
判断所述相似度与相似阈值的大小,获取相似度高于所述相似阈值的诊断信息,以使用户人工去除患者相似的诊断信息。


2.根据权利要求1所述的多平台相似医疗数据去除方法,其特征在于,所述判断所述目标医疗平台是否关联生物特征采集设备,包括:判断所述患者基础信息中是否包含生物特征信息,所述生物特征信息包括:掌静脉信息和指纹信息;
所述若所述目标医疗平台未关联生物特征采集设备,则建立所述患者基础信息的所述基础患者主索引,包括:若所述患者基础信息中不包含生物特征信息,则建立所述患者基础信息的基础患者主索引;
所述若所述目标医疗平台关联生物特征采集设备,则建立所述患者基础信息的所述扩展患者主索引,包括:若所述患者基础信息中包含生物特征信息,则建立所述患者基础信息的扩展患者主索引。


3.根据权利要求1所述的多平台相似医疗数据去除方法,其特征在于,所述根据马氏距离计算所述诊断信息之间的相似度,还包括:
判断预先构建的逆矩阵是否满秩;
若所述预先构建的逆矩阵不满秩,则通过主成分分析对所述患者基础信息进行降维。


4.根据权利要求1所述的多平台相似医疗数据去除方法,其特征在于,还包括:基于测试集,确定所述相...

【专利技术属性】
技术研发人员:杨开轶包培文侯文利
申请(专利权)人:北京冠新医卫软件科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1