本发明专利技术提供了一种患者数据分块系统,包括:获取单元,获取每个镜像服务器的患者信息作为待处理信息;模块划分单元,根据预设数据量将待处理信息划分为多个数据模块;匹配单元,在多个数据模块中提取一个数据模块作为目标基准数据块,根据目标数据项在目标基准数据块中查询与目标数据项相匹配的数据作为目标基准项,根据目标基准项在其他数据模块中查询与目标基准项相匹配的患者信息;数据划分单元,将匹配单元查询到的与目标基准项相匹配的患者信息划分至目标基准数据块。本申请还提出了一种患者数据分块方法。通过本发明专利技术的技术方案,能够将患者信息进行分块处理,再进行匹配,提高建立患者主索引的速度,并减少内存的使用量。
【技术实现步骤摘要】
患者数据分块系统和方法
本专利技术涉及数据处理
,具体而言,涉及一种患者数据分块系统和一种患者数据分块方法。
技术介绍
在建立患者主索引的过程中,需要提取多个医疗系统中的患者信息,并依次匹配每个患者信息,以确定相同的患者信息,从而建立一位患者的主索引,当前数据库记录数庞大,如果通过传统方式建立患者主索引运算量十分巨大,并且对内存的效果也很大,容易造成内存的浪费和操作延迟。因此,需要一种新的数据匹配技术,能够将患者信息进行分块处理,再进行匹配,提高建立患者主索引的速度,并减少内存的使用量。
技术实现思路
本专利技术正是基于上述问题,提出了一种数据匹配技术,能够将患者信息进行分块处理,再进行匹配,提高建立患者主索引的速度,并减少内存的使用量。有鉴于此,本专利技术提出了一种患者数据分块系统,包括:获取单元,用于获取多个镜像服务器中每个镜像服务器的患者信息作为待处理信息;模块划分单元,用于根据预设数据量,将所述待处理信息划分为与所述预设数据量相应的多个数据模块;匹配单元,用于在所述多个数据模块中提取一个数据模块作为目标基准数据块,并根据目标数据项在所述目标基准数据块中查询与所述目标数据项相匹配的数据,以作为目标基准项,根据所述目标基准项在所述多个数据模块的其他数据模块中查询与所述目标基准项相匹配的患者信息;数据划分单元,用于将所述匹配单元查询到的与所述目标基准项相匹配的患者信息划分至所述目标基准数据块。在该技术方案中,在将每个医疗系统对应的镜像服务器中的患者信息进行匹配时,可以从待处理信息中取出部分患者信息(即目标基准数据块),然后在这部分患者信息中,确定存在相同数据项(一个或多个)的患者信息,比如存在相同姓名、相同生日、相同性别和/或相同证件号等,那么这些患者信息是可能存在关联的患者信息,可以划分在一个数据块中,然后根据这个数据块对应的数据项,在其他患者信息中查询与该数据块中的患者信息存在关联的患者信息,也划分至该数据块,从而完成一个数据块的划分,那么在建立患者主索引时,则可以直接在该数据块内进行数据匹配,确定该数据块内患者的主索引,提高建立患者主索引的速度,并减少内存的使用量。其中,对以初次分配患者数据块大小,也可以按照患者年纪区间进行初步选取。在上述技术方案中,优选地,所述匹配单元还用于在所述其他数据模块中提取一个数据模块作为其他基准数据模块,并根据其他数据项在所述其他基准数据块中查询与所述其他数据项相匹配的数据,以作为其他基准项,根据所述其他基准项在所述多个数据模块的中异于所述其他基准模块的数据模块中查询与所述其他基准项相匹配的患者信息;所述数据划分单元还用于将所述匹配单元查询到的与所述其他基准项相匹配的患者信息划分至所述其他基准数据块。在上述技术方案中,优选地,还包括:标识生成单元,用于根据所述目标基准项,生成对应于所述目标基准数据块的标识。在该技术方案中,可以将待处理信息划分为多个数据块,以及不与任何数据块对应的数据项匹配的患者信息,那么在建立患者主索引时,可以将每个数据块的数据与各自数据块内的患者信息进行匹配,从而提高患者信息匹配的速度,进而提高建立患者主索引的速度,并减少内存的使用量,其中,可以根据每个基准数据块中的标准项生成对应于该数据块的标识,以便于用户进行人工查询。在上述技术方案中,优选地,还包括:标识设置单元,用于将所述多个数据块按照各自包含患者信息的数目由小到大设置标识,其中,若所述数据块按照所述标识从小到大排序依次为数据块X1、数据块X2、数据块X3……数据块Xn,所述数据划分单元用于根据所述数据块X1对应的第一数据项,从数据块X2、数据块X3……数据块Xn中获取包含所述第一数据项的患者信息,并划分至所述数据块X1,所述数据划分单元用于根据所述数据块X2对应的数据项,从数据块X3、数据块X4……数据块Xn中获取包含所述数据项的患者信息,并划分至所述数据块X2,所述数据划分单元还用于根据多个数据项将所述待处理信息划分为与所述多个数据项对应的多个数据块,直至将从数据块Xn中获取的包含第n-1数据项的患者信息划分至数据块Xn-1。在该技术方案中,可以按照包含患者信息数目的由小到大为每个数据块设置标识,包含患者信息少的数据块可以从比其包含患者信息多的数据块中查询包含相应数据项的患者信息,并将该患者信息划分至包含患者信息少的数据块,经过多次划分,可以均衡每个数据块中的患者信息数目,从而在将每个数据块中的患者信息进行匹配时,可以避免内存浪费,并可以进一步提高患者主索引的建立速度。比如共存在100个患者信息,划分为4个数据块,分别是第一数据块,包含10个患者信息,对应的数据项为“姓名:张三”;第二数据块,包含20个患者信息,对应的数据项为“性别:男”;第三数据块,包含30个患者信息,对应的数据项为“年龄:30”、第四数据块,包含40个患者信息,对应的数据项为“生日:1982.9.28”。那么第一数据块可以从第二数据块、第三数据块和第四数据块中获取包含数据项为“姓名:张三”的患者信息,并将获取到的患者信息存储至第一数据块;第二数据块可以从第三数据块和第四数据块中获取包含数据项为“性别:男”的患者信息,并将获取到的患者信息存储至第二数据块;那么第三数据块可以第四数据块中获取包含数据项为“生日:1982.9.28”的患者信息,并将获取到的患者信息存储至第三数据块,经过患者信息的重新划分,第一数据块、第二数据块、第三数据块和第四数据块中的包含的患者信息数目变为22、24、26和28,对于内存固定的系统,处理相对均匀的数据较处理不均匀的数据速度较快,且可以减少内存的浪费。在上述技术方案中,优选地,所述标识设置单元用于通过递归关联将所述多个数据块按照各自包含患者信息的数目由小到大设置标识。根据本专利技术的又一方面,还提出了一种患者数据分块方法,包括:步骤202,获取多个镜像服务器的患者信息作为待处理信息,根据预设数据量,将所述待处理信息划分为与所述预设数据量相应的多个数据模块;步骤204,在所述多个数据模块中提取一个数据模块作为目标基准数据块,并根据目标数据项在所述目标基准数据块中查询与所述目标数据项相匹配的数据,以作为目标基准项,根据所述目标基准项在所述多个数据模块的其他数据模块中查询与所述目标基准项相匹配的患者信息;步骤206,将所述查询到的与所述目标基准项相匹配的患者信息划分至所述目标基准数据块。在该技术方案中,在将每个医疗系统对应的镜像服务器中的患者信息进行匹配时,可以从待处理信息中取出部分患者信息,然后在这部分患者信息中,确定存在相同数据项(一个或多个)的患者信息,比如存在相同姓名、相同生日、相同性别和/或相同证件号等,那么这些患者信息是可能存在关联的患者信息,可以划分在一个数据块中,然后根据这个数据块对应的数据项,在其他患者信息中查询与该数据块中的患者信息存在关联的患者信息,也划分至该数据块,从而完成一个数据块的划分,那么在建立患者主索引时,则可以直接在该数据块内进行数据匹配,确定该数据块内患者的主索引,提高建立患者主索引的速度,并减少内存的使用量。在上述技术方案中,优选地,还包括:步骤208,在所述其他数据模块中提取一个数据模块作为其他基准数据模块,并根据其他数据项在所本文档来自技高网...
【技术保护点】
一种患者数据分块系统,其特征在于,包括:获取单元,用于获取多个镜像服务器中每个镜像服务器的患者信息作为待处理信息;模块划分单元,用于根据预设数据量,将所述待处理信息划分为与所述预设数据量相应的多个数据模块;匹配单元,用于在所述多个数据模块中提取一个数据模块作为目标基准数据块,并根据目标数据项在所述目标基准数据块中查询与所述目标数据项相匹配的数据,以作为目标基准项,根据所述目标基准项在所述多个数据模块的其他数据模块中查询与所述目标基准项相匹配的患者信息;数据划分单元,用于将所述匹配单元查询到的与所述目标基准项相匹配的患者信息划分至所述目标基准数据块。
【技术特征摘要】
1.一种患者数据分块系统,其特征在于,包括:获取单元,用于获取多个镜像服务器中每个镜像服务器的患者信息作为待处理信息;模块划分单元,用于根据预设数据量,将所述待处理信息划分为与所述预设数据量相应的多个数据模块;匹配单元,用于在所述多个数据模块中提取一个数据模块作为目标基准数据模块,并根据目标数据项在所述目标基准数据模块中查询与所述目标数据项相匹配的数据,以作为目标基准项,根据所述目标基准项在所述多个数据模块的其他数据模块中查询与所述目标基准项相匹配的患者信息;数据划分单元,用于将所述匹配单元查询到的与所述目标基准项相匹配的患者信息划分至所述目标基准数据模块。2.根据权利要求1所述的患者数据分块系统,其特征在于,所述匹配单元还用于在所述其他数据模块中提取一个数据模块作为其他基准数据模块,并根据其他数据项在所述其他基准数据模块中查询与所述其他数据项相匹配的数据,以作为其他基准项,根据所述其他基准项在所述多个数据模块的中异于所述其他基准模块的数据模块中查询与所述其他基准项相匹配的患者信息;所述数据划分单元还用于将所述匹配单元查询到的与所述其他基准项相匹配的患者信息划分至所述其他基准数据模块。3.根据权利要求1所述的患者数据分块系统,其特征在于,还包括:标识生成单元,用于根据所述目标基准项,生成对应于所述目标基准数据模块的标识。4.根据权利要求1所述的患者数据分块系统,其特征在于,还包括:标识设置单元,用于将所述多个数据模块按照各自包含患者信息的数目由小到大设置标识,其中,若所述数据模块按照所述标识从小到大排序依次为数据模块X1、数据模块X2、数据模块X3……数据模块Xn,所述数据划分单元用于根据所述数据模块X1对应的数据项,从数据模块X2、数据模块X3……数据模块Xn中获取包含所述数据项的患者信息,并划分至所述数据模块X1,所述数据划分单元还用于根据所述数据模块X2对应的数据项,从数据模块X3、数据模块X4……数据模块Xn中获取包含所述数据项的患者信息,并划分至所述数据模块X2,所述数据划分单元还用于根据多个数据项将所述待处理信息划分为与所述多个数据项对应的多个数据模块,直至将从数据模块Xn中获取的包含第n-1数据项的患者信息划分至数据模块Xn-1,n为大于或等于2的自然数。5.根据权利要求4所述的患者数据分块系统,其特征在于,所述标识设置单元用于通过递归关联将所述多个...
【专利技术属性】
技术研发人员:李登高,张恒,
申请(专利权)人:方正国际软件有限公司,方正国际软件北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。