本发明专利技术公开了一种海量医疗图像的处理系统、系统训练方法及图像标注方法,所述系统包括:据源层、数据采集层和数据存储层;所述数据源层,用于与若干架设置在医院的前置机连接,并分别从每架前置机中采集与存储前端医疗图像;所述数据采集层,采用数据采集组件flume,并用于将所述前置机中的医疗图像实时采集到大数据集群中;所述数据存储层,为包括基于大数据的分布式文件系统HDFS或基于Hadoop组件的MySQL数据库,并用于对大数据集群中的海量医疗图像进行标记、分类、存储、查看、管理。本发明专利技术可以通过Hadoop的大数据技术对海量医疗图像进行分类和存储,可以降低服务器的存储压力,也可以增加服务器的存储能力。也可以增加服务器的存储能力。也可以增加服务器的存储能力。
【技术实现步骤摘要】
海量医疗图像的处理系统、系统训练方法及图像标注方法
[0001]本专利技术涉及数据存储的
,尤其涉及一种海量医疗图像的处理系统、系统训练方法及图像标注方法。
技术介绍
[0002]随着人们生活水平不断提高,对生活健康的要求也不断增加,对身体健康的重视程度也逐渐增加。为了提高医疗服务水平和诊断效率,会采集求诊人士医疗图像,再由医生对医疗图像进行对应的诊断。
[0003]当求诊人士较多时,若每个人拍摄若干张医疗图像,会产生大量的医疗图像。为了应付海量的医疗图像,目前常用的方式是分别在每个科室或部门设置其内部对应的存储服务器,通过存储服务器分别对应科目的医疗图像。
[0004]但目前常用的存储方式有如下技术问题:由于每个科室的医疗图像是独立存储,当病人需要转移科室时,不同科室的医生难以调用医疗图像,降低了诊断效率,而且原有的独立存储服务器存储医疗图像的格式单一,当有不同类别或不同类型的医疗图像集汇存储时,占有的存储空间将成倍增加,大大增加了服务器的存储负担。
技术实现思路
[0005]本专利技术提出一种海量医疗图像的处理系统、系统训练方法及图像标注方法,所述系统可以对不同类型或不同格式的医疗图像进行分类和汇总存储,不但可以降低存储负担,也可以提高图像的调用效率。
[0006]本专利技术实施例的第一方面提供了一种海量医疗图像的处理系统,所述海量医疗图像的处理系统包括:数据源层、数据采集层和数据存储层;
[0007]所述数据源层,用于与若干架设置在医院的前置机连接,并分别从每架前置机中采集与存储前端医疗图像;
[0008]所述数据采集层,采用数据采集组件flume,并用于将所述前置机中的医疗图像实时采集到大数据集群中;
[0009]所述数据存储层,为包括基于大数据的分布式文件系统HDFS或基于Hadoop组件的MySQL数据库,并用于对大数据集群中的海量医疗图像进行标记、分类、存储、查看、管理。
[0010]在第一方面的一种可能的实现方式中,所述海量医疗图像的处理系统还包括:数据处理层;
[0011]所述数据处理层包括用于深度学习和训练的深度学习框架TensorFlow、用于图像计算的大数据计算引擎Spark组件、用于资源管理的Yarn服务、用于任务管理Oozie组件和协调服务的Zookeeper;
[0012]其中,所述深度学习框架TensorFlow分布式部署于大数据集群,并在大数据集群的每个节点均配置GPU。
[0013]在第一方面的一种可能的实现方式中,所述深度学习框架TensorFlow包括:
[0014]Spark Driver,用于为大数据集群Spark执行进程,并负责整个集群资源协调与分配,以控制各个节点服务器任务的启动;
[0015]Spark Executor,用于为Spark每个节点的管理进程;
[0016]HDFS图像数据集,用于为TensorFlow提供训练数据集。
[0017]在第一方面的一种可能的实现方式中,所述海量医疗图像的处理系统还包括:服务层;
[0018]所述服务层设有API应用服务接口,用于为系统后台提供接口服务。
[0019]在第一方面的一种可能的实现方式中,所述海量医疗图像的处理系统还包括:应用层;
[0020]所述应用层的服务前端采用Web框架:Ant Design Vue,所述应用层的服务后端采用Spring Boot框架;
[0021]所述应用层用于图像标注和模型训练。
[0022]在第一方面的一种可能的实现方式中,所述海量医疗图像的处理系统还包括:运维管理层;
[0023]所述运维管理层用于集群监控、Java虚拟机诊断和主机监控。
[0024]在第一方面的一种可能的实现方式中,所述海量医疗图像的处理系统还包括:安全管理层;
[0025]所述安全管理层采用基于kubernetes的分布式容器;
[0026]所述安全管理层用于数据安全管理。
[0027]在第一方面的一种可能的实现方式中,所述海量医疗图像的处理系统还包括:标准规范管理层;
[0028]所述标准规范管理层用于提供的标注规范管理。
[0029]本专利技术实施例的第二方面提供了一种系统训练方法,所述方法适用于如上所述的海量医疗图像的处理系统,所述方法包括:
[0030]在接收模型训练任务时,获取已完成的标注医疗图像数据集;
[0031]在接收与模型训练任务对应的算法模型后,获取训练所需的资源信息,其中,所述资源信息包括自定义资源信息和默认资源信息;
[0032]基于所述资源信息采用所述医疗图像数据集对所述算法模型进行模型训练生成模型文件,并将所述模型文件存储与基于Hadoop分布式文件系统。
[0033]本专利技术实施例的第三方面提供了一种图像标注方法,所述方法适用于如上所述的海量医疗图像的处理系统,所述方法包括:
[0034]从前置机实时采集待标注图像数据集;
[0035]按照与预设的科室分类目录对所述待标注图像数据集进行整理和归集处理,将所述待标注图像数据集分成若干个类别,类别包含多张待标注图像;
[0036]当接收管理人员创建的标注任务后,将所述标注任务对应的类别所包含多张待标注图像发送至标注人员,以供标注人员对每张待标注图像进行标注。
[0037]相比于现有技术,本专利技术实施例提供的一种海量医疗图像的处理系统、系统训练方法及图像标注方法,其有益效果在于:本专利技术公开的海量医疗图像的处理系统利用了Hadoop的大数据技术,可以解决海量医疗图像存储、标注以及训练的能力不足,克服在海量
图像的存储、训练时的服务器硬件资源不足的问题,并通过Hadoop的大数据技术对海量医疗图像进行分类和存储,可以降低服务器的存储压力,也可以增加服务器的存储能力。
附图说明
[0038]图1是本专利技术一实施例提供的一种海量医疗图像的处理系统的结构示意图;
[0039]图2是本专利技术一实施例提供的一种深度学习框架TensorFlow的结构示意图;
[0040]图3是本专利技术一实施例提供的一种系统训练方法的流程示意图;
[0041]图4是本专利技术一实施例提供的一种系统训练方法的操作流程图;
[0042]图5是本专利技术一实施例提供的一种图像标注方法的流程示意图;
[0043]图6是本专利技术一实施例提供的一种图像标注方法的操作流程图。
具体实施方式
[0044]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0045]目前常用的存储方式有如下技术问题:由于每个科室的医疗图像是独立存储,当病人需要转移科室时,不同科室的医生难以调本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种海量医疗图像的处理系统,其特征在于,所述海量医疗图像的处理系统包括:数据源层、数据采集层和数据存储层;所述数据源层,用于与若干架设置在医院的前置机连接,并分别从每架前置机中采集与存储前端医疗图像;所述数据采集层,采用数据采集组件flume,并用于将所述前置机中的医疗图像实时采集到大数据集群中;所述数据存储层,为包括基于大数据的分布式文件系统HDFS或基于Hadoop组件的MySQL数据库,并用于对大数据集群中的海量医疗图像进行标记、分类、存储、查看、管理。2.根据权利要求1所述的海量医疗图像的处理系统,其特征在于,所述海量医疗图像的处理系统还包括:数据处理层;所述数据处理层包括用于深度学习和训练的深度学习框架TensorFlow、用于图像计算的大数据计算引擎Spark组件、用于资源管理的Yarn服务、用于任务管理Oozie组件和协调服务的Zookeeper;其中,所述深度学习框架TensorFlow分布式部署于大数据集群,并在大数据集群的每个节点均配置GPU。3.根据权利要求2所述的海量医疗图像的处理系统,其特征在于,所述深度学习框架TensorFlow包括:Spark Driver,用于为大数据集群Spark执行进程,并负责整个集群资源协调与分配,以控制各个节点服务器任务的启动;Spark Executor,用于为Spark每个节点的管理进程;HDFS图像数据集,用于为TensorFlow提供训练数据集。4.根据权利要求1所述的海量医疗图像的处理系统,其特征在于,所述海量医疗图像的处理系统还包括:服务层;所述服务层设有API应用服务接口,用于为系统后台提供接口服务。5.根据权利要求1所述的海量医疗图像的处理系统,其特征在于,所述海量医疗图像的处理系统还包括:应用层;所述应用层的服务前端采用Web框架:...
【专利技术属性】
技术研发人员:林浩添,云东源,刘力学,吴晓航,晏丕松,
申请(专利权)人:云智道智慧医疗科技广州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。