本发明专利技术涉及图像数据处理领域,针对训练数据不足的问题,提出了一种基于图像特征细化的数据预处理方法及系统,所述方法包括:有效区域计算步骤,对原图片进行mask处理得到训练图片,计算训练图片的有效区域,有效区域包括正样本区域和负样本区域;训练数据采集步骤,构建滑动窗口,移动滑动窗口在训练图片上的位置,当滑动窗口的数字中心位于有效区域的边界或内部时,采集训练数据。本发明专利技术能解决现有图像处理方法存在的采集训练数据不足的问题。本发明专利技术还公开了一种基于图像特征细化的数据预处理系统。
A Data Preprocessing Method and System Based on Image Feature Refinement
【技术实现步骤摘要】
一种基于图像特征细化的数据预处理方法及系统
本专利技术涉及图像数据处理领域,具体涉及一种基于图像特征细化的数据预处理方法及系统。
技术介绍
随着深度学习的发展日趋火热,越来越多的深度学习算法运用到医疗行业中,医学图像的计算机处理就是一个运用较为活跃的方向。通过计算机辅助诊断,快速确认是否存在患病特征,降低医生寻找患病特征的时间,提高患病诊断的效率。例如识别病灶、判断癌变程度等。但是对于医疗图像数据而言,其与人脸、猫狗、车辆等常见的深度学习数据不同,其受到医学问题的难度、复杂度和维度的影响,数据存在极大的稀缺性。对于图像数据的处理,公开号为CN107133942A公开了一种基于深度学习的医疗图像处理方法,包括如下步骤:选用标注好的医疗训练集图像对迁移的神经网络模型进行训练和适配,获得经过训练的医疗诊断模型;根据所述医疗诊断模型的要求转换医疗图片的图像格式,并对所述医疗图片进行图像增强处理;提取所述医疗图片的瓶颈特征,利用所述医疗诊断模型根据所述瓶颈特征进行影像诊断,并输出诊断结果。上述方案虽然能全自动化地处理医学图像,但是使用深度学习进行模型训练解决行业问题至少需要几十万的训练数据,而现有的医疗图像数据稀缺,采用上述图像处理方法存在无效训练数据过多的问题,这导致通过深度学习方法训练的模型的预测效果不好。
技术实现思路
本专利技术的目的在于提供一种基于图像特征细化的数据预处理方法及系统,能避免现有图像处理方法存在的获取训练数据不足的问题。本专利技术提供的基础方案为:一种基于图像特征细化的数据预处理方法,包括以下步骤:有效区域计算步骤,对原图片进行mask处理得到训练图片,计算训练图片的有效区域;训练数据采集步骤,构建滑动窗口,移动滑动窗口在训练图片上的位置,当滑动窗口的数字中心位于有效区域的边界或内部时,采集训练数据。本专利技术的有益效果:1)通过mask处理得到有效区域,并在有效区域内采集训练数据,保证训练数据的准确性,避免采集无效数据,提升后续的深度学习效果;2)通过滑动窗口实现图像的细化(滑动窗口的尺寸远小于训练图片尺寸),能有效的增加训练数据,为医疗图像数据的深度学习提供了可行性。本方案能解决现有图像处理方法存在的采集的训练数据不足的问题。进一步,有效区域包括正样本区域和负样本区域。有益效果:通过对正样本和负样本的区分,实现对训练数据的区分,有利于更好地辅助深度学习训练。进一步,所述方法还包括:深度学习步骤,将采集得到的训练数据用于深度学习训练,确定训练图片的某个像素在原图片中对应的像素,计算得到原图片像素与训练图片像素的映射关系。进一步,计算映射关系的公式为:进一步,训练数据采集步骤中还包括:构建滑动窗口子步骤,构建一个矩形的滑动窗口;滑动窗口分类子步骤,移动滑动窗口在训练图片上的位置,判断滑动窗口的数字中心是否在有效区域的边界或内部,若是,对滑动窗口进行分类;训练数据采集子步骤,当滑动窗口的数字中心在有效区域的边界或内部时,在滑动窗口的区域内采集训练数据,并根据滑动窗口的类型确定训练数据的类型。有益效果:通过建立滑动窗口和对滑动窗口的分类,实现了图像特征的细化,在图像特征细化后采集训练数据,能实现从少量数据中采集大量训练数据的效果,给医疗图像数据的深度学习方法提供了可行性。进一步,滑动窗口分类子步骤中,若滑动窗口的数学中心点位于正样本区域,则将滑动窗口标记为正样本;若滑动窗口的数学中心点位于负样本区域,则将滑动窗口标记为负样本。有益效果:对滑动窗口进行分类,有利于对采集地训练数据进行分类,从而更好的实现医疗图像数据的深度学习。进一步,训练数据采集子步骤中,采集训练数据的方法:随机采样y个点,并且以这y个点为中心,建立y个尺寸与滑动窗口相同的矩形框,采集矩形框区域内的数据作为训练数据。有益效果:通过在互动框内建立多个中心和多个矩形框,进一步扩充了对训练数据的采集基础,能有效地增加训练数据。进一步,训练数据采集子步骤中,若滑动窗口标记为正样本,则该滑动窗口内采集的训练数据计为正样本训练数据;若滑动窗口标记为负样本,则该滑动窗口内采集的训练数据计为负样本训练数据。有益效果:对训练数据的分类有利于更好的实现医疗图像数据的深度学习。本方案还公开了一种基于图像特征细化的数据预处理系统,包括:相对位置计算模块,用于并计算滑动窗口的数字中心与有效区域的相对位置,当滑动窗口的数字中心位于有效区域的边界或内部时,发出数据采集信号;数据采集分类模块,用于获取数据采集信号,采集滑动窗口内的数据作为训练数据,并对训练数据进行分类;深度训练模块,用于获取训练数据,将训练数据用于深度学习训练,计算原图片像素与训练图片像素的映射关系。有益效果:通过滑动窗口实现图像的特征细化(因为滑动窗口的尺寸远小于训练图片尺寸),能有效的增加训练数据,为医疗图像数据的深度学习提供了可行性。本方案能解决进一步,所述系统还包括:掩膜计算模块,用于获取原图片,对原图片进行mask处理得到训练图片,计算训练图片的有效区域;滑动窗口构建模块,用于构建矩形的滑动窗口,并移动滑动窗口在训练图片上的位置。有益效果:通过mask处理得到有效区域,并在有效区域内采集训练数据,保证训练数据的准确性,避免采集无效数据,提升后续的训练效果。附图说明图1为本实施例一中数据预处理方法的逻辑框图;图2为本实施例一中S2步骤的子步骤的逻辑框图;图3为本实施例一中原图片的示意图;图4为本实施例一中训练图片的示意图;图5为本实施例一中采集正样本训练数据的示意图;图6为本实施例一中采集负样本训练数据的示意图;图7为本实施例二中数据预处理系统的逻辑框图。具体实施方式下面通过具体实施方式进一步详细的说明:实施例一:如图1所示:一种基于图像特征细化的数据预处理方法,包括以下步骤:S1:有效区域计算步骤,对原图片进行mask处理得到训练图片,计算训练图片的有效区域。有效区域包括正样本区域和负样本区域,通过opencv进行mask处理计算出有效区域的数值,正样本区域的正样本为专业医生进行手动标注得到,负样本区域的负样本为正样本以外的区域。S2:训练数据采集步骤,构建滑动窗口,移动滑动窗口在训练图片上的位置,当滑动窗口的数字中心位于有效区域的边界或内部时,采集训练数据。S3:深度学习步骤,将采集得到的训练数据用于深度学习训练,确定训练图片的某个像素在原图片中对应的像素,计算得到原图片像素与训练图片像素的映射关系,并构建预测模型。预测模型的构建采用现有的深度学习方法实现。其中,计算映射关系的公式为:其中f(x,y)为某个像素点原图坐标,g(x,y)为训练图中某个像素点坐标,2n为原图与训练图之间的缩放比率。其中,如图2所示:S2步骤还包括:S201:构建滑动窗口子步骤,构建一个矩形的滑动窗口。构造一个n*n的矩形滑动窗口,滑动窗口的长度n需要远小于训练图片的长和宽。S202:滑动窗口分类子步骤,移动滑动窗口在训练图片上的位置,判断滑动窗口的数字中心是否在有效区域的边界或内部,若是,对滑动窗口进行分类。从训练图片的左上角位置开始进行平行滑动,每次移动步长为n个单位长度,然后我们判断滑动窗口的数学中心点是否在有效区域的边界或内部,如果在有效区域的边界或内部,则对滑动窗口进行分类:若滑动窗口的数学中心点位本文档来自技高网...
【技术保护点】
1.一种基于图像特征细化的数据预处理方法,其特征在于,包括以下步骤:有效区域计算步骤,对原图片进行mask处理得到训练图片,计算训练图片的有效区域;训练数据采集步骤,构建滑动窗口,移动滑动窗口在训练图片上的位置,当滑动窗口的数字中心位于有效区域的边界或内部时,采集训练数据。
【技术特征摘要】
1.一种基于图像特征细化的数据预处理方法,其特征在于,包括以下步骤:有效区域计算步骤,对原图片进行mask处理得到训练图片,计算训练图片的有效区域;训练数据采集步骤,构建滑动窗口,移动滑动窗口在训练图片上的位置,当滑动窗口的数字中心位于有效区域的边界或内部时,采集训练数据。2.根据权利要求1所述的一种基于图像特征细化的数据预处理方法,其特征在于:有效区域包括正样本区域和负样本区域。3.根据权利要求1所述的一种基于图像特征细化的数据预处理方法,其特征在于,还包括:深度学习步骤,将采集得到的训练数据用于深度学习训练,确定训练图片的某个像素在原图片中对应的像素,计算得到原图片像素与训练图片像素的映射关系。4.根据权利要求3所述的一种基于图像特征细化的数据预处理方法,其特征在于,计算映射关系的公式为:5.根据权利要求2所述的一种基于图像特征细化的数据预处理方法,其特征在于,训练数据采集步骤中还包括:构建滑动窗口子步骤,构建一个矩形的滑动窗口;滑动窗口分类子步骤,移动滑动窗口在训练图片上的位置,判断滑动窗口的数字中心是否在有效区域的边界或内部,若是,对滑动窗口进行分类;训练数据采集子步骤,当滑动窗口的数字中心在有效区域的边界或内部时,在滑动窗口的区域内采集训练数据,并根据滑动窗口的类型确定训练数据的类型。6.根据权利要求5所述的一种基于图像特征细化的数据预处理方法,其特征在于:滑动窗口分类子步骤中,若滑动窗口的...
【专利技术属性】
技术研发人员:李青海,潘宇翔,刘翔宇,秦于钦,赵轩,陈钦泽,张清瑞,赵梦思,
申请(专利权)人:广东精点数据科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。