本发明专利技术公开了一种降低目标检测中样本不均衡影响的方法和系统,属于图像处理技术领域,样本Y0包括M个不关注的样本Y1和N个关注的样本Y2;M大于N;包括如下步骤:一:对样本Y2进行变换;获得样本Y
【技术实现步骤摘要】
一种降低目标检测中样本不均衡影响的方法和系统
[0001]本专利技术属于图像处理
,尤其涉及一种降低目标检测中样本不均衡影响的方法和系统。
技术介绍
[0002]众所周知,图像处理(image processing)指的是:用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组,该数组的元素称为像素,其值称为灰度值。图像处理技术一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。
[0003]近年来,随着图像处理技术和智能化技术的快速发展,人们经常需要对大量的图片进行分析处理,进而获取到所需的信息,如图1所示:在图像处理中,上述大量的图片通常被定义为原始样本;在这些原始样本中,包含有大量不关注的样本Y1和少量关注的样本Y2;这中数量的差异化样本即为样本不均衡性;目前,在现有样本分析的方法中,由于样本不均衡,往往某些样本多的目标容易被检测,而样本少的目标由于在训练中获得较少的关注,往往检测效果不明显,具体而言,因缺少必要信息,较少样本的目标在待检图中出现被漏检,被误报为其他样本多的目标,或者原本不应该成为目标的区域误报为该目标,样本少的多个样本之间混报目标,报目标时位置、大小出错等多种不希望出现的现象。这样就使得检测结果比较差;降低了学习训练的效率。
技术实现思路
[0004]针对现有技术存在的问题,本专利技术针提出了一种降低目标检测中样本不均衡影响的方法和系统,通过各种变换方式将现有样例叠加到不含此样例的其他图像上的方式,使样本少的类别获得较多有意生成的样本,从而丰富其样本数量。进而观察检测效果,调整变换方式或内容,达到减少样本不均衡影响的目的。
[0005]本专利技术的目的之一在于提供一种降低目标检测中样本不均衡影响的方法,包括如下步骤:
[0006]样本Y0包括M个不关注的样本Y1和N个关注的样本Y2;M大于N;包括如下步骤:
[0007]步骤一:对样本Y2进行变换;获得样本Y
21
;
[0008]步骤二:将样本Y1和样本Y
21
进行叠加得到样本Y3;
[0009]步骤三:将样本Y3和样本Y0输入学习机进行训练;
[0010]步骤四:检验训练结果是否符合要求,若不符合要求,则对所述变换方式和或叠加方式和或样本Y0的类别和数量进行调整。
[0011]优选地,在叠加过程中,对样本Y1进行变换。
[0012]优选地,所述变换包括图像缩放、图像翻转、图像扭曲、图像模糊、图像配色、改变透明度、增加噪点、调整对比度、调整亮度中的一种或者多种。
[0013]优选地,所述叠加包括:遮掩、合成、色彩色域变换叠加、滤波后叠加、裁剪后叠加
中的一种或者多种。
[0014]优选地,所述步骤三采用深度人工神经网络进行训练。
[0015]优选地,所述深度人工神经网络包括函数F(X),该函数F(X)的输入为样本的图像部分X,输出为样本的标签部分Y,每一次训练将全部样本的图像输入完毕并得到预测的标签F(X)都会优化,优化的目标是使得Loss函数最小;
[0016]所述Loss函数如下式所述:
[0017][0018]其中:α
c
是用以标识样本类别权重的因子,不同类别的样本使用不同的α
c
,α
c
越大表示该类样本数越小,越需要加大权重;
[0019]m为目标检测任务中欲识别的所有目标类枚举数;
[0020]c为单个样本所在的目标类;
[0021]γ
c
为对(1-p
y,c
)的注意力调节因子,γ越大表示该类越受关注;
[0022]y
c
为类别标签值;
[0023]p
y,c
则为F(X)预测出后,属于c类的概率。
[0024]本专利技术的深度人工神经网络可看做是一个函数F(X),该函数的输入为样本的图像部分X,输出为样本的标签部分Y,每一次训练完X(即,将全部样本的图像输入完毕并得到预测的标签),F(X)都会优化,优化的目标是使得Loss函数最小。(注意X,Y,都是集合而不是单条数据)
[0025]Loss函数如下式所述,
[0026][0027]其中:α
c
是用以标识样本类别权重的因子。不同类别的样本使用不同的α
c
,α
c
越大表示该类样本数越小,越需要加大权重。
[0028]m为目标检测任务中欲识别的所有目标类枚举数。
[0029]c为单个样本所在的目标类。
[0030]γ
c
为对(1-p
y,c
)的注意力调节因子,γ越大表示该类越受关注。
[0031]y
c
为类别标签值。
[0032]p
y,c
则为F(X)预测出后,属于c类的概率。
[0033]本专利技术的目的之二在于提供一种降低目标检测中样本不均衡影响系统,至少包括:
[0034]样本Y0包括M个不关注的样本Y1和N个关注的样本Y2;M大于N;其特征在于:至少包括:
[0035]变换模块:对样本Y2进行变换;获得样本Y
21
;
[0036]叠加模块:将样本Y1和样本Y
21
进行叠加得到样本Y3;
[0037]学习模块:将样本Y3和样本Y0输入学习机进行训练;
[0038]判断模块:检验训练结果是否符合要求,若不符合要求,则对所述变换方式和或叠加方式和或样本Y0的类别和数量进行调整。
[0039]本专利技术的目的之三在于提供一种实现降低目标检测中样本不均衡影响的方法的计算机程序。
[0040]本专利技术的目的之四在于提供一种实现降低目标检测中样本不均衡影响的方法的信息数据处理终端。
[0041]本专利技术的目的之五在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行降低目标检测中样本不均衡影响的方法。
[0042]综上所述,本专利技术的优点及积极效果为:
[0043]使用本专利技术的技术方案,使得样本少的目标,也同样在训练过程中受到了足够的关注,效果显然好于原有方案。同时,由于本方案在训练后还增加了一个复检和调整的步骤,使得样本少的目标,用以确保其在训练中获得的关注是有益于检测效果的,进一步降低了不利影响,并提高了训练效率。
[0044]本专利技术通过将少量受关注的样本进行多种形式变换,使得少量受关注的样本数量增加,提高其占比,进而改善样本不平衡问题。
[0045]本专利技术采用多种变换方式叠加输出的方式,提高目标检测的结果准确度。
附图说明
[0046]图1为传统技术方案的流程图;
[0047]图2为本专利技术优选实施例的流程图;
[0048]图本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种降低目标检测中样本不均衡影响的方法,样本Y0包括M个不关注的样本Y1和N个关注的样本Y2;M大于N;其特征在于:至少包括如下步骤:步骤一:对样本Y2进行变换;获得样本Y
21
;步骤二:将样本Y2和样本Y
21
进行叠加得到样本Y3;步骤三:将样本Y3和样本Y0输入学习机进行训练;步骤四:检验训练结果是否符合要求,若不符合要求,则对所述变换方式和或叠加方式和或样本Y0的类别和数量进行调整。2.基于权利要求1所述降低目标检测中样本不均衡影响的方法,其特征在于,在叠加过程中,对样本Y1进行变换。3.基于权利要求1或2所述降低目标检测中样本不均衡影响的方法,其特征在于,所述变换包括图像缩放、图像翻转、图像扭曲、图像模糊、图像配色、改变透明度、增加噪点、调整对比度、调整亮度中的一种或者多种。4.基于权利要求1所述降低目标检测中样本不均衡影响的方法,其特征在于,所述叠加包括:遮掩、合成、色彩色域变换叠加、滤波后叠加、裁剪后叠加中的一种或者多种。5.基于权利要求1所述降低目标检测中样本不均衡影响的方法,其特征在于,所述步骤三采用深度人工神经网络进行训练。6.基于权利要求1所述降低目标检测中样本不均衡影响的方法,其特征在于,所述深度人工神经网络包括函数F(X),该函数F(X)的输入为样本的图像部分X,输出为样本的标签部分Y,每一次训练将全部样本的图像输入完毕并得到预测的标签F(X)都会优化,优化的目标是使得Loss函数最小;所述Loss函数如下...
【专利技术属性】
技术研发人员:周斌,
申请(专利权)人:北京信工博特智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。