System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及深度学习领域,具体涉及一种兼顾多特征区域的深度学习模型训练方法。
技术介绍
1、注意力机制(attention mechanism)源自注意力思维,注意力思维是指人类利用有限的注意力资源从大量信息中快速筛选出高价值信息的思维能力。目前,注意力机制被结合在深度学习模型中,其借鉴了人类的注意力思维的处理方式,被广泛的应用图像分类、语音识别等各种不同类型的深度学习任务中。注意力机制能够快速帮助模型筛选出重点关注区域,进而快速得出结论,该模型应用在单一特征识别或者重点特征识别,取得了显著的成效,提升了识别的准确度,但是,基于注意力机制的深度学习模型存在以下问题:
2、1)容易特征依赖性:基于注意力机制的模型在训练过程中容易过分依赖于某一类特征(例如,颜色、形状或纹理),它可能会忽视其他同样重要的特征,甚至对某种特征产生偏好,使模型过拟合,导致识别错误。
3、2)注意力分配失衡:当待识别对象在图像中占比较大、或是关键特征分布较为分散,基于注意力机制的深度学习模型往往只会重点关注最具判别的特征区域,对于其他特征区域并未给予足够的关注,从而影响整体识别的准确性。
技术实现思路
1、为了解决上述技术问题,本专利技术提供一种兼顾多特征区域的深度学习模型训练方法。本方法旨在提升基于注意力机制的深度学习模型的泛化能力和鲁棒性,避免漏识别。
2、技术方案如下:
3、一种兼顾多特征区域的深度学习模型训练方法,包括如下步骤:
4、s1、
5、s2、将模型训练过程中特征提取器输出的多维特征图进行堆叠,形成堆叠热力图;
6、s3、基于堆叠热力图生成掩膜,利用掩膜对图像i中的重点关注区域进行屏蔽处理;
7、将屏蔽处理后的图像i替换原来的图像i并加载到完成参数更新的深度学习模型中,对模型进行再次训练,更新模型参数;
8、s4、重复步骤s2~s3一次或者多次后,进行步骤s5;
9、s5、从训练集中切换另一幅已经打标签的图像记为图像i,利用其执行步骤s1,直到训练集图像库中的所有图像均被输入后,模型训练完成,存储模型参数。
10、进一步,步骤s2中,将模型训练过程中特征提取器输出的多维特征图进行堆叠,形成堆叠热力图的方式为:
11、
12、a(i,j)表示堆叠热力图,fk(i,j)表示特征提取器任一卷积层输出的第k维特征图,k=1,2……n,n表示特征提取器输出的特征图维度,表示将1维到n维特征图中相同位置(i,j)处的像素值累加。
13、优选,fk(i,j)表示特征提取器最后一个卷积层输出的第k维特征图。
14、进一步,步骤s3中,基于堆叠热力图生成掩膜,利用掩膜对图像i中的重点关注区域进行屏蔽处理的方式如下:
15、①取堆叠热力图中各个像素值的均值,记为阈值
16、②将堆叠热力图中像素值大于阈值的像素点的像素值置0,其他像素点的像素值置1,生成掩膜;
17、③将掩膜上采样到图像i的尺寸,再将其与图像i点乘,对图像i中的重点关注区域进行屏蔽处理。
18、为了将模型重点关注区域约束在更精准的区域内,更优选的,在步骤s2中,将特征提取器不同卷积层输出的维特征图分别进行堆叠,形成多个堆叠热力图;
19、在步骤s3中,再基于多个堆叠热力图分别生成掩膜,得到多个掩膜,将多个掩膜统一成相同的尺寸,再取它们的交集,生成最终的掩膜,利用最终的掩膜对图像i中的重点关注区域进行屏蔽处理。
20、优选,步骤s2~s3进行2~4次。
21、本方法具有以下特点:
22、本方法针对于基于注意力机制的深度学习模型,如:e-net、se-resnet和se-resnext,或是嵌入se(squeeze and excitation)和cbam(convolutional blockattention module)模块的网络。
23、通过将输入图像中的重点关注区域屏蔽,并将屏蔽后的图像再次输入到模型中进行训练,强制模型关注其他可能被忽视的区域,抑制模型对图像中最具区分的局部特征的过分关注。
24、采用本方法训练得出的模型参数,更能够关注到图像全局的特征,兼顾多区域特征,从而提高了模型的泛化能力和鲁棒性,避免漏识别。
本文档来自技高网...【技术保护点】
1.一种兼顾多特征区域的深度学习模型训练方法,其特征在于,包括如下步骤:
2.如权利要求1所述兼顾多特征区域的深度学习模型训练方法,其特征在于:步骤S2中,将模型训练过程中特征提取器输出的多维特征图进行堆叠,形成堆叠热力图的方式为:
3.如权利要求2所述兼顾多特征区域的深度学习模型训练方法,其特征在于:Fk(i,j)表示特征提取器最后一个卷积层输出的第k维特征图。
4.如权利要求1所述兼顾多特征区域的深度学习模型训练方法,其特征在于:步骤S3中,基于堆叠热力图生成掩膜,利用掩膜对图像I中的重点关注区域进行屏蔽处理的方式如下:
5.如权利要求1所述兼顾多特征区域的深度学习模型训练方法,其特征在于:在步骤S2中,将特征提取器不同卷积层输出的维特征图分别进行堆叠,形成多个堆叠热力图;
6.如权利要求1所述兼顾多特征区域的深度学习模型训练方法,其特征在于:步骤S2~S3进行2~4次。
7.如权利要求1所述兼顾多特征区域的深度学习模型训练方法,其特征在于:在步骤S1之前,将不同时刻、不同角度采集的待测物图像汇总并对图像
...【技术特征摘要】
1.一种兼顾多特征区域的深度学习模型训练方法,其特征在于,包括如下步骤:
2.如权利要求1所述兼顾多特征区域的深度学习模型训练方法,其特征在于:步骤s2中,将模型训练过程中特征提取器输出的多维特征图进行堆叠,形成堆叠热力图的方式为:
3.如权利要求2所述兼顾多特征区域的深度学习模型训练方法,其特征在于:fk(i,j)表示特征提取器最后一个卷积层输出的第k维特征图。
4.如权利要求1所述兼顾多特征区域的深度学习模型训练方法,其特征在于:步骤s3中,基于堆叠热力图生成掩膜,利...
【专利技术属性】
技术研发人员:郭寅,郭磊,尹仕斌,叶琨,周东,
申请(专利权)人:易思维杭州科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。