一种训练样本被少量标记的违规图像检测方法技术

技术编号:38862061 阅读:24 留言:0更新日期:2023-09-17 10:03
本发明专利技术公开了一种训练样本被少量标记的违规图像检测方法,其特征在于,包括如下步骤1)模型结构设计和训练;2)联合决策赋予伪标签与权重;3)对深度残差模型进行训练。这种方法能识别鉴定多种类型的违规图像、数据处理能力强,泛化能强,精度和鲁棒性高。精度和鲁棒性高。精度和鲁棒性高。

【技术实现步骤摘要】
一种训练样本被少量标记的违规图像检测方法


[0001]本专利技术涉及人工智能、违规数据检测技术,具体是一种训练样本被少量标记的违规图像检测方法。

技术介绍

[0002]传统的违规图像检测算法需要手动提取特征,对于复杂的高维数据处理能力较弱,缺乏泛化能力,因此在精度和鲁棒性方面存在局限性。此外,目前国内外对于违规数据认定的相关研究通常针对单一类型的违规数据,例如成人图像、枪支图像或暴力图像等,旨在从大量待检测的样本中检测出这些特定类型的违规图像。
[0003]传统的机器学习方法通常需要手动提取肤色和纹理特征或者使用手工特征模式识别方法来检测成人图像。虽然Grega等人提出了一种自动检测和识别闭路电视系统中危险情况的算法,但最终商用的算法是一个感知支持系统,因为自动系统无法评估整体状况,无法准确评估当前环境中潜在危险的严重程度。D
é
niz等人结合心理学研究成果,提出了一种新的暴力行为检测算法,使用连续帧来估计极端加速度,并使用极端加速度作为主要检测特征。

技术实现思路

[0004]本专利技术的目的是针对现有技术的不足,而提供一种训练样本仅需少量标记的违规图像检测方法。这种方法能识别鉴定多种类型的违规图像、数据处理能力强,泛化能强,精度和鲁棒性高。
[0005]实现本专利技术目的的技术方案是:
[0006]一种训练样本被少量标记的违规图像检测方法,包括如下步骤:
[0007]1)模型结构设计和训练:采用三个结构不同的分类器设计组成集成学习模型,采用有标记图像进行训练,三个分类器分中分类器h
(1)
与h
(2)
采用传统卷积层构成,分类器h
(3)
采用残差结构,残差结构带来了集成学习系统内模型之间的结构差异,也使得分类器h
(3)
具有更优的性能,这个特性将在后续联合决策中被使用到,通过结构上的不同,创造了三个分类器在进行预测时,可能存在的分歧,后面的步骤中,利用这种分歧来筛选高可靠性的无标签样本,具体为:
[0008]1‑
1)三个分类器中含有残差注意力模块,定义为输入特征映射,N为图像中像素的数量,d为特征维度的数量,为线性层,k=1,2,具体如公式(1)、公式(2):
[0009][0010]F
out
=AL2+F
ꢀꢀꢀ
(2),
[0011]其中,(α)
i,j
为第i个像素与特征存储M的第j行之间的相似度,d与S为超参数,A为注意力图,F
out
采用残差连接保留输入的原始特征,注意力模块的输出通过残差连接与输入
特征相结合;
[0012]1‑
2)在所有的三个分类器中,均采用步骤1

1)中的残差注意力模块进行数据增强,图片输入任何一个分类器或者模型,都是通过卷积不断地提取特征,选择在经过注意力模块提取特征后的2个特征图,来进行混合,按照8:2的比例拼成一张新的特征图,新的特征图的标签即分类类别就变成了80%类别1、20%类别2,未进行混合的图片的类别为100%的所属类别,分类器h
(1)
、分类器h
(2)
和分类器h
(3)
定义为f(x)=f
RA
(g
RA
(x)),其中g
RA
(
·
)表示将数据输入网络模型中进行处理,直到经过残差注意力模块后的特征图,f
RA
(
·
)表示对特征图继续处理直到输出f(x),数据增强的具体步骤如下:已知含有I个有标记样本的数据集D
L
={(x
i
,y
i
)|i=1,2,...,l,从D
L
中随机抽取两个样本(x,y)和(x

,y

),输入分类器进行逐层计算特征,直到获取到这两个样本经过残差注意力模块处理,此时获取到两个被中间数个神经网络层处理后的样本特征图(g
RA
(x),y)和(g
RA
(x

),y

),对这两个小批量样本进行混合操作,得到混合样本,如公式(3)所示:
[0013][0014]其中,Mix
λ
(a,b)=λ
·
α+(1

λ)
·
β,(y,y

)为独热编码one

hot标签,混合系数λ在0和1之间等概率分布,而后采用混合后的样本从残差注意力模块开始继续在网络中进行前向传递,直到输出,采用输出计算损失值和梯度,更新神经网络的所有参数;
[0015]2)联合决策赋予伪标签与权重:经过步骤1)得到包含三个分类器的集成学习模型,对无标签数据赋予伪标签,并且筛选出高可靠性的那部分,伪标签的决策方式不仅考虑每个模型的预测结果数量,还兼顾每个模型的预测概率值,假设无标签数据集D
U
={(x
u
)|u=1,2,...,U}中的样本数量为U,采用训练好的分类器h
(1)
、分类器h
(2)
和分类器h
(3)
对样本类别进行预测,得到每个分类器对同一样本的预测标签得到每个分类器对同一样本的预测标签为分类器h
(1)
给出的预测结果,为分类器h
(2)
给出的预测结果,则如公式(4):
[0016][0017]其中,当分类器h
(1)
与分类器h
(2)
的预测结果一致时,将该样本视为高可靠性样本,当分类器h
(1)
与分类器h
(2)
的预测结果不一致时,将该样本视为低可靠性样本,如果为高可靠性样本,则将分类器h
(1)
与分类器h
(2)
的预测的类别作为伪标签,并取分类器h
(1)
与分类器h
(2)
给出预测概率较高者为样本权重ω,如公式(5)、公式(6):
[0018][0019][0020]其中,为分类器h
(i)
给出的样本x
u
的分类预测的概率,其中i的范围为1,2,3。之后结合分类器h
(1)
、h
(2)
与分类器h
(3)
的分类结果,联合决策伪标签并筛选样本,其包含以下三种情况:如果与相同,维持为样本x
u
的伪标签,更新样本权重ω为
如果与不同,且大于则同样维持为样本x
u
的伪标签,更新样本权重ω为如果与不同,且小于则将该样本权重ω更新为0,即从高可靠性样本转而分到低可靠性样本,权重赋予抉择如公式(7)所示:
[0021][0022]通过集成学习的思想,融合三个模型的分类标签本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练样本被少量标记的违规图像检测方法,其特征在于,包括如下步骤:1)模型结构设计和训练:采用三个结构不同的分类器设计组成集成学习模型,采用有标记图像进行训练,三个分类器分中分类器h
(1)
与h
(2)
采用传统卷积层构成,分类器h
(3)
采用残差结构,具体为:1

1)三个分类器中含有残差注意力模块,定义为输入特征映射,N为图像中像素的数量,d为特征维度的数量,为线性层,k=1,2,具体如公式(1)、公式(2):F
out
=AL2+F (2),其中,(α)
i,j
为第i个像素与特征存储M的第j行之间的相似度,d与S为超参数,A为注意力图,F
out
采用残差连接保留输入的原始特征,注意力模块的输出通过残差连接与输入特征相结合;1

2)在所有的三个分类器中,均采用步骤1

1)中的残差注意力模块进行数据增强,图片输入任何一个分类器或者模型,都是通过卷积不断地提取特征,选择在经过注意力模块提取特征后的2个特征图,来进行混合,按照8∶2的比例拼成一张新的特征图,新的特征图的标签即分类类别就变成了80%类别1、20%类别2,未进行混合的图片的类别为100%的所属类别,分类器h
(1)
、分类器h
(2)
和分类器h
(3)
定义为f(x)=f
RA
(g
RA
(x)),其中g
RA
(
·
)表示将数据输入网络模型中进行处理,直到经过残差注意力模块后的特征图,f
RA
(
·
)表示对特征图继续处理直到输出f(x),数据增强的具体步骤如下:已知含有I个有标记样本的数据集D
L
={(x
i
,y
i
)|i=1,2,...,I},从D
L
中随机抽取两个样本(x,y)和(x

,y

),输入分类器进行逐层计算特征,直到获取到这两个样本经过残差注意力模块处理,此时获取到两个被中间数个神经网络层处理后的样本特征图(g
RA
(x),y)和(g
RA
(x

),y

),对这两个小批量样本进行混合操作,得到混合样本,如公式(3)所示:其中,Mix
λ
(a,b)=λ
·
α+(1

λ)
·
β,(y,y

)为独热编码one

hot标签,混合系数λ在0和1之间等概率分布,而后采用混合后的样本从残差注意力模块开始继续在网络中进行前向传递,直到输出,采用输出计算损失值和梯度,更新神经网络的所有参数;2)联合决策赋予伪标签与权重:假设无标签数据集D
U
={(x
u
)|u=12,...,U}中的样本数量为U,采用训练好的分类器h
(1)
、分类器h
(2)
和分类器h
(3)
对样本类别进行预测,得到每个分类器对同一样本的预测标签分类器对同一样本的预测标签为分类器h
(1)
给出的预测结果,为分类器h
(2)
给出的预测结果,则如公式(4):其中,当分类器h
(1)
与分类器h
(2)
的预测结果一致时,将该样本视为高可靠性样本,当分类器h
(1)
与分类器h
(2)
的预测结果不一致时,将该样本视为低可靠性样本,如果为高可靠性样本,则将分类器h
(1)
与分类器h
(2)
的预测的类别作为伪标签,并取分类器h
(1)
与分类器h
(2)
给出预测概率较高者为样本权重ω,如公式(5)、公式(6):
其中,为分...

【专利技术属性】
技术研发人员:丁勇高上腾达梁海杨昌松李春海李振宇
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1