一种基于特征变换的半监督深度学习图像分类方法技术

技术编号:39497248 阅读:15 留言:0更新日期:2023-11-24 11:26
本发明专利技术公开了一种基于特征变换的半监督深度学习图像分类方法,包括如下步骤:

【技术实现步骤摘要】
一种基于特征变换的半监督深度学习图像分类方法


[0001]本专利技术涉及深度学习
,特别是涉及一种基于特征变换的半监督深度学习图像分类方法


技术介绍

[0002]图像分类是计算机视觉领域的一个基本问题,在过去的几十年里,解决图像分类问题主要依赖于传统的机器学习方法,但随着深度学习技术的快速发展和硬件水平的提升,深度神经网络已经在图像分类领域得到了广泛的应用

然而,深度学习方法在实际应用的效果与训练数据集的数量和质量是成正比的,在工程环境下,存在训练集数据难以获取的限制条件,在训练数据集收集的过程中,可能导致数据集偏移的情况发生,即测试数据的分布与训练数据分布不同时,这些预训练模型不能保证较为理想的准确率

因为深度学习算法只能从现有的数据中进行规律的归纳,并且一般会假设训练环境与应用环境的一致性,所有这种数据偏移会导致模型的泛化性能较差

导致数据集偏移的情况有:一是样本选择偏差,在训练集收集的过程中,因实际条件限制因素,无法收集到理想的训练数据,例如图像来自网络上等,可能会导致样本特征分布发生偏移;二是环境不平稳,因实际条件因素存在的不确定性,训练集数据难以考虑到全部的环境情况,这可能会导致训练集数据的采集环境与测试集
(
或实际应用时
)
环境不一致,例如训练集数据通常在光线较好的情况下采集,而实际应用时,周围环境可能光线较暗,导致识别到的图像存在色差等情况

[0003]公开日为
2021
年3月
30
日,公开号为
CN112580684A
的中国专利文献公开了一种基于半监督学习的目标检测方法,包括:基于获取的训练数据,确定与训练数据对应的标签数据;对标签数据进行数据清洗处理,获取清洗后的新标签数据;对新标签数据进行数据增强处理,获取与新标签数据对应的增强数据;基于增强数据和预设的人工标注的图像信息,训练深度学习模型,直至深度学习模型的损失函数收敛在预设范围内,以形成目标检测模型;基于目标检测模型获取待检测数据的目标检测结果

本专利技术还涉及区块链技术,新标签数据存储于区块链中

[0004]上述半监督学习的目标检测方法的缺点是:需要确定训练数据的标签数据,图像信息也需要人工标注,需要大量人力数据,而且人力工作需要比较长的时间,人工成本并不低,也需要较长时间


技术实现思路

[0005]本专利技术的目的是为解决现有的图像分类方法的需要对数据进行标签,浪费人力成本和需要时间的问题,提供一种基于特征变换的半监督深度学习图像分类方法,仅需少量带标签的源数据样本,目标数据样本则无需耗费大量人力在标签任务上,具有节省人力成本

准确率高和的有效降低训练数据的获取难度和神经网络模型训练时间的优点

[0006]本专利技术为解决上述技术问题所采用的技术方案是,:一种基于特征变换的半监督深度学习图像分类方法,包括如下步骤:
S1
:构建半监督深度学习网络结构;
S2
:对训练样本
分类处理得到输出数据;
S3
:计算总损失;
S4
:更新权重系数获取更新后的深度神经网络模型;其中,半监督深度学习网络结构包括第一基础神经网络模型和第二基础神经网络模型

[0007]使用上述的技术方案,首先构建半监督深度学习网络结构,然后将训练样本分类在半监督深度学习网络结构中处理,然后分布计算损失值得到总损失值,基于总损失值的表达形式构建损失函数,在不断进行的优化和反向传播过程中,对半监督深度学习网络结构的参数进行更新,最终得出期望的深度神经网络模型

[0008]作为优选,构建半监督深度学习网络结构包括:构建第一基础神经网络模型,设置模型超参数;收集图像训练样本数据;构建第二基础神经网络模型;构建半监督深度学习网络结构;其中,第二基础神经网络模型由第一基础神经网络模型共享权重构建

具体的,第一基础神经网络模型和第二基础神经网络模型无限制,可以使用
ResNet
模型

轻量化模型
ShuffleNet、
高效模型
EfficientNet
等模型

这样,在基础神经网络模型环节,首先初始化模型超参数,然后通过加载预训练模型,在下游任务上进行微调,可以有效减少训练时间同时保持较好的准确率;通过验证集对模型进行验证,根据验证结果可对其进行多轮调参,本半监督深度学习网络结构可以由多种模型组成,可行性高

[0009]作为优选,步骤
S5
后还包括:
S6
:获取图像测试样本数据;
S7
:通过深度神经网络模型计算准确率;其中,将图像测试样本数据输入深度神经网络模型计算准确率

具体的,通过最后的分类结果,计算最终模型的分类准确率

若不满足模型准确率要求,则继续进行训练或者调整模型涉及的超参数,直至准确率满足要求

这样,有效的提高识别准确率

[0010]作为优选,步骤
S4
中,通过加入正则项
R(
·
,
·
)
,对深度神经网络结构中高阶特征层进行更新;正则项
R(
·
,
·
)
通过特征变换构建

具体的,通过加入正则项
R(
·
,
·
)
,对深度神经网络结构中高阶特征层进行更新;根据结构风险最小化准则,可以将寻找最优函数
f
的问题形式化表示为:其中,
N
s
为源数据
(SourceData)
的样本数量,
ι
表示预测误差,
λ
为正则化参数;采用基于特征变换的方法来构建正则项,目标是通过学习一个特征变换函数
T
来减小正则项
R(
·
,
·
)
,使得公式
(1)
最小化,则源数据
(SourceData)
,目标数据
(TargetData)
对应的形式可分别表示为
T
s
,T
t
,公式
(1)
可表示为:这样,通过加入正则
R(
·
,
·
)
,对深度神经网络结构中高阶特征层进行更新,通过特征变换的方式来减小训练数据的分布差异,使得训练后的深度神经网络模型有更好的泛化能力

[0011]作为优选,第一基础神经网络模型为源模型;和第二基础神经网络模型为目标模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于特征变换的半监督深度学习图像分类方法,其特征在于,包括如下步骤:
S1
:构建半监督深度学习网络结构;
S2
:对训练样本分类处理得到输出数据;
S3
:计算总损失;
S4
:更新权重系数获取更新后的深度神经网络模型;其中,所述半监督深度学习网络结构包括第一基础神经网络模型和第二基础神经网络模型
。2.
根据权利要求1所述的图像分类方法,其特征在于,所述构建半监督深度学习网络结构包括:构建第一基础神经网络模型,设置模型超参数;收集图像训练样本数据;构建第二基础神经网络模型;构建半监督深度学习网络结构;其中,所述第二基础神经网络模型由所述第一基础神经网络模型共享权重构建
。3.
根据权利要求1所述的图像分类方法,其特征在于,所述步骤
S5
后还包括:
S6
:获取图像测试样本数据;
S7
:通过深度神经网络模型计算准确率;其中,将所述图像测试样本数据输入所述深度神经网络模型计算准确率
。4.
根据权利要求1所述的图像分类方法,其特征在于,所述步骤
S4
...

【专利技术属性】
技术研发人员:孙尧于佳袁刚蒋鑫宇王振彪
申请(专利权)人:杭州西奥电梯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1