System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图像分类,尤其涉及一种状态监测图像分类模型的训练方法、装置、介质及设备。
技术介绍
1、在工业领域中,深度学习技术已经获得了广泛的应用。深度学习技术在工业领域的应用包括但不限于以下几个方面:质量控制与产品检测、故障诊断与预测维护、生产过程优化、供应链管理、智能制造与自动化等。
2、然而,在实际工业应用中,数据源的质量是制约深度学习技术性能表现的一个关键因素。例如,在工业设备如带式输送机的状态监测过程中,受时间、环境和人为等因素的影响,用于模型训练的数据和测试数据之间可能存在严重的分布偏差问题,例如,状态监测图片存在明显的光照强度差异。
3、此外,工业数据通常具有高度不均匀分布的特点,某些类别或某些时间段的数据量可能远远超过其他类别或时间段,这会导致数据集的类别不平衡问题,例如,实际收集到的属于异常的状态监测数据的量往往十分少。
4、上述两种问题均会导致深度状态监测算法的性能严重下降。一方面,分布偏差问题使得模型过度拟合在训练集的特定分布上,而在测试集上严重失效。另一方面,类别不平衡问题使得模型倾向于将大部分状态识别为大类对应的状态,而在小类对应的状态上监测失效。
5、因而,当前亟待出现一种类不平衡的深度跨领域图像分类模型,以克服上述问题。
技术实现思路
1、鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种状态监测图像分类模型的训练方法、装置、介质及设备。
2、本专利技术的
3、根据本专利技术实施例的第一方面,提供了一种状态监测图像分类模型的训练方法,所述状态监测图像分类模型用于工业设备的状态监测图像的分类,所述状态监测图像分类模型的训练方法包括:
4、基于所采集到的工业设备的状态图像数据,并分别构建状态监测图像分类模型所需的源领域已标注有真实标签的数据集,以及目标领域未标注的数据集;
5、预训练得到所述状态监测图像分类模型的骨干网络,并通过所述骨干网络分别提取所述源领域的第一图像特征,和所述目标领域的第二图像特征,并基于提取的所述第一图像特征以及第二图像特征,构建相似性图;
6、根据构建的所述相似性图,通过基于核范数最大化的标签传播算法,将所述源领域中已标注的真实标签传递到所述目标领域上,获得所述目标领域的伪标签;
7、根据源领域的真实标签与所述骨干网络预测得到的源领域标签,确定源领域的交叉熵损失;
8、根据目标领域的伪标签与所述骨干网络预测得到的目标领域标签,确定目标领域的交叉熵损失;
9、利用源领域中已标注的真实标签与目标领域的伪标签,结合第一图像特征以及第二图像特征,对所述相似性图进行更新,并计算图嵌入损失;
10、根据所述源领域的交叉熵损失、目标领域的交叉熵损失以及图嵌入损失得到总损失函数,根据所述总损失函数对所述骨干网络进行反向传播,得到所述状态监测图像分类模型。
11、在本专利技术的一些实施例中,所述相似性图包括跨领域相似性图、源领域相似性图以及目标领域相似性图,所述基于提取好的所述第一图像特征以及第二图像特征,构建相似性图包括:
12、基于提取的所述第一图像特征以及第二图像特征,构建源领域到目标领域的跨领域相似性图;
13、基于提取的源领域内任意两个所述第一图像特征构建源领域相似性图;
14、基于提取的目标领域内任意两个所述第二图像特征构建目标领域相似性图。
15、在本专利技术的一些实施例中,所述利用构建的所述相似性图,通过基于核范数最大化的标签传播算法,将所述源领域中已标注的真实标签传递到所述目标领域上,获得所述目标领域的伪标签中,基于如下公式得到所述目标领域的伪标签:
16、
17、
18、式中,和分别为跨领域相似性图和目标领域相似性图;和分别表征第i个和第j个样本的预测标签;和分别表征源领域和目标领域的预测标签矩阵;ys表征源领域的真实标签矩阵;δ和σ分别为对应项的超参数。
19、在本专利技术的一些实施例中,所述根据源领域的真实标签与所述骨干网络预测得到的源领域标签,确定源领域的交叉熵损失包括;
20、根据源领域的真实标签与所述骨干网络预测得到的源领域标签,分别确定源领域的第i个真实标签分类到第c类的第一真实概率以及第一预测概率,i和c为正整数;
21、根据所述第一真实概率以及第一预测概率确定所述源领域的交叉熵损失。
22、在本专利技术的一些实施例中,所述根据目标领域的伪标签与所述骨干网络预测得到的目标领域标签,确定目标领域的交叉熵损失包括:
23、根据目标领域的伪标签与所述骨干网络预测得到的目标领域标签,分别确定目标领域的第i个真实标签分类到第c类的第二真实概率以及第二预测概率,i和c为正整数;
24、根据所述第二真实概率以及第二预测概率确定所述目标领域的交叉熵损失。
25、在本专利技术的一些实施例中,所述方法计算图嵌入损失通过如下公式获取:
26、
27、
28、
29、式中,为更新后的源领域相似性图;为目标领域相似性图;为跨领域相似性图;m为源领域的数据集中状态图像数据的数目;n为目标领域的数据集中状态图像数据的数目;为源领域图嵌入损失函数;为目标领域图嵌入损失函数;为跨领域图嵌入损失函数;和分别为源领域第i个样本和源领域第j个样本的图像特征;和分别为目标领域第i个样本和目标领域第j个样本的图像特征;zi和zj表示将源领域和目标领域看作一个整体后,不区分领域标签的第i个样本和第j个样本的图像特征。
30、在本专利技术的一些实施例中,所述方法还包括:每间隔一个完整训练周期,基于提取的所述第一图像特征以及第二图像特征,更新相似性图,并利用更新后的相似性图对所述目标领域的伪标签进行更新。
31、根据本专利技术实施例的第二方面,提供了一种状态监测图像分类模型的训练装置,所述状态监测图像分类模型的训练装置包括:
32、数据获取模块,用于基于所采集到的工业设备的状态图像数据,并分别构建状态监测图像分类模型所需的源领域已标注有真实标签的数据集,以及目标领域未标注的数据集;
33、特征处理模块,用于预训练得到所述状态监测图像分类模型的骨干网络,并通过所述骨干网络分别提取所述源领域的第一图像特征,和所述目标领域的第二图像特征,并基于提取的所述第一图像特征以及第二图像特征,构建相似性图;
34、相似性图构建模块,用于根据构建的所述相似性图,通过基于核范数最大化的标签传播算法,将所述源领域中已标注的真实标签传递到所述目标领域上,获得所述目标领域的伪标签;
35、源领域损失计算模块,用于根据源领域的真实标签与所述骨干网络预测得到的源领域标签,确定源领域的交叉熵损失;
...
【技术保护点】
1.一种状态监测图像分类模型的训练方法,所述状态监测图像分类模型用于工业设备的状态监测图像的分类,其特征在于,所述状态监测图像分类模型的训练方法包括:
2.根据权利要求1所述的状态监测图像分类模型的训练方法,其特征在于,所述相似性图包括跨领域相似性图、源领域相似性图以及目标领域相似性图,所述基于提取好的所述第一图像特征以及第二图像特征,构建相似性图包括:
3.根据权利要求2所述的状态监测图像分类模型的训练方法,其特征在于,所述利用构建的所述相似性图,通过基于核范数最大化的标签传播算法,将所述源领域中已标注的真实标签传递到所述目标领域上,获得所述目标领域的伪标签中,基于如下公式得到所述目标领域的伪标签:
4.根据权利要求1所述的状态监测图像分类模型的训练方法,其特征在于,所述根据源领域的真实标签与所述骨干网络预测得到的源领域标签,确定源领域的交叉熵损失包括;
5.根据权利要求1所述的状态监测图像分类模型的训练方法,其特征在于,所述根据目标领域的伪标签与所述骨干网络预测得到的目标领域标签,确定目标领域的交叉熵损失包括:
6.
7.根据权利要求1所述的状态监测图像分类模型的训练方法,其特征在于,所述方法还包括:每间隔一个完整训练周期,基于提取的所述第一图像特征以及第二图像特征,更新相似性图,并利用更新后的相似性图对所述目标领域的伪标签进行更新。
8.一种状态监测图像分类模型的训练装置,应用于权利要求1-7任一项所述的方法,其特征在于,所述状态监测图像分类模型的训练装置包括:
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序指令,所述计算机程序指令由处理器加载并执行以实现如权利要求1-7任一项所述的方法所执行的操作。
10.一种电子设备,包括处理器和存储器,其特征在于,所述存储器存储有能够被所述处理器执行的计算机程序指令,所述处理器执行所述计算机程序指令时,实现如权利要求1-7中任一所述的方法的指令。
...【技术特征摘要】
1.一种状态监测图像分类模型的训练方法,所述状态监测图像分类模型用于工业设备的状态监测图像的分类,其特征在于,所述状态监测图像分类模型的训练方法包括:
2.根据权利要求1所述的状态监测图像分类模型的训练方法,其特征在于,所述相似性图包括跨领域相似性图、源领域相似性图以及目标领域相似性图,所述基于提取好的所述第一图像特征以及第二图像特征,构建相似性图包括:
3.根据权利要求2所述的状态监测图像分类模型的训练方法,其特征在于,所述利用构建的所述相似性图,通过基于核范数最大化的标签传播算法,将所述源领域中已标注的真实标签传递到所述目标领域上,获得所述目标领域的伪标签中,基于如下公式得到所述目标领域的伪标签:
4.根据权利要求1所述的状态监测图像分类模型的训练方法,其特征在于,所述根据源领域的真实标签与所述骨干网络预测得到的源领域标签,确定源领域的交叉熵损失包括;
5.根据权利要求1所述的状态监测图像分类模型的训练方法,其特征在于,所述根据目标领域的伪标签与所述骨干网络预测得到的...
【专利技术属性】
技术研发人员:陈健学,范家庆,白云广,韩俊丰,乔晓澍,吕强,薛振华,闫颖,董延东,宋子路,尚强伟,白少雄,
申请(专利权)人:国能天津港务有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。