当前位置: 首页 > 专利查询>苏州大学专利>正文

图像识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:31801974 阅读:29 留言:0更新日期:2022-01-08 11:03
本申请公开了一种图像识别方法、装置、电子设备及可读存储介质。其中,方法包括根据已知标签信息的第一类图像数据和无标签信息的第二类图像数据,生成用于训练图像识别模型的原始图像数据;利用预先构建的多层耦合分解结构对原始图像数据进行深度分解,得到深度特征信息;利用各已知标签信息构建约束信息,基于该约束信息和深度特征信息,通过最小化标签重构误差得到用于标签预测的标签投影矩阵;利用标签投影矩阵对第二类图像数据进行标签预测,并更新约束信息和原始图像数据,利用该原始图像数据对训练好的图像识别模型进行更新或者是进行图像识别模型的训练,提升模型性能,从而可以有效提高图像识别准确度。而可以有效提高图像识别准确度。而可以有效提高图像识别准确度。

【技术实现步骤摘要】
图像识别方法、装置、电子设备及可读存储介质


[0001]本申请涉及计算机视觉
,特别是涉及一种图像识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]在数据挖掘与分析领域,随着数据量的爆炸式增长,数据复杂度以及维度也相应增加,如何能够有效地从原始图像数据中学习得到新的且有用的数据表示,已经成为计算机视觉技术至关重要的问题。
[0003]相关技术通常采用矩阵分解的表示学习对图像数据进行有效地低维特征提取和数据聚类,从而从原始图像数据中提取所需信息。非负矩阵分解(NMF)模型是矩阵分解中最具代表性的一个方法。NMF目的在于将所给的数据矩阵近似成成一个基向量组和原始数据的低维表示的乘积,即X≈UV
T
。但NMF有一个明显的弊端即无法在再生希尔伯特空间中执行,因而无法应用强大的内核方法。因此另一个具有代表性的矩阵分解方法即概念分解(CF)被提出来用于解决上述问题。CF将原始矩阵表示为三个矩阵的乘积。不同于非负矩阵分解,概念分解使用数据点的线性组合代替非负矩阵分解中的基向量,即X≈XWV
T
。然而无论是NMF还是CF方法,都是无监督方法,因而无法充分利用已知的部分标签信息。为了解决这一问题,CF方法的无监督拓展:约束的概念分解方法(CCF)被提出,CCF在CF的基础上将表示矩阵V进一步分解成非负辅助矩阵Z和标签约束矩阵A相乘的形式,而已知的部分样本标签在A中得以保存和利用。但是CCF对于无标签样本部分,简单地定义其对应的标签约束矩阵为单位矩阵,无法充分利用无标签样本的信息。CCF也无法有效保持样本在数据空间的近邻结构信息。此外,诸如CCF的传统概念分解方法,往往都是单层的方法,而单层方法通常难于挖掘现实生活中复杂数据中隐藏的深层次信息。

技术实现思路

[0004]本申请提供了一种图像识别方法、装置、电子设备及可读存储介质,可以有效提高图像识别准确度。
[0005]为解决上述技术问题,本专利技术实施例提供以下技术方案:
[0006]本专利技术实施例一方面提供了一种图像识别方法,包括:
[0007]根据已知标签信息的第一类图像数据和无标签信息的第二类图像数据,生成用于训练图像识别模型的原始图像数据;
[0008]利用预先构建的多层耦合分解结构对所述原始图像数据进行深度分解,得到深度特征信息;
[0009]基于利用各已知标签信息构建的约束信息和所述深度特征信息,通过最小化标签重构误差得到用于标签预测的标签投影矩阵;
[0010]利用所述标签投影矩阵对所述第二类图像数据进行标签预测,并更新所述约束信息和所述原始图像数据。
[0011]可选的,所述基于利用各已知标签信息构建的约束信息和所述深度特征信息之前,还包括:
[0012]利用各已知标签信息构建标签约束矩阵和结构约束矩阵;
[0013]将所述标签约束矩阵和所述结构约束矩阵作为所述约束信息。
[0014]可选的,所述利用预先构建的多层耦合分解结构对所述原始图像数据进行深度分解,得到深度特征信息的过程,包括:
[0015]调用多层耦合分解关系式对所述原始图像数据进行深度分解,得到深度基向量和深度低维表示;所述多层耦合分解关系式为:
[0016][0017]根据所述深度基向量和所述深度低维表示,构建所述原始图像数据的深度重构误差,所述深度重构误差为:
[0018][0019]通过最小化所述原始图像数据的深度重构误差,得到所述原始图像数据的深度低维特征;
[0020]式中,X为所述原始图像数据,T表示矩阵转置,U
m
为第m层的深度基向量的集合,V
m
为第m层的深度低维表示,A为标签约束矩阵,Z
m
为第m层的辅助矩阵,W
m
为第m层的单位矩阵,m=0,1,2,3,

,M,M为所述多层耦合分解结构的总层数;R
M
为所述原始图像数据自表达系数矩阵。
[0021]可选的,所述基于利用各已知标签信息构建的约束信息和所述深度特征信息,通过最小化标签重构误差得到用于标签预测的标签投影矩阵的过程,包括:
[0022]根据所述约束信息和所述深度特征信息构建目标函数,所述目标函数为:
[0023][0024][0025]对所述目标函数,通过迭代地优化凸子问题,依次更新变量值计算得到所述标签投影矩阵;
[0026]其中,U
M
=XW0...W
M
,V
M
=A(Z0...Z
M
),α,β,γ为非负惩罚参数,为目标函数,X为所述原始图像数据,T表示矩阵转置,U
M
为第M层的深度基向量的集合,V
M
为第M层的深度低维表示,A为标签约束矩阵,Z
M
为第M层的辅助矩阵,W
M
为第M层的单位矩阵,R
M
为所述原始图像数据自表达系数矩阵,Q为结构约束矩阵,S
U
为特征权值矩阵,S
V
为数据权值矩阵,A
L
为有标签数据X
L
的标签约束矩阵,X
L
为有标签数据,P为标签投影矩阵。
[0027]可选的,所述利用所述标签投影矩阵对所述第二类图像数据进行标签预测,包括:
[0028]利用所述标签投影矩阵将所述第二类图像数据映射到类别空间,得到无标签图像数据的类别预测结果;
[0029]通过归一化得到所述第二类图像数据的软标签。
[0030]本专利技术实施例另一方面提供了一种图像识别装置,包括:
[0031]原始数据生成模块,用于根据已知标签信息的第一类图像数据和无标签信息的第二类图像数据,生成用于训练图像识别模型的原始图像数据;
[0032]特征提取模块,用于利用预先构建的多层耦合分解结构对所述原始图像数据进行深度分解,得到深度特征信息;
[0033]标签投影矩阵计算模块,用于基于利用各已知标签信息构建的约束信息和所述深度特征信息,通过最小化标签重构误差得到用于标签预测的标签投影矩阵;
[0034]标签预测模块,用于利用所述标签投影矩阵对所述第二类图像数据进行标签预测,并更新所述约束信息和所述原始图像数据。
[0035]可选的,还包括约束信息确定模块,用于利用各已知标签信息构建标签约束矩阵和结构约束矩阵;将所述标签约束矩阵和所述结构约束矩阵作为所述约束信息。
[0036]可选的,所述特征提取模块进一步用于:
[0037]调用多层耦合分解关系式对所述原始图像数据进行深度分解,得到深度基向量和深度低维表示;所述多层耦合分解关系式为:
[0038][0039]根据所述深度基向量和所述深度低维表示,构建所述原始图像数据的深度重构误差,所述深度重构误差为:
[0040][0041]通过最小化所述原始图像数据的深度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:根据已知标签信息的第一类图像数据和无标签信息的第二类图像数据,生成用于训练图像识别模型的原始图像数据;利用预先构建的多层耦合分解结构对所述原始图像数据进行深度分解,得到深度特征信息;基于利用各已知标签信息构建的约束信息和所述深度特征信息,通过最小化标签重构误差得到用于标签预测的标签投影矩阵;利用所述标签投影矩阵对所述第二类图像数据进行标签预测,并更新所述约束信息和所述原始图像数据。2.根据权利要求1所述的图像识别方法,其特征在于,所述基于利用各已知标签信息构建的约束信息和所述深度特征信息之前,还包括:利用各已知标签信息构建标签约束矩阵和结构约束矩阵;将所述标签约束矩阵和所述结构约束矩阵作为所述约束信息。3.根据权利要求2所述的图像识别方法,其特征在于,所述利用预先构建的多层耦合分解结构对所述原始图像数据进行深度分解,得到深度特征信息的过程,包括:调用多层耦合分解关系式对所述原始图像数据进行深度分解,得到深度基向量和深度低维表示;所述多层耦合分解关系式为:根据所述深度基向量和所述深度低维表示,构建所述原始图像数据的深度重构误差,所述深度重构误差为:where R
M
=W0...W
M
(Z0...Z
M
)
T
A
T
通过最小化所述原始图像数据的深度重构误差,得到所述原始图像数据的深度低维特征;式中,X为所述原始图像数据,T表示矩阵转置,U
m
为第m层的深度基向量的集合,V
m
为第m层的深度低维表示,A为标签约束矩阵,Z
m
为第m层的辅助矩阵,W
m
为第m层的单位矩阵,m=0,1,2,3,

,M,M为所述多层耦合分解结构的总层数;R
M
为所述原始图像数据自表达系数矩阵。4.根据权利要求1至3任意一项所述的图像识别方法,其特征在于,所述基于利用各已知标签信息构建的约束信息和所述深度特征信息,通过最小化标签重构误差得到用于标签预测的标签投影矩阵的过程,包括:根据所述约束信息和所述深度特征信息构建目标函数,所述目标函数为:
对所述目标函数,通过迭代地优化凸子问题,依次更新变量值计算得到所述标签投影矩阵;其中,U
M
=XW0...W
M
,V
M
=A(Z0...Z
M
),α,β,γ为非负惩罚参数,为所述目标函数,X为所述原始图像数据,T表示矩阵转置,U
M
为第M层的深度基向量的集合,V
M
为第M层的深度低维表示,A为标签约束矩阵,Z
M
为第M层的辅助矩阵,W
M
为第M层的单位矩阵,R
M

【专利技术属性】
技术研发人员:张召张妍张莉王邦军
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1