基于标记预测和标记增强的图像多维分类方法技术

技术编号：42676323 阅读：26 留言：0更新日期：2024-09-10 12:28

本发明专利技术公开了一种基于标记预测和标记增强的图像多维分类方法，包括：1构建图像多维分类训练集，2通过一对一编码将图像样本原本的标记转换为三元标记，3通过构建标记增强模型将图像样本原来的逻辑标记恢复成实数型标记分布，4基于实数型标记分布构建多输出回归模型，5将实数型标记转换成三元标记得出未知样本的预测结果。本发明专利技术通过转换图像的特征空间和标签空间的流形结构为两个独立的概率分布，促进二者紧密匹配，从而提升区分度，确保特征差异大的图像能获得更为独特的标签分布。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于机器学习领域，具体的说是一种基于标记预测和标记增强的图像多维分类方法。

技术介绍

1、在机器学习领域当中，多标签分类是一个重要的图像分类方法，每个样本可以同时属于多个标签。这些标签来自同一个标签空间，并且标签之间可能存在复杂的依赖关系。然而，在实际应用中，每个图像可能会有多个维度的属性，每个类别遍历对应异构的类别空间，因此每个维度对应一个独立的分类任务，例如一台相机具有多个属性维度，如品牌(佳能、索尼、尼康等)、颜色(黑色、白色等)和价格范围(低、中、高)。于是，研究人员提出了多维分类(mdc)的学习范式。

2、研究人员在图像多维分类这一领域进行了深入的探索，并已经提出了多种算法来应对这一复杂问题。目前解决图像多维分类的方法都是从分类的角度去考虑的，在这些算法中，二进制优势(br)和类幂集(cp)是两种直接且常用的方法，它们在图像多维分类问题的处理中发挥了重要的作用。br方法的核心思想是为数据集中的每个类别单独训练一个二元分类器。这种方法将图像多维分类问题转化为多个独立的二元分类问题，从而简化了问题的复杂性。然而，由于忽略了类别之间的关联性，br方法在某些情况下可能会遇到性能瓶颈。cp方法则通过构建包含所有可能类别组合的幂集来训练多类别分类器。这种方法将图像多维分类问题转化为一个更大的多类别分类问题，其中每个样本都被标记为一个类别组合。通过训练一个能够处理这种类别组合的分类器，cp方法能够考虑类别之间的关联性，从而提高分类的性能。然而，cp方法需要处理一个更大的分类空间，这可能导致计算复杂度的增加。其他

3、近年来，标记增强技术在图像多维分类中的应用引起了广泛关注。标记增强阶段旨在从训练实例的特征和逻辑标签中恢复训练实例的潜在标签分布，获取每个样本的细致标签分布信息。这种特征增强不仅改善了分类器的输入数据质量，还使分类器能够更有效地捕捉到标签之间的相互依赖关系。然而，以往利用局部线性嵌入(lle)来获取拓扑信息用于图像多维分类的标记增强技术，面对特征差异较大的实例时，可能会生成过于相似或难以区分的标签分布，导致结果的不准确性。

技术实现思路

1、本专利技术是为了解决上述现有技术存在的不足之处，提出一种基于标记预测和标记增强的图像多维分类方法，以期在捕获全局数据结构的同时解决标签分布空间中的数据拥挤问题，从而产生更具差异性的标签分布，提高图像分类的准确性。

2、本专利技术为达到上述专利技术目的，采用如下技术方案：

3、本专利技术一种基于标记预测和标记增强的图像多维分类方法的特点在于，包括以下步骤：

4、步骤1：将设为输入空间，将设为输出空间，且表示输出空间为s个类别空间的笛卡尔积组成，表示第j个类别空间，且由kj个类标签组成，表示cj中第u个类标签，kj表示类标签的总数，1≤j≤s；s表示类别空间的总数；表示维度；

5、获取图像多维分类训练集其中，(xi,yi)表示第i个训练样本，t表示训练样本的个数；xi表示第i个图像特征，且xi∈x，是t个图像特征矩阵，其中，xij表示xi中第j维特征，yi表示xi的标记，且yi∈y，是标记矩阵；且yij表示xij的标记，yij∈cj；

6、步骤2：采用一对一标记编码方法将标记矩阵y编码为三元标记矩阵；

7、步骤2.1：对标记矩阵y进行一对一的标记编码，生成三元编码标记矩阵l＝[l1,l2,…,lj,…,ls]∈{1,0,-1}t×l，其中，是第j个类别空间cj的编码标记矩阵，lj表示lj的列维数，l表示l的列维数，lj＝kj(kj-1)/2且

8、步骤2.2：根据式(1)得到lj中第n列编码标记对应cj中的一对类标签取值

9、1≤n≤lj；

10、

11、式(1)中，表示中前一个类标签的取值，表示中后一个类标签的取值，表示第j个类别空间cj中第n+u-fj(u-1)个类标签，fj(u)表示第j个类别空间cj中前u个类标签与剩余类标签两两组合的种类总数，fj(u-1)表示第j个类别空间cj中前u-1个类标签与剩余标签两两组合的种类总数，当u＝0时，令fj(u)＝0；

12、步骤2.3：根据式(2)计算lj中第i行第n列的元素

13、

14、步骤3：对三元标记矩阵l中的监督信息进行增强，得到实值的标记置信度，从而将其恢复成一个实数标记分布矩阵；

15、步骤3.1：根据式(3)构建标记增强模型的目标函数

16、

17、式(3)中，d是待学习的实数标记分布矩阵，w是待学习的映射矩阵；p为特征相似矩阵，q为标记分布相似矩阵，α和β是两个平衡参数，t表示转置；ce表示交叉熵损失，并有：

18、

19、式(4)中，pij表示第i个图像特征xi和第j个图像特征xj之间的相似性，qij表示xi的标记分布向量di和xj的实数标记分布向量dj之间的相似性，di∈d，dj∈d，并有：

20、

21、式(5)和式(6)中，dis(xi-xj)表示xi与xj之间的距离，ρi是xi的局部连通性参数，δi是xi的局部连通性参数集，c和b是2个超参数；

22、步骤3.2：利用迭代策略对所述目标函数进行求解，得到最优实数标记分布矩阵d*和最优映射矩阵w*；

23、步骤4：基于最优标记分布矩阵d*构建多输出回归模型；

24、步骤4.1：利用式(7)构建多输出回归模型的目标函数minπ(r)：

25、

26、式(7)中，r＝φtθ是待确定的回归模型参数，是待确定的组合系数；

27、表示x的非线性映射示例矩阵，φ(·)表示核函数，且d′表示xi核化后的维度，m是度量矩阵，||·||m表示马氏距离；γ和ξ是2个正则化参数，||·||f表示frobenius范数；

28、步骤4.2：利用式(8)构建的度量矩阵m的目标函数minm→0：

29、

30、式(8)中，表示di在d中的k近邻，ir表示di的近邻序号，表示di的第r个近邻，det(m,il)＝tr(m)+tr(m-1)-2l为对称logdet散度，tr表示矩阵的迹，m-1表示m的逆矩阵，μ是正则化参数；

31、步骤4.3：采用交替优化的方式对式(7)中的θ和式(8)中的m进行计算，得到最优回归模型参数矩阵r*和度量矩阵m*；

32、步骤5：对未知类图像样本进行预测：

33、利用多输出回归模型的最优回归模型参数矩阵r*，得到未知类图像样本x*的预测标记分布d*＝(r*)tφ(x*)，并利用符号函数sign(·)生成d*的二进制标记向量，从而根据步骤2.2和步骤2.3对二进制标记向量进行逆操作，以得到未知类图像样本x*在每个类别空间的类别本文档来自技高网...

【技术保护点】

1.一种基于标记预测和标记增强的图像多维分类方法，其特征在于，包括以下步骤：

2.一种电子设备，包括存储器以及处理器，其特征在于，所述存储器用于存储支持处理器执行权利要求1所述图像多维分类方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。

3.一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行权利要求1所述图像多维分类方法的步骤。

【技术特征摘要】

1.一种基于标记预测和标记增强的图像多维分类方法，其特征在于，包括以下步骤：

2.一种电子设备，包括存储器以及处理器，其特征在于，所述存储器用于存储支持处理器执行权利要求1所述图像多维分类方法的程序，...

【专利技术属性】
技术研发人员：唐俊，孙闻雨，王科，鲍文霞，
申请(专利权)人：安徽大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人