基于置信度的多示例偏多标签图像分类方法技术

技术编号：44200738 阅读：1 留言：0更新日期：2025-02-06 18:36

本发明专利技术涉及机器学习的技术领域，更具体地，涉及一种基于置信度的多示例偏多标签图像分类方法。包括以下步骤：S1.构建基于置信度的多示例偏多标签图像分类目标方程；S2.求解目标函数，得到训练好的分类模型；S3.对图片训练集进行数据预处理，得到多示例图片集；S4.将步骤S3中的多示例图片集输入分类模型，得到图片的分类结果。本发的一种基于置信度的多示例偏多标签图像分类方法，在多示例偏多标签学习下引入示例置信度和标签置信度来解决示例级标签模糊性和包级标签模糊性，并结合启发式优化框架，通过交替优化的方法，提高了模型分类精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习的，更具体地，涉及一种基于置信度的多示例偏多标签图像分类方法。

技术介绍

1、在传统分类算法中，一个示例与多个分类标签相关，这些分类标签都是真实标签。跟传统分类算法不同，在偏多标签学习(partial multi-label learning,pml)算法中，一个示例与多个候选分类标签相关，这些候选分类标签可能同时包含真实标签和错误标签。例如，在图像分类中，一副图像可能只涉及天空、河流、房子三个部分的内容，但是，候选标签集合可能包含天空、河流、房子、树木、汽车五个分类标签。因此，pml需要在候选标签集合中，甄别出真实标签和错误标签。

2、在现有的pml算法中，绝大部分都是针对单示例数据设计的，只能处理单个示例与多个候选标签的关系。研究人员提出了多种单示例pml算法，这些算法包括利用数据和标签结构信息确定真标签的方法、使用对抗学习构建网络增强训练数据和预测标签连接的方法、基于输入数据流形训练梯度提升模型的方法、通过标签传播估计真标签并构建多标签学习分类器的方法等。但是，在实际图像分类应用中，一副图像可以转化为多个示例，因此需要处理多个示例与多个候选标签的关系。在这种情况下，pml算法只能处理单个示例与多个候选标签的关系，并不能处理多个示例与多个候选标签的关系。其次，多示例pml算法设计的关键在于如何处理示例标签模糊性和包标签模糊性以提升模型性能。在多示例pml算法中，数据集包含若干个包，每个包含有多个示例。只有包的候选标签已知，示例的候选标签已知未知，因此存在真标签未知以及示例与标签关系不明确的问

技术实现思路

1、本专利技术的目的在于克服现有技术多示例pml算法分类精度低的不足，提供一种基于置信度的多示例偏多标签图像分类方法，有效提升了多示例pml算法分类精度。

2、为解决上述技术问题，本专利技术采用的技术方案是：

3、提供一种基于置信度的多示例偏多标签图像分类方法，包括以下步骤：

4、s1.构建基于置信度的多示例偏多标签图像分类目标方程；

5、s2.求解目标函数，得到训练好的分类模型；

6、s3.对图片训练集进行数据预处理，得到多示例图片集；

7、s4.将步骤s3中的多示例图片集输入分类模型，得到图片的分类结果。

8、本专利技术提供的一种基于置信度的多示例偏多标签图像分类方法，解决了现有多示例pml算法在处理多示例数据时将包转换为单个向量导致难以准确识别多个内容的问题，本专利技术通过为示例和候选标签分配不同的置信度，并将其纳入到统一学习模型，以有效处理多示例pml中的包内容多样性以及候选标签模糊性，提升分类精度。

9、优选地，所述步骤s1具体包括：

10、置信度矩阵v＝[vk]q，vkvk表示跟标签yk相关的包的置信度向量，其中，sk是包含标签yk的所有包的集合，|sk|为集合sk里面的包的数量，为集合sk中包bi的置信度。有其中，为包bi的第j个示例(即xij)的置信度，mi为包bi的示例数量。

11、定义bi为数据集的第i个包，n表示数据集的包数量；xij为包bi的第j个示例，mi为包bi的示例数量；定义为示例xij相对于标签yk的置信度；定义pik和pil分别为包bi相当于标签yk和标签yl的置信度；||·||2表示l2距离的平方；定义特征原型矩阵q＝[qk]q，qk为跟标签yk相关的所有包的示例平均值，即其中，sk是包含标签yk的所有包的集合，|sk|为集合sk里面的包的数量，bh为集合sk的包，xhj为包bh的第j个示例，为示例xhj为相对于标签yk的置信度；定义wk和wl表示第k个分类器和第1个分类器的法向量，松弛变量为ξikl，c1和c2是正则化参数，为包bi的归一化常数；y表示标签空间的潜在标签yk集合，q表示y标签空间的潜在标签数量，表示包bi的候选标记集合，表示在标签空间y的补集。

12、建立基于置信度的多示例偏多标签图像分类目标方程：

13、

14、上述公式(1)为本专利技术提出的目标函数，第一项到第三项为在偏多标签分类框架下，使用排序支持向量机作为基分类器，建立统一学习模型，并融合示例置信度和标签置信度，通过交替优化学习分类器，提升模型性能。主要的两点是，第一通过引入标签置信度来区分真实标签和噪声标签，从而能够有效处理多示例偏多标签学习中的包级标签模糊性问题。第二通过引入示例置信度，能够区分正示例和负示例，使与包标签相关的示例在训练分类模型中发挥更关键的作用，从而能够有效处理多示例偏多标签学习中的示例级标签模糊性问题。另外，将标签置信度和示例置信度纳入到统一的学习模型中，提高了模型的分类精度。

15、优选地，在所述步骤s2中，采用轮换寻优的方式进行求解，得到最终的分类模型为其中，bt为需要预测的包，xtj为包bt的第j个样本。

16、优选地，所述步骤s2具体包括：

17、s21.初始化和pik的值，求解wk；

18、s22.固定wk和的值，求解pik；

19、s23.固定wk和pik的值，求解

20、s24.重复步骤s21至s23，直到收敛，得到最终的分类模型

21、优选地，所述步骤s21包括：

22、s211.初始化和pik的值，式(1)转化为：

23、

24、s212.定义如下向量：

25、w＝[w1，…，wq]∈rqd；

26、其中，其中第k个元素为第1个元素为其它元素为d维零向量；

27、其中，其中，

28、s213.在步骤s212所定义向量基础上，将公式(2)转化为二次规划问题：

29、

30、s214.通过引入拉格朗日乘子αi，将公式(3)转化为其对偶形式：

31、

32、式中，αi和αj分别表示第i个和第j个拉格朗日乘子；

33、s215.通过式(4)，得到αi的值；在αi值基础上，通过以下公式计算得到w：

34、

35、由于w＝[w1，…，wq]，可得到wk值(k＝1，2，...，q)。

36、优选地，在所述步骤s22中：当wk和的值已知，将式(1)转化为仅与包置信度pik相关的线性规划问题：

37、

38、求解式(5)，得到pik的值。

39、优选地，在步骤s23中，当wk和pik的值已知，将式(1)转化为只与示例置信度相关的二次规划问题：

4本文档来自技高网...

【技术保护点】

1.一种基于置信度的多示例偏多标签图像分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，在所述步骤S1中：定义Bi为数据集的第i个包，n表示数据集的包数量；Xij为包Bi的第j个示例，mi为包Bi的示例数量；定义为示例Xij相对于标签yk的置信度；定义pik和pil分别为包Bi相当于标签yk和标签yl的置信度；||·||2表示l2距离的平方；定义特征原型矩阵Q＝[Qk]q，Qk为跟标签yk相关的所有包的示例平均值，即其中，Sk是包含标签yk的所有包的集合，|Sk|为集合Sk里面的包的数量，Bh为集合Sk的包，Xhj为包Bh的第j个示例，为示例Xhj为相对于标签yk的置信度；定义wk和wl表示第k个分类器和第l个分类器的法向量，松弛变量为ξikl，C1和C2是正则化参数，为包Bi的归一化常数；Y表示标签空间的潜在标签yk集合，q表示Y标签空间的潜在标签数量，表示包Bi的候选标记集合，表示在标签空间Y的补集；

3.根据权利要求2所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，在所述步骤S

4.根据权利要求3所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，所述步骤S2具体包括：

5.根据权利要求4所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，所述步骤S21包括：

6.根据权利要求5所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，在所述步骤S22中：当wk和的值已知，将式(1)转化为仅与包置信度pik相关的线性规划问题：

7.根据权利要求6所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，在步骤S23中，当wk和pik的值已知，将式(1)转化为只与示例置信度相关的二次规划问题：

8.根据权利要求2至7任一项所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，在所述步骤S3中：对图片训练集进行数据预处理，得到多示例图片集其中，Bi表示第i个包，表示包Bi的候选标签集，n为包的数量。

9.根据权利要求2至7任一项所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，所述步骤S4包括：

10.一种计算机设备，包括存储器和处理器，所述的存储器存储有计算机程序，其特征在于，所述的处理器执行所述的计算机程序时实现权利要求l至9任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种基于置信度的多示例偏多标签图像分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，在所述步骤s1中：定义bi为数据集的第i个包，n表示数据集的包数量；xij为包bi的第j个示例，mi为包bi的示例数量；定义为示例xij相对于标签yk的置信度；定义pik和pil分别为包bi相当于标签yk和标签yl的置信度；||·||2表示l2距离的平方；定义特征原型矩阵q＝[qk]q，qk为跟标签yk相关的所有包的示例平均值，即其中，sk是包含标签yk的所有包的集合，|sk|为集合sk里面的包的数量，bh为集合sk的包，xhj为包bh的第j个示例，为示例xhj为相对于标签yk的置信度；定义wk和wl表示第k个分类器和第l个分类器的法向量，松弛变量为ξikl，c1和c2是正则化参数，为包bi的归一化常数；y表示标签空间的潜在标签yk集合，q表示y标签空间的潜在标签数量，表示包bi的候选标记集合，表示在标签空间y的补集；

3.根据权利要求2所述的基于置信度的多示例偏多标签图像分类方法，其特征在于，在所述步骤s2中，采用轮换寻优的方式进行求解，得到最终的分类模型为其中，bt为需要预测的包，xtj为包bt的第j个样本。...

【专利技术属性】
技术研发人员：肖燕珊，郑琼丽，刘波，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人