System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及机器学习、图像多标签分类和数据流分类,特别涉及一种在线自适应核选择方法。
技术介绍
1、图像多标签数据流分类是计算机视觉和机器学习领域中一项重要的任务,涉及到实时处理和分析一幅图像所关联的所有标签,在智能监控系统、社交媒体内容分析等领域有广泛应用。在图像多标签数据流分类问题中,图像以数据流的形式持续不断到来,每张图像可能与多个标签相关联,任务则是在每张图像到来后,能从一个从预定义的标签集中实时识别出与该对象相关联的所有标签。
2、传统的离线多标签分类方法在新的图像到达后,往往需要重新训练新的分类模型,具有较贵的训练成本,难以满足实时识别的需求。相比而言,在线方法能够增量地更新分类模型,并实时预测,因此在数据流分类中占据重要的地位。在在线方法中,由于核方法能够显著增强方法处理复杂非线性预测问题的能力,因此已经引起广泛关注和研究。在在线核方法中,核的选择是至关重要的,好的选择可以带来成功的任务结果,而差的选择会使任务更具挑战性。
3、在多标签分类领域中,近来提出的在线核方法包括paml(passive aggressivemulti-label classification)算法和falt(first-order adaptive labelthresholding)算法。对于任何输入实例,这两个算法的理想目标都是要将实例的相关标签的分数排名在标签阈值以上,并确保标签阈值高于不相关标签的分数,从而通过与标签阈值进行比较,将实例的相关和无关标签分开。这个目标被形式化为一个具有l个约束的优化问题。直
4、上述可用于图像多标签数据流分类的在线核方法普遍存在一个缺陷,即采用离线的核函数选择策略。这些策略要么依赖于先验知识预定义一个核函数,要么借助于可用数据从一组核中选择出一个适合的核。然而,在实际应用中,往往缺乏足够的先验知识。此外,在数据流的背景下,数据是按顺序逐步到达的,且全局数据结构在开始在线学习之前是未知的。因此,可用于核选择的数据通常非常有限。这种情况会导致离线核选择策略选择出次优的核,从而影响在线多标签预测的性能。
技术实现思路
1、针对现有技术中存在的不足,本专利技术提供了一种用于图像多标签数据流分类的在线自适应核选择方法,解决现有方法的上述缺陷,能在在线学习的过程中执行核函数的选择,同时进行多标签核分类器的在线学习,以期望能从一个可能很大的预定义核函数池中快速识别出全局最优的核函数,有效避免使用次优的核,同时取得与事后方知的最佳固定的单核多标签模型一样好的性能,极大提高已有的在线核方法的在线多标签预测性能。
2、本专利技术的目的是这样实现的:一种用于图像多标签数据流分类的在线自适应核选择方法,包括以下步骤:
3、步骤1)在第t轮,程序接收到一个待识别图像的特征向量
4、步骤2)利用特征映射子程序将xt分别映射到p个特征空间,得到映射后的特征向量其中,对于任意的p∈{1,2,…,p},φp(·)是核函数kp蕴含的非线性特征映射,dp是第p个映射后的特征空间的维度;
5、步骤3)使用当前最新的多标签核分类器来实时预测xt的相关标签集,其中且对于任意的p∈{1,2,…,p},μt=[μ1,t,…,μp,t]t∈δ,且该多标签核分类器由p个单核多标签分类器wp,t以及相对应的组合系数μp,t组成,而每个单核多标签分类器wp,t则包含l个标签得分预测器和1个标签阈值预测器;预测xt的相关标签集为:
6、
7、步骤4)预测结束后,xt的真实的相关标签集yt被揭晓,然后进入多标签核分类器的在线更新子程序,该子程序通过解决一个涉及到p个单核多标签分类器及其组合系数的联合优化问题来得到多标签核分类器的迭代更新公式,从而得到下一轮的多标签核分类器
8、步骤5)回到步骤1),等待第t+1轮的图像特征向量;若没有新的特征向量传入,则退出程序。
9、进一步的,步骤1)前需要给定一个图像多标签数据流{(x1,y1),(x2,y2),…,(xt,yt)},其中是t时刻到达的一张图像经过特征提取后得到的d维的实值向量,是与xt相联系的相关标签的集合,表示所有可能的标签的集合,l是标签的总数;使用一个预定义的核函数集合{k1,k2,...,kp}作为输入,其中p表示预定义的核函数的数目。
10、进一步的,对于任意特征向量以及任意的p∈{1,2,…,p},所述核函数kp满足条件kp(xi,xj)≤1。
11、进一步的,步骤3)中多标签核分类器的迭代更新公式推导方法如下:
12、首先,定义如下的损失函数来评估多标签核分类器在样本(x,y)上的多标签分类性能表现:
13、
14、其中,|y|表示集合y的大小,表示与x无关的标签的集合,根据统计学习中的正则化框架,找到最小化正则化损失的即求解如下问题:
15、
16、其中,是正则化项,λ>0是一个预定义的正则化系数,||wp||f是矩阵wp的f范数,是向量的2-范数;
17、然后,定义如下损失函数来评估单核多标签模型wp在样本(φp(x),y)上的分类性能:
18、
19、由于,μ=[μ1,…,μp]∈δ是一个概率分布,函数g(z)=max{0,1-z}是一个凸函数,利用jensen不等式,得到在原始优化目标中将l替换为它的上界,并重新整理后得到如下优化问题:
20、
21、其中,表示正则化的单核模型的损失;
22、最后,求解上述两个子问题,第一个子问题涉及到在每个映射后的特征空间中找到一个最优的单核多标签模型,其目标是最小化所有样本上的正则化单核损失;第二个子问题旨在确定最优的组合系数,以最小化由这些最优的单核多标签模型产生的损失的加权平均值。
23、进一步的,使用在线梯度下降法增量地求解第一个子问题:
24、初始时,设置也即是,对于任意的p∈{1,2,…,p},任意的i∈{1,2,…,l+1},设置当第t≥1轮,按照如下公式得到
25、
26、其中,ft(wp)是f(wp;(φp(xt),yt))的简写,是ft(wp)关于的次梯度在wp,t处的具体值,η<1/λ是预定义的学习步长;计算得到且
27、
28、其中这里表示一个指示函数,在条件h成立时,不成立时,带入得到每个单核多标签模型的迭代更新公式:
29、
30、对于所有的p=1,2,…,p,依次应用此公式,得到w1,t+1,w2,t+1,…,wp,t+1,从而得到
31、进一步的,使用专家预本文档来自技高网...
【技术保护点】
1.一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,步骤1)前需要给定一个图像多标签数据流{(x1,Y1),(x2,Y2),…,(xT,YT)},其中是t时刻到达的一张图像经过特征提取后得到的d维的实值向量,是与xt相联系的相关标签的集合,表示所有可能的标签的集合,L是标签的总数;使用一个预定义的核函数集合{K1,K2,...,KP}作为输入,其中P表示预定义的核函数的数目。
3.根据权利要求2所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,对于任意特征向量以及任意的p∈{1,2,…,P},所述核函数Kp满足条件Kp(xi,xj)≤1。
4.根据权利要求1-3中任一项所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,步骤3)中多标签核分类器的迭代更新公式推导方法如下:
5.根据权利要求4所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,使用在线梯度下降法
6.根据权利要求5所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,使用专家预测算法Hedge算法增量地求解第二个子问题:
7.根据权利要求6所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,步骤3)中多标签核分类器的在线更新子程序步骤如下:
8.根据权利要求7所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,在运行本方法前,需要提前确定好算法的超参数,包括正则化系数λ,学习步长η,学习步长β。
...【技术特征摘要】
1.一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,步骤1)前需要给定一个图像多标签数据流{(x1,y1),(x2,y2),…,(xt,yt)},其中是t时刻到达的一张图像经过特征提取后得到的d维的实值向量,是与xt相联系的相关标签的集合,表示所有可能的标签的集合,l是标签的总数;使用一个预定义的核函数集合{k1,k2,...,kp}作为输入,其中p表示预定义的核函数的数目。
3.根据权利要求2所述的一种用于图像多标签数据流分类的在线自适应核选择方法,其特征在于,对于任意特征向量以及任意的p∈{1,2,…,p},所述核函数kp满足条件kp(xi,xj)≤1。
4.根据权利要求1-3中任一项所述的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。