【技术实现步骤摘要】
基于样本分布密度改进KKT条件的SVM增量学习方法
[0001]本专利技术属于机器学习
,涉及一种基于样本分布密度改进KKT条件的SVM增量学习方法。特别是针对样本分布不均匀情况下的SVM增量学习,可用于自动化增量学习下的SVM分类器在线更新。
技术介绍
[0002]支持向量机(Support Vector Machine,SVM)是20世纪90年代由Vapnik提出的一种机器学习模式识别分类算法,参考文献[Vapnik V.Statistical learning theory.New York:John Wiley&Sons,Inc.,1998],在小样本、高维特征的分类任务中表现优异。传统SVM算法是一种批量学习模式,即假设训练之前所有的训练样本可以一次性得到,训练完成则学习过程终止。然而在实际应用中,训练样本通常不可能一次全部得到,而是随着时间逐步得到的,新增样本包含的信息会随着时间产生变化。因此,分类器需要具备不断从这些样本数据中学习有用知识的能力,从而实现在新增样本条件下的分类器在线更新。
[0003]如何从新增样本数据中学习有用知识、保证通过学习训练更新后的模型具备更优的分类性能成为需要解决的重点问题。这个问题可以通过增量学习保留新增样本的重要信息来解决。增量学习思想概括为:在原有知识库的基础上,仅对新增数据引起的变化对原有知识库进行更新。这将可以大幅度节省新样本数据加入后的训练时间和内存需求。
[0004]Syed等提出的SVM增量学习算法是早期较为经典的算法,参
【技术保护点】
【技术特征摘要】
1.一种基于样本分布密度改进KKT条件的SVM增量学习方法,其特征在于,步骤如下:1)根据原始样本集A训练SVM分类器Model
old
,获得分类器Model
old
的支持向量集SV0与标准KKT条件Ⅰ;2)计算原始样本集A中正、负类样本的样本分布密度,并根据样本分布密度计算正、负样本下的偏置参数,在标准KKT条件Ⅰ的基础上增加偏置参数,构建SVM分类器Model
old
下针对正、负类样本自适应优化的改进KKT条件Ⅰ;3)判断新增样本集B中样本是否全部满足SVM分类器Model
old
的标准KKT条件Ⅰ,若全部满足,则输出原始SVM分类器Model
old
即为所需模型,结束;否则将新增样本集B中违背标准KKT条件Ⅰ的样本放入集合B1,满足标准KKT条件Ⅰ的样本放入集合B2;4)判断新增样本集B中样本是否满足SVM分类器Model
old
的改进KKT条件Ⅰ,将满足改进KKT条件Ⅰ的样本放入候选支持向量集SV1,定义为可能的支持向量样本;5)根据候选支持向量集SV1训练分类器Model1,获得分类器Model1的标准KKT条件Ⅱ,利用支持向量集SV1的样本分布密度计算正、负样本下的偏置参数,获得增加偏置参数后的改进KKT条件Ⅱ;6)判断集合B2是否满足改进KKT条件Ⅱ,若集合B2为空或所有样本均满足改进KKT条件Ⅱ,则输出更新后的模型即为分类器Model1,结束;否则将不满足改进KKT条件Ⅱ的样本放入补充支持向量集SV
add
;7)采用SV0∪SV1∪SV
add
集合训练分类器Model2并输出更新后的分类器为Model2,SV0为原始分类器的支持向量集,SV
add
为补充支持向量集。2.根据权利要求1所述的基于样本分布密度改进KKT条件的SVM增量学习方法,其特征在于,所述步骤1)中根据原始样本集训练SVM分类器Model
old
过程中采用LIBSVM工具箱,所述标准KKT条件Ⅰ表示如下式:SVM分类器的最优超平面最优解求解过程中,定义条件0≤α
ι
<X,标准KKT条件简化表示为y
i
f(x
i
)≤1;其中,C为惩罚系数,α=(α1,α2,...,α
n
)
T
为拉格朗日乘子,T表示矩阵的转置,y
i
∈[1,
‑
1]为样本标签,f(x
i
)为样本x
i
与最优超平面之间的距离。3.根据权利要求1所述的基于样本分布密度改进KKT条件的SVM增量学习方法,其特征在于,所述步骤2)中根据样本分布密度计算正、负样本下的偏...
【专利技术属性】
技术研发人员:王彩云,吴钇达,李阳雨,丁牧恒,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。