自适应向量投影的非线性支持向量选取方法技术

技术编号：11688742 阅读：148 留言：0更新日期：2015-07-07 22:17

本发明专利技术公开了自适应向量投影的非线性支持向量选取方法，方法用于非线性数据的文本分类，包括以下步骤：(1)将原始样本映射到高维空间转化为线性样本；(2)计算线性样本的中心距离；(3)将线性样本投影到线性样本的中心向量后，在一维空间内选取具有原始特征的边界样本；(4)利用支持向量机对边界样本进行训练，得到分类结果。本发明专利技术自适应向量投影的非线性支持向量选取方法相较于现有的支持向量机的方法，针对非线性不可分的数据，其分类精度更高，分类速度更快，更适用于人脸识别、手写体识别，文本分类等领域内。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于支持向量机的学习方法，具体涉及一种自适应向量投影的非线性支持向量选取方法。
技术介绍
统计学习理论最早提出于20世纪60年代，它是针对小样本进行研宄，20世纪90 年代中期，Vapnik基于此理论提出了新的学习算法--支持向量机。近年来，支持向量机的研宄获得了越来越多的关注，支持向量机已经成功应用于许多实际问题，例如人脸识别、手写体识别，文本分类等。文本分类是信息过滤、信息检索、搜索引擎、文本数据库、数字化图书管等领域的技术基础，而支持向量机是文本分类的最主要最简单的手段之一。然而，标准支持向量机的训练速度比较慢，在实际应用中受到极大限制，通过研宄发现，支持向量机在训练的时候，仅仅由位于边界的支持向量决定，因此如果能预先确定支持向量，能够极大的加快支持向量机的训练速度。目前很多相关的算法被提出，例如 Chunking算法，Decomposing算法和序列最小最优化算法，这些算法获得支持向量需要多次迭代。为了加快获得支持向量的时间，研宄者提出了一种改进的支持向量机BS-SVM(见参考文献1)、基于向量投影的支撑向量预选取方法（见参考文献2)。然而在实际中，由于样本分布难以预测，如何选取边界向量代替支持向量成为研宄的关键。在文献2中采用类中心向量作为投影方向，但是当样本分散时，类中心并不能反映该样本的原始特征，降低分类精度。针对样本分布不均匀和离散度大的问题，在选取支持向量时，难以确定包含原始样本特征的边界向量，从而造成分类速度低下。而随着科技的日益发展，在信息过滤、信息检索、搜索引擎、文本数据库、数字化图...

【技术保护点】
自适应向量投影的非线性支持向量选取方法，所述方法用于非线性数据的文本分类，其特征在于，包括以下步骤：(1)将原始样本映射到高维空间转化为线性样本；(2)计算所述线性样本的中心距离；(3)将线性样本投影到所述线性样本的中心向量后，在一维空间内选取具有原始特征的边界样本；(4)利用支持向量机对边界样本进行训练，得到分类结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：郭亚琴，秦燕，王青，
申请(专利权)人：南通理工学院，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人