一种基于特征选择的分类改进算法制造技术

技术编号：31578953 阅读：16 留言：0更新日期：2021-12-25 11:21

本发明专利技术涉及一种分类改进算法，尤其涉及一种基于特征选择的分类改进算法。本发明专利技术提出了一种基于特征选择的分类改进算法。一种基于特征选择的分类改进算法，即SRBA算法，由SVM

全部详细技术资料下载

【技术实现步骤摘要】
一种基于特征选择的分类改进算法

[0001]本专利技术涉及一种分类改进算法，尤其涉及一种基于特征选择的分类改进算法。

技术介绍

[0002]随着社会的高速发展，信息流通，各行各业都进入了大数据时代。在实际应用场景中采集到的数据量大、特征值多，这种多特征值数据往往包含大量不相关和冗余的特征信息，过多的特征维度增加了数据分类的难度，降低了分类准确率，此时在分类模型中对多特征值数据进行特征降维及选择具有重大意义；在对事物依据某些特征进行分类时，基于单分类器的方法性能并不是很令人满意，而克服这一限制的可能的方法是在分类问题中采用集成方法。因此为了探究各行各业数据表现，根据事物重要特征进行分类、总结事物规律，本专利技术将特征选择方法
‑‑
支持向量机递归特征消除法与分类集成算法进行结合，集合成SRBA分类模型，形成一种更为有效、准确、稳定的分类模型和方法。
[0003]已有的与本专利技术原理最相近似的实现方案是：PCA降维方法，在进行特征选择时，只能针对于具有线性相关关系的特征，但现实场景中数据所包含的特征间关系复杂，大多具有非线性相关性，因此并不适用于大部分场景；在进行分类时，Bagging算法泛化能力较强，但该算法容易产生过拟合结果，需集成其他分类算法，降低过拟合可能性。
[0004]因此亟需研发一种能够保证模型的泛化能力，减少分类时间，增强其灵活性、自适应性和稳定性的基于特征选择的分类改进算法。

技术实现思路

[0005]为了克服分类时间长，使用场景少，灵活性较差、自适应性...

【技术保护点】

【技术特征摘要】
1.一种基于特征选择的分类改进算法，其特征在于，由SVM
‑
REF特征选择方法和Bagging
‑
AdaBoost分类模型的算法集成为所述的SRBA模型，所述SRBA模块包括有两个功能模块：首先进行数据预处理，使用SVM
‑
RFE对数据特征进行权重重要性排序，筛选出指定数量的特征作为模型输入；然后搭建Bagging
‑
AdaBoost分类模型，将集成学习技术应用于事物类型划分中。2.根据权利要求1所述的一种基于特征选择的分类改进算法，其特征在于，所述的一种基于特征选择的分类改进算法，具体分为以下步骤：(1)数据预处理；(2)SVM
‑
REF特征选择；(3)集成分类识别。3.根据权利要求2所述的一种基于特征选择的分类改进算法，其特征在于，步骤(1)所述的数据预处理具体为以下步骤：1.1填补缺失值；1.2归一化。4.根据权利要求3所述的一种基于特征选择的分类改进算法，其特...

【专利技术属性】
技术研发人员：刘兴惠，李至立，孙铭，方玉洁，
申请(专利权)人：山东纬横数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人