分类器构建方法和系统技术方案

技术编号：9489964 阅读：111 留言：0更新日期：2013-12-25 23:44

本发明专利技术设计一种分类器构建方法和系统。该构建方法包括以下步骤：从数据集中抽取N个样本集；将每个样本集作为根节点，求取每个根节点的属性空间中的M个属性的权重值，其中，M为属性的总数；根据权重值从M个属性中采用加权抽样抽取m个属性，构成属性子空间，且m小于M；采用划分函数从属性子空间的m个属性中选择最佳属性，根据最佳属性对根节点进行划分，产生子节点；对每个样本集递归重复节点划分直至生成单个随机森林分类器；根据N个单个随机森林分类器构建整体随机森林分类器。上述分类器构建方法和系统，采取对求取属性的权重值，根据其权重值进行加权抽样，构建的单个随机森林分类器的精度较高，从而提高了整体随机森林分类器的精度。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术设计一种分类器构建方法和系统。该构建方法包括以下步骤：从数据集中抽取N个样本集；将每个样本集作为根节点，求取每个根节点的属性空间中的M个属性的权重值，其中，M为属性的总数；根据权重值从M个属性中采用加权抽样抽取m个属性，构成属性子空间，且m小于M；采用划分函数从属性子空间的m个属性中选择最佳属性，根据最佳属性对根节点进行划分，产生子节点；对每个样本集递归重复节点划分直至生成单个随机森林分类器；根据N个单个随机森林分类器构建整体随机森林分类器。上述分类器构建方法和系统，采取对求取属性的权重值，根据其权重值进行加权抽样，构建的单个随机森林分类器的精度较高，从而提高了整体随机森林分类器的精度。【专利说明】分类器构建方法和系统
本专利技术涉及数据处理领域，特别是涉及一种分类器构建方法和系统。
技术介绍
数据种类很多，如文本数据、视频数据、图像数据等，可采用随机森林分类模型对文本数据或视频数据或图像数据进行分类。随机森林分类模型是由一组决策树分类模型组成，对于一些数据分类问题，单一个体决策树分类模型无法满足分类的精度要求，而利用同一训练数据建立多个决策树，以多个个体决策树的分类结果确定最终分类结果的分类技术，可显著提高数据的分类精度，从而满足应用需求。传统的随机森林分类模型构建时，从给定的一个训练数据中，采用有放回的随机抽样方法抽取建立K棵决策树的K个样本集，每个样本集的样本数与训练数据的样本数相同，但训练数据的同一样本可在单个样本集中重复出现。然后再用K个样本集构建K个决策树分类模型。该随机森林分类模型对维数不高的数据(如属性个数小于...

【技术保护点】
一种分类器构建方法，包括以下步骤：从数据集中抽取N个样本集；将每个样本集作为根节点，求取每个根节点的属性空间中的M个属性的权重值，其中，M为属性的总数；根据所述权重值从M个属性中采用加权抽样抽取m个属性，构成属性子空间，且m小于M；采用划分函数从属性子空间的m个属性中选择最佳属性，然后根据所述最佳属性对根节点进行划分，产生子节点；对每个样本集递归重复节点划分直至生成单个随机森林分类器；根据N个单个随机森林分类器构建整体随机森林分类器。

【技术特征摘要】

【专利技术属性】
技术研发人员：黄哲学，扎拉玛，李俊杰，陈小军，王强，
申请(专利权)人：深圳先进技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人