一种多级分类对象的分类方法和装置制造方法及图纸

技术编号：26067117 阅读：21 留言：0更新日期：2020-10-28 16:40

本发明专利技术公开了一种多级分类对象的分类方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：利用多级分类对象的样本特征数据，通过联合训练方式逐级构建级联分类模型，构建过程：根据第1级子分类器构建1级级联分类模型；2≤K≤N时，将多级分类对象的样本特征数据和K‑1级级联分类模型输出的多级分类对象的K‑1级分类信息共同输入第K级子分类器，以对K‑1级级联分类模型和第K级子分类器联合训练，得到K级级联分类模型；利用最终的N级级联分类模型对多级分类对象的待分类数据分类，得到N级分类信息。该实施方式考虑类间的亲疏性，分类效果好，可避免误差传递，提高分类准确率，整体模型复杂度低，降低模型开发的难度和工作量。

全部详细技术资料下载

【技术实现步骤摘要】
一种多级分类对象的分类方法和装置
本专利技术涉及计算机
，尤其涉及一种多级分类对象的分类方法和装置。
技术介绍
多级分类是指类别本身存在层级的一种多分类问题。多级分类的最大特点是类别间存在明显的亲疏关系，例如，生物分为动物和植物，动物分为脊索动物和无脊索动物，植物又分为苔藓植物、蕨类植物等，其中脊索动物与无脊索动物更加亲近，而与苔藓植物则比较疏远。现有的多级分类方案：方案一是采用常规机器学习模型，例如支持向量机、神经网络、朴素贝叶斯、决策树等，其认为类别间毫无关联，不考虑类别间的亲疏关系；方案二是采用级联模型，先建立各级分类的子分类器，再通过一些技巧将多个子分类器进行融合，例如，先建立1个一级子分类器用来判别动物或植物，再建立两个二级子分类器，分别用来判别是脊索动物或无脊索动物，以及苔藓植物或蕨类植物。常规机器学习模型采用一刀切的处理方式，假设类别间毫无关联，不考虑类别之间的亲疏性，由于不能充分挖掘类间的隐藏信息，分类效果差强人意；传统级联模型一般采用判别式模型构建子分类器，先要确定一级分类，再用相应分类器确定二级分类，以此类推，其最主要缺点是当各级别分类拥有较多子类且分类层级较深时，往往需要构建数量庞大的子分类器，对模型开发的影响是灾难性的；此外，各级子分类器的误差向下传递，使得模型的累积误差随着分类层级的增加而迅速增长，较深层级的分类准确率较难保证。在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：现有技术中，方案一未考虑类间的亲疏性，分类效果差；方案二存在累...

【技术保护点】
1.一种多级分类对象的分类方法，其特征在于，包括：/n利用多级分类对象的样本特征数据，通过联合训练的方式逐级构建级联分类模型，以得到最终的N级级联分类模型(N为多级分类对象的分类级数)，所述构建过程包括：根据第1级子分类器构建1级级联分类模型；当2≤K≤N时，将所述多级分类对象的样本特征数据和K-1级级联分类模型输出的所述多级分类对象的K-1级分类信息共同输入第K级子分类器，以对所述K-1级级联分类模型和所述第K级子分类器联合训练，得到K级级联分类模型；/n利用最终的所述N级级联分类模型对输入的所述多级分类对象的待分类数据进行分类，以得到所述多级分类对象的N级分类信息。/n

【技术特征摘要】
1.一种多级分类对象的分类方法，其特征在于，包括：
利用多级分类对象的样本特征数据，通过联合训练的方式逐级构建级联分类模型，以得到最终的N级级联分类模型(N为多级分类对象的分类级数)，所述构建过程包括：根据第1级子分类器构建1级级联分类模型；当2≤K≤N时，将所述多级分类对象的样本特征数据和K-1级级联分类模型输出的所述多级分类对象的K-1级分类信息共同输入第K级子分类器，以对所述K-1级级联分类模型和所述第K级子分类器联合训练，得到K级级联分类模型；
利用最终的所述N级级联分类模型对输入的所述多级分类对象的待分类数据进行分类，以得到所述多级分类对象的N级分类信息。

2.根据权利要求1所述的方法，其特征在于，在构建每一级级联分类模型之前，利用所述多级分类对象的样本特征数据训练该级的子分类器，其中，在每级只构建一个子分类器。

3.根据权利要求2所述的方法，其特征在于，训练各级子分类器的步骤，包括：
在训练第1级子分类器时，以所述多级分类对象的样本特征数据作为所述第1级子分类器的输入，以所述多级分类对象的1级分类标注信息为训练目标；
在训练第K级子分类器时，2≤K≤N，以所述多级分类对象的样本特征数据和第K-1级分类标注信息为所述第K级子分类器的输入，以所述多级分类对象的第K级分类标注信息为训练目标。

4.根据权利要求1所述的方法，其特征在于，所述子分类器通过满足产生式、可追加训练和联合训练的模型构建。

5.一种多级分类对象的分类装置，其特征在于，包括：
级联分类模型构建模块，用于利用多级分类对象的样本特征数据，通过联合训练的方式逐级构建级联分类模型，以得到最终的N级级联分类模型(N为多级分类对象的分类级数)，所述构建过程包括：根据...

【专利技术属性】
技术研发人员：徐文峰，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人