一种多级分类对象的分类方法和装置制造方法及图纸

技术编号:26067117 阅读:15 留言:0更新日期:2020-10-28 16:40
本发明专利技术公开了一种多级分类对象的分类方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:利用多级分类对象的样本特征数据,通过联合训练方式逐级构建级联分类模型,构建过程:根据第1级子分类器构建1级级联分类模型;2≤K≤N时,将多级分类对象的样本特征数据和K‑1级级联分类模型输出的多级分类对象的K‑1级分类信息共同输入第K级子分类器,以对K‑1级级联分类模型和第K级子分类器联合训练,得到K级级联分类模型;利用最终的N级级联分类模型对多级分类对象的待分类数据分类,得到N级分类信息。该实施方式考虑类间的亲疏性,分类效果好,可避免误差传递,提高分类准确率,整体模型复杂度低,降低模型开发的难度和工作量。

【技术实现步骤摘要】
一种多级分类对象的分类方法和装置
本专利技术涉及计算机
,尤其涉及一种多级分类对象的分类方法和装置。
技术介绍
多级分类是指类别本身存在层级的一种多分类问题。多级分类的最大特点是类别间存在明显的亲疏关系,例如,生物分为动物和植物,动物分为脊索动物和无脊索动物,植物又分为苔藓植物、蕨类植物等,其中脊索动物与无脊索动物更加亲近,而与苔藓植物则比较疏远。现有的多级分类方案:方案一是采用常规机器学习模型,例如支持向量机、神经网络、朴素贝叶斯、决策树等,其认为类别间毫无关联,不考虑类别间的亲疏关系;方案二是采用级联模型,先建立各级分类的子分类器,再通过一些技巧将多个子分类器进行融合,例如,先建立1个一级子分类器用来判别动物或植物,再建立两个二级子分类器,分别用来判别是脊索动物或无脊索动物,以及苔藓植物或蕨类植物。常规机器学习模型采用一刀切的处理方式,假设类别间毫无关联,不考虑类别之间的亲疏性,由于不能充分挖掘类间的隐藏信息,分类效果差强人意;传统级联模型一般采用判别式模型构建子分类器,先要确定一级分类,再用相应分类器确定二级分类,以此类推,其最主要缺点是当各级别分类拥有较多子类且分类层级较深时,往往需要构建数量庞大的子分类器,对模型开发的影响是灾难性的;此外,各级子分类器的误差向下传递,使得模型的累积误差随着分类层级的增加而迅速增长,较深层级的分类准确率较难保证。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:现有技术中,方案一未考虑类间的亲疏性,分类效果差;方案二存在累积误差,分类准确性差,且建模工作量大,模型复杂度高。
技术实现思路
有鉴于此,本专利技术实施例提供一种多级分类对象的分类方法和装置,能够考虑类间的亲疏性,分类效果好,并可避免误差传递,提高分类准确率,整体模型复杂度低,降低了模型开发的难度和工作量。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种多级分类对象的分类方法。一种多级分类对象的分类方法,包括:利用多级分类对象的样本特征数据,通过联合训练的方式逐级构建级联分类模型,以得到最终的N级级联分类模型(N为多级分类对象的分类级数),所述构建过程包括:根据第1级子分类器构建1级级联分类模型;当2≤K≤N时,将所述多级分类对象的样本特征数据和K-1级级联分类模型输出的所述多级分类对象的K-1级分类信息共同输入第K级子分类器,以对所述K-1级级联分类模型和所述第K级子分类器联合训练,得到K级级联分类模型;利用最终的所述N级级联分类模型对输入的所述多级分类对象的待分类数据进行分类,以得到所述多级分类对象的N级分类信息。可选地,在构建每一级级联分类模型之前,利用所述多级分类对象的样本特征数据训练该级的子分类器,其中,在每级只构建一个子分类器。可选地,训练各级子分类器的步骤,包括:在训练第1级子分类器时,以所述多级分类对象的样本特征数据作为所述第1级子分类器的输入,以所述多级分类对象的1级分类标注信息为训练目标;在训练第K级子分类器时,2≤K≤N,以所述多级分类对象的样本特征数据和第K-1级分类标注信息为所述第K级子分类器的输入,以所述多级分类对象的第K级分类标注信息为训练目标。可选地,所述子分类器通过满足产生式、可追加训练和联合训练的模型构建。根据本专利技术实施例的另一方面,提供了一种多级分类对象的分类装置。一种多级分类对象的分类装置,包括:级联分类模型构建模块,用于利用多级分类对象的样本特征数据,通过联合训练的方式逐级构建级联分类模型,以得到最终的N级级联分类模型(N为多级分类对象的分类级数),所述构建过程包括:根据第1级子分类器构建1级级联分类模型;当2≤K≤N时,将所述多级分类对象的样本特征数据和K-1级级联分类模型输出的所述多级分类对象的K-1级分类信息共同输入第K级子分类器,以对所述K-1级级联分类模型和所述第K级子分类器联合训练,得到K级级联分类模型;分类模块,用于利用最终的所述N级级联分类模型对输入的所述多级分类对象的待分类数据进行分类,以得到所述多级分类对象的N级分类信息。可选地,还包括子分类器训练模块,用于:在构建每一级级联分类模型之前,利用所述多级分类对象的样本特征数据训练该级的子分类器,其中,在每级只构建一个子分类器。可选地,所述子分类器训练模块还用于:在训练第1级子分类器时,以所述多级分类对象的样本特征数据作为所述第1级子分类器的输入,以所述多级分类对象的1级分类标注信息为训练目标;在训练第K级子分类器时,2≤K≤N,以所述多级分类对象的样本特征数据和第K-1级分类标注信息为所述第K级子分类器的输入,以所述多级分类对象的第K级分类标注信息为训练目标。可选地,所述子分类器训练模块还用于:通过满足产生式、可追加训练和联合训练的模型构建所述子分类器。根据本专利技术实施例的又一方面,提供了一种电子设备。一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本专利技术提供的多级分类对象的分类方法。根据本专利技术实施例的又一方面,提供了一种计算机可读介质。一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术提供的多级分类对象的分类方法。上述专利技术中的一个实施例具有如下优点或有益效果:利用多级分类对象的样本特征数据,通过联合训练的方式逐级构建级联分类模型,以得到最终的N级级联分类模型(N为多级分类对象的分类级数),构建过程包括:根据第1级子分类器构建1级级联分类模型;当2≤K≤N时,将多级分类对象的样本特征数据和K-1级级联分类模型输出的多级分类对象的K-1级分类信息共同输入第K级子分类器,以对K-1级级联分类模型和第K级子分类器联合训练,得到K级级联分类模型;利用最终的N级级联分类模型对输入的多级分类对象的待分类数据进行分类,以得到多级分类对象的N级分类信息。级联模型的使用可以更好地体现多级分类之间的亲疏关系,充分挖掘类间的隐藏信息,分类效果好;通过联合训练的方式逐级构建级联分类模型,可以避免误差传递,提高模型的分类准确率;各级分类下只构建单一子分类器,减少了整体模型复杂度,使得模型开发更加容易,工作量小;此外,级联分类模型的构建是上一级级联分类模型与当前级子分类器的模型融合,通过再训练的方式,进一步对模型参数进行优化,可以提高模型的泛化能力。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的多级分类对象的分类方法的主要步骤示意图;图2是根据本专利技术实施例的商城商品的多级分类示意图;图3是根据本专利技术实施例的级联分类模型的构建流程示意图;图4是根据本专利技术实施例的K级级联分类模型的结构示意图;图5是根据本专利技术实施例的多级分类对象的分类装置的主要模块示意图;图6是本专利技术实施例可本文档来自技高网
...

【技术保护点】
1.一种多级分类对象的分类方法,其特征在于,包括:/n利用多级分类对象的样本特征数据,通过联合训练的方式逐级构建级联分类模型,以得到最终的N级级联分类模型(N为多级分类对象的分类级数),所述构建过程包括:根据第1级子分类器构建1级级联分类模型;当2≤K≤N时,将所述多级分类对象的样本特征数据和K-1级级联分类模型输出的所述多级分类对象的K-1级分类信息共同输入第K级子分类器,以对所述K-1级级联分类模型和所述第K级子分类器联合训练,得到K级级联分类模型;/n利用最终的所述N级级联分类模型对输入的所述多级分类对象的待分类数据进行分类,以得到所述多级分类对象的N级分类信息。/n

【技术特征摘要】
1.一种多级分类对象的分类方法,其特征在于,包括:
利用多级分类对象的样本特征数据,通过联合训练的方式逐级构建级联分类模型,以得到最终的N级级联分类模型(N为多级分类对象的分类级数),所述构建过程包括:根据第1级子分类器构建1级级联分类模型;当2≤K≤N时,将所述多级分类对象的样本特征数据和K-1级级联分类模型输出的所述多级分类对象的K-1级分类信息共同输入第K级子分类器,以对所述K-1级级联分类模型和所述第K级子分类器联合训练,得到K级级联分类模型;
利用最终的所述N级级联分类模型对输入的所述多级分类对象的待分类数据进行分类,以得到所述多级分类对象的N级分类信息。


2.根据权利要求1所述的方法,其特征在于,在构建每一级级联分类模型之前,利用所述多级分类对象的样本特征数据训练该级的子分类器,其中,在每级只构建一个子分类器。


3.根据权利要求2所述的方法,其特征在于,训练各级子分类器的步骤,包括:
在训练第1级子分类器时,以所述多级分类对象的样本特征数据作为所述第1级子分类器的输入,以所述多级分类对象的1级分类标注信息为训练目标;
在训练第K级子分类器时,2≤K≤N,以所述多级分类对象的样本特征数据和第K-1级分类标注信息为所述第K级子分类器的输入,以所述多级分类对象的第K级分类标注信息为训练目标。


4.根据权利要求1所述的方法,其特征在于,所述子分类器通过满足产生式、可追加训练和联合训练的模型构建。


5.一种多级分类对象的分类装置,其特征在于,包括:
级联分类模型构建模块,用于利用多级分类对象的样本特征数据,通过联合训练的方式逐级构建级联分类模型,以得到最终的N级级联分类模型(N为多级分类对象的分类级数),所述构建过程包括:根据...

【专利技术属性】
技术研发人员:徐文峰
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1