基于多级决策树的个性化分类流程优化方法和装置制造方法及图纸

技术编号:35761591 阅读:30 留言:0更新日期:2022-11-26 19:12
本发明专利技术提供一种基于多级决策树的个性化分类流程优化方法和装置,其中方法包括:基于待分类目标对应的分类先验知识和分类特征,构建先验多级特征池;接收用户对先验多级特征池触发的修改或确认操作,确定个性化多级特征池;基于个性化多级特征池的首要特征池和次级特征池,递归生成个性化分类决策树;个性化分类决策树的根节点仅基于个性化多级特征池的首要特征池中的分类特征确定;绘制并返回个性化分类决策树对应的流程图。本发明专利技术递归生成个性化分类决策树时,每次生成根节点时均从首要特征池中选择相应的分类特征,在兼顾分类准确性和用户个性化需求的目标指引下进行分类模型的筛选和执行顺序的确定,实现了不同分类方法的个性化融合。法的个性化融合。法的个性化融合。

【技术实现步骤摘要】
基于多级决策树的个性化分类流程优化方法和装置


[0001]本专利技术涉及数据处理
,尤其涉及一种基于多级决策树的个性化分类流程优化方法和装置。

技术介绍

[0002]随着人工智能技术的快速发展,在诸多分类场景,例如工业零件异常检测、异常人群检测、农业病虫害检测、基于医学影像的目标组织识别等领域,存在多种不同的分类方法,例如基于深度学习的图像分类模型、分类决策树模型等。
[0003]然而,不同分类方法的分类依据可能采用了不同的分类特征,在不同场景下不同分类方法的分类性能可能存在较大差距。因此,选取何种分类方法或者如何组合各种分类方法以达到更好的分类效果将是一个难题。更重要的是,在不同应用场景下,用户对于分类方法的性能要求、成本要求(例如时间成本)的需求不同,对于分类方法的执行能力不同(例如对于基于深度学习的图像分类模型,不同用户对于训练数据的获取的能力不同),不同分类方法在用户处的重要程度也不同。因此如何组合不同分类方法并优化目标分类的流程,使得分类流程在满足分类准确性要求的前提下更满足用户的个性化需求,成为了一个亟待解决的问题。

技术实现思路

[0004]本专利技术提供一种基于多级决策树的个性化分类流程优化方法和装置,用以解决现有技术中难以选择或组合不同的分类方法且无法适应不同应用场景下的特异性需求的缺陷。
[0005]本专利技术提供一种基于多级决策树的个性化分类流程优化方法,包括:获取用户输入的待分类目标对应的分类特征,并基于所述待分类目标对应的分类先验知识和分类特征,构建先验多级特征池;接收用户对所述先验多级特征池触发的修改或确认操作,确定个性化多级特征池;所述先验多级特征池和所述个性化多级特征池均包括一个首要特征池和若干个次级特征池;所述先验多级特征池的首要特征池中的分类特征是基于所述分类先验知识确定的使用次数高于预设次数阈值和/或执行优先级高于预设优先级阈值的分类特征;基于所述个性化多级特征池的首要特征池和次级特征池,递归生成个性化分类决策树;所述个性化分类决策树的根节点仅基于所述个性化多级特征池的首要特征池中的分类特征确定;绘制所述个性化分类决策树对应的流程图,并返回所述流程图。
[0006]根据本专利技术提供的一种基于多级决策树的个性化分类流程优化方法,所述分类特征包括多个不同的图像分类模型,以及多个所述待分类目标的图像特征提取器和/或多个所述待分类目标的属性特征提取器;所述图像分类模型用于对待识别图像进行图像识别以确定待识别图像中所述待分类目标的类型,所述图像特征提取器用于提取所述待分类目标
在待识别图像中的图像特征,所述属性特征提取器用于提取所述待分类目标在待识别图像中的统计特征以及所述待分类目标的分类辅助信息。
[0007]根据本专利技术提供的一种基于多级决策树的个性化分类流程优化方法,所述基于所述个性化多级特征池的首要特征池和次级特征池,递归生成个性化分类决策树,具体包括:根节点确定步骤:基于所述个性化多级特征池的首要特征池中不为历史根节点的分类特征,确定所述个性化分类决策树的当前根节点对应的分类特征;内部节点确定步骤:基于所述个性化多级特征池的首要特征池中当前根节点以外的其他分类特征和次级特征池中的分类特征,递归确定所述个性化分类决策树的内部节点对应的分类特征;决策树评估步骤:基于所述个性化分类决策树中各个节点对应的分类特征的分类成本,确定所述个性化分类决策树中各个分类流程的分类总成本;若任一分类流程的分类总成本不满足用户输入的成本约束条件,则重复执行所述根节点确定步骤和所述内部节点确定步骤,直至生成的个性化分类决策树中各个分类流程的分类总成本均满足所述成本约束条件。
[0008]根据本专利技术提供的一种基于多级决策树的个性化分类流程优化方法,所述基于所述个性化多级特征池的首要特征池中当前根节点以外的其他分类特征和次级特征池中的分类特征,递归确定所述个性化分类决策树的内部节点对应的分类特征,具体包括:确定所述个性化多级特征池的首要特征池和次级特征池中除当前节点的祖先节点对应的分类特征以外的分类特征,作为当前节点的候选分类特征;计算所述当前节点的各个候选分类特征的分类成本以及所述各个候选分类特征对应的划分增益;其中,任一候选分类特征对应的划分增益是利用所述任一候选分类特征对训练样本进行分类后,通过计算分类结果对应的信息熵、信息增益、信息增益率或基尼系数得到的;基于所述各个候选分类特征的分类成本及其对应的划分增益,确定所述当前节点对应的分类特征。
[0009]根据本专利技术提供的一种基于多级决策树的个性化分类流程优化方法,所述基于所述各个候选分类特征的分类成本及其对应的划分增益,确定所述当前节点对应的分类特征,之后还包括:若所述当前节点对应的划分增益满足预设增益约束或所述当前节点的深度已经达到用户输入的最大深度,则将所述当前节点置为叶子节点。
[0010]根据本专利技术提供的一种基于多级决策树的个性化分类流程优化方法,任一分类特征的分类成本是利用所述任一分类特征进行分类所花费的时间成本;所述任一分类特征的分类成本是基于利用所述任一分类特征对各个训练样本进行分类所花费的时间均值确定的。
[0011]根据本专利技术提供的一种基于多级决策树的个性化分类流程优化方法,所述基于所述个性化多级特征池的首要特征池和次级特征池,递归生成个性化分类决策树,具体包括:基于测试样本确定当前生成的个性化分类决策树的分类性能以及所述个性化多级特征池中各个分类特征的单类别分类性能;若当前生成的个性化分类决策树的分类性能低于所述个性化多级特征池中任一
分类特征的单类别分类性能,则对当前生成的个性化分类决策树进行剪枝优化,得到优化后的个性化分类决策树;若所述优化后的个性化分类决策树的分类性能仍低于所述个性化多级特征池中任一分类特征的单类别分类性能,则向用户推送特征池调整信息;接收用户对所述个性化多级特征池触发的调整操作,确定更新后的个性化多级特征池,并基于所述更新后的个性化多级特征池的首要特征池和次级特征池,递归生成下一个性化分类决策树。
[0012]本专利技术还提供一种基于多级决策树的个性化分类流程优化装置,包括:先验信息构建单元,用于获取用户输入的待分类目标对应的分类特征,并基于所述待分类目标对应的分类先验知识和分类特征,构建先验多级特征池;个性化信息构建单元,用于接收用户对所述先验多级特征池触发的修改或确认操作,确定个性化多级特征池;所述先验多级特征池和所述个性化多级特征池均包括一个首要特征池和若干个次级特征池;所述先验多级特征池的首要特征池中的分类特征是基于所述分类先验知识确定的使用次数高于预设次数阈值和/或执行优先级高于预设优先级阈值的分类特征;决策树生成单元,用于基于所述个性化多级特征池的首要特征池和次级特征池,递归生成个性化分类决策树;所述个性化分类决策树的根节点仅基于所述个性化多级特征池的首要特征池中的分类特征确定;个性化流程图绘制单元,用于绘制所述个性化分类决策树对应的流程图,并返回所述流程图。
[0013]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多级决策树的个性化分类流程优化方法,其特征在于,包括:获取用户输入的待分类目标对应的分类特征,并基于所述待分类目标对应的分类先验知识和分类特征,构建先验多级特征池;接收用户对所述先验多级特征池触发的修改或确认操作,确定个性化多级特征池;所述先验多级特征池和所述个性化多级特征池均包括一个首要特征池和若干个次级特征池;所述先验多级特征池的首要特征池中的分类特征是基于所述分类先验知识确定的使用次数高于预设次数阈值和/或执行优先级高于预设优先级阈值的分类特征;基于所述个性化多级特征池的首要特征池和次级特征池,递归生成个性化分类决策树;所述个性化分类决策树的根节点仅基于所述个性化多级特征池的首要特征池中的分类特征确定;绘制所述个性化分类决策树对应的流程图,并返回所述流程图。2.根据权利要求1所述的基于多级决策树的个性化分类流程优化方法,其特征在于,所述分类特征包括多个不同的图像分类模型,以及多个所述待分类目标的图像特征提取器和/或多个所述待分类目标的属性特征提取器;所述图像分类模型用于对待识别图像进行图像识别以确定待识别图像中所述待分类目标的类型,所述图像特征提取器用于提取所述待分类目标在待识别图像中的图像特征,所述属性特征提取器用于提取所述待分类目标在待识别图像中的统计特征以及所述待分类目标的分类辅助信息。3.根据权利要求1或2所述的基于多级决策树的个性化分类流程优化方法,其特征在于,所述基于所述个性化多级特征池的首要特征池和次级特征池,递归生成个性化分类决策树,具体包括:根节点确定步骤:基于所述个性化多级特征池的首要特征池中不为历史根节点的分类特征,确定所述个性化分类决策树的当前根节点对应的分类特征;内部节点确定步骤:基于所述个性化多级特征池的首要特征池中当前根节点以外的其他分类特征和次级特征池中的分类特征,递归确定所述个性化分类决策树的内部节点对应的分类特征;决策树评估步骤:基于所述个性化分类决策树中各个节点对应的分类特征的分类成本,确定所述个性化分类决策树中各个分类流程的分类总成本;若任一分类流程的分类总成本不满足用户输入的成本约束条件,则重复执行所述根节点确定步骤和所述内部节点确定步骤,直至生成的个性化分类决策树中各个分类流程的分类总成本均满足所述成本约束条件。4.根据权利要求3所述的基于多级决策树的个性化分类流程优化方法,其特征在于,所述基于所述个性化多级特征池的首要特征池中当前根节点以外的其他分类特征和次级特征池中的分类特征,递归确定所述个性化分类决策树的内部节点对应的分类特征,具体包括:确定所述个性化多级特征池的首要特征池和次级特征池中除当前节点的祖先节点对应的分类特征以外的分类特征,作为当前节点的候选分类特征;计算所述当前节点的各个候选分类特征的分类成本以及所述各个候选分类特征对应的划分增益;其中,任一候选分类特征对应的划分增益是利用所述任一候选分类特征对训练样本进行分类后,通过计算分类结果对应的信息熵、信息增益、信息增益率或基尼系数得
到的;基于所述...

【专利技术属性】
技术研发人员:吕行邝英兰叶莘
申请(专利权)人:珠海横琴圣澳云智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1