用于改善分类器的分类结果的方法技术

技术编号:9601180 阅读:175 留言:0更新日期:2014-01-23 05:45
一种用于改善分类器的分类结果的方法,包括:接收针对被所述分类器分类为多个类别其中之一的多个要素的分类结果;构建具有多个节点和多个标记的图形,其中各节点与所述多个要素其中之一相对应,各标记与所述多个类别其中之一相对应;在与相关要素相对应的节点之间添加边;在各节点和各标记之间添加边;以及使用图形切割算法来切割向着节点的边并且将所述图形分割成各类别,其中所述图形切割算法使用针对与该节点相对应的要素和相关要素的分类结果作为输入。

【技术实现步骤摘要】
【国外来华专利技术】本申请要求2011年3月4日提交的澳大利亚临时专利申请2011900783的优先权,其内容通过该引用而包含于此。
本专利技术涉及和软件。本专利技术将针对其在改善像素或图像分类结果方面的应用来进行说明;然而,应当理解,本专利技术的原理和概念等同地适用于其它分类任务。
技术介绍
可以使用机器学习算法来训练分类器以将多个要素分类为多个类别中的一个。该分类器预测各要素的分类,并且还可以评估该预测的置信度。分类器的一个现有示例是提升分类器(boosted classifier),其中该提升分类器组合一组“弱”分类器(分类精度低但比随机好)的输出以产生精度高的单个“强”分类器。在组合弱分类器时,根据各弱分类器的正确性的置信度来对弱分类器的结果进行加权。提升算法在训练下一弱分类器时可以通过向被弱分类器进行了误分类的样本赋予较大的权重来自适应地改善分类器的性能。尽管组合多个弱分类器,但强分类器并非必须针对给定问题产生精确分类。例如,在使用提升分类器来分割或选择图像中的特征的情况下,可能会误标记图像中的一些像素,这导致在由此得到的分割中存在噪声。可以通过使用诸如标记的腐蚀和膨胀等的简单形态滤波运算以去除小区域的噪声来在一定程度上清除该噪声。腐蚀使对象的大小缩小并且消除异常,膨胀使对象的大小增大并且填充孔。然而,这些运算的标准公式使运算的性质简化,因而这些运算在应用时无法包含附加信息。其它现有技术包括使用更加复杂的膨胀技术来对结果进行细化。在各膨胀步骤中,计算属于分割区域的该区域的边界附近的点的似然性,并且添加似然性为阈值以上的点。该似然性基于该区域内的图像强度。另一替代例是颜色分水岭分割来改善分类结果。该分类用来提取各区域的种子点。然后应用分水岭分割以扩展这些区域直到标记了所有像素为止。该扩展基于区域颜色信息。本专利技术的目的是提供用于改善分类器的分类结果的替代方法。以上
技术介绍
部分的论述是为了解释本专利技术的上下文。该论述不应被视为承认所引用的任何文献或其它材料被公开、被已知或者是属于本申请的权利要求中任一项的 优先权日:的公知常识的一部分。
技术实现思路
本专利技术提供一种,包括:接收针对被所述分类器分类为多个类别其中之一的多个要素的分类结果;构建具有多个节点和多个标记的图形,其中,各节点与所述多个要素其中之一相对应,各标记与所述多个类别其中之一相对应;在与相关要素相对应的节点之间添加边;在各节点和各标记之间添加边;以及使用图形切割算法来切割向着节点的边并且将所述图形划分成各类别,其中,所述图形切割算法使用针对与该节点相对应的要素和相关要素的分类结果作为输入。图形切割算法通过使能量函数最小化来计算图形向着两个以上的类别的最佳划分。在这种情况下,能量函数使用要素及其相关要素的分类结果作为输入。图形切割算法的应用可以使得对分类器进行了误分类的一些要素进行重新分类,从而改善分类结果。进行所述初始分类的分类器可以是为了将所述多个要素分类成三个以上的类别其中之一所应用的多类别分类器。因此,所述图形切割算法是用于将所述图形划分成三个以上的类别的多类别图形切割算法。多类别图形切割算法比二值图形切割更加复杂,但使得能够提供要素的更加有意义的分类。这种算法可以包括如Yuri Boykov、Olga Veksler和 Ramin Zabih^Fast approximate energy minimization via graph cuts,,IEEE Trans.Pattern Anal.Mach.1ntell., 23:1222 - 1239,November2001 所述的 α 扩展程序或 a β 扩展程序,其内容通过引用包含于此。 在a扩展中,每当在各节点的当前标记和来自一组可能标记的候选标记之间进行分割时,进行一系列图形切割。重复该过程,迭代各可能标记,直到收敛为止。在构建图形时,向标记不同的相邻节点之间添加辅助节点,以将该加标记的成本包括在切割中。所述分类器可以是提升分类器,其中所述提升分类器组合一组弱分类器的输出以产生强分类器。可选地,所述分类器可以是决策树、随机森林,或者可以使用线性判别分析(LDA)或任何其它技术以对要素分类。来自所述分类器的分类结果可以包括针对各要素的表示该要素的分类的置信度的置信度值,并且所述图形切割算法还使用针对与该节点相对应的要素的分类的置信度值作为输入。另外,所述图形切割算法还使用针对相关要素的分类的置信度值作为输入。图形分割在空间上使结果平滑化,从而降低分类或标记中的噪声。特别地,通常将保持置信度高的分类,而可以替换置信度低的分类以获得更加均质的输出。例如,在置信度低的要素被分类成置信度高的相同类别的相关要素包围的情况下,在置信度低的要素的分类中可能存在更多的置信度。基于同样的理由,在将相关要素分类成置信度高的不同类别的情况下,有充分的理由将置信度低的要素的分类改变为该类别。所述图形切割算法还使用相关要素具有相同分类的似然性作为输入。因而,利用图形分割算法最小化后的能量函数可以包括基于给定节点具有给定标记的置信度和两个相邻节点具有不同标记的似然性的项。分类中的要素可以是图像中的像素并且相关要素可以是图像中的相邻像素。可选地,这些要素可以是例如来自MRI扫描的3D体中的体素,并且相关要素可以是相邻体素。在另一示例中,这些要素可以是根据内容进行分类的文档,并且相关要素可以是其中一个文档包含针对另一文档的参考的文档对。在示例中,诸如递交日相同的同一 申请人:的标题为“Method and Software forAnalysing Microbial Growth”的共同未决的国际申请(其内容通过引用而包含于此)所述等,该方法可用来清理被训练成对固体培养基的图像数据中的像素和该固体培养基上的任何微生物生长(诸如细菌菌落等)进行分类的分类器的像素分类结果。在该示例中,还发现该方法改善了针对提升分类器的预测置信度低的像素的分类结果,从而得到固体培养基和任何微生物生长的更加精确的微生物评估。本领域技术人员应当理解,培养基例如通常是琼脂且通常包含在诸如平板等的容器中,并且在更具体的示例中,包含在可以具有盖的皮氏(Petri)培养皿中。在整个说明书中,以下将培养基和平板的组合称为“培养平板”(在现有技术中有时可能还称为“琼脂平板”)。在实施例中,相关要素包括8个相邻像素,使得在图形中,各像素完全连接至图像中的周围像素。这将得到图像的最精确划分但在计算上昂贵。为了减少计算并且提高算法的速度,可以仅向四个相邻像素添加边,例如在像素的3X3块中可以使角落像素连接至中间像素。在用于减少计算的又一替代例中,各要素可以是例如图像中的连续区域。因而相关要素可以是图像中的相邻连续区域。要素可以是颜色相同并且存在于边界内的一组邻近像素。在固体培养基上的细菌菌落的图像中,例如,分类器所检测到的各圆形区域或菌落可以是图形中的节点。连续区域还可以包括分类相同且置信度值高于阈值(例如,定义高置信度的阈值)的像素。该组像素可以定义图形中的单个要素。图形切割算法还可以使用诸如固体培养基上的细菌类型的预期菌落大小等的、图像中的对象的预期大小作为输入。这将使得图形切割算法能够去除比该大小小得多的簇。可选地或另外,图形切割算法还可以本文档来自技高网
...

【技术保护点】
一种用于改善分类器的分类结果的方法,包括:接收针对被所述分类器分类为多个类别其中之一的多个要素的分类结果;构建具有多个节点和多个标记的图形,其中,各节点与所述多个要素其中之一相对应,各标记与所述多个类别其中之一相对应;在与相关要素相对应的节点之间添加边;在各节点和各标记之间添加边;以及使用图形切割算法来切割向着节点的边并且将所述图形划分成各类别,其中,所述图形切割算法使用针对与该节点相对应的要素和相关要素的分类结果作为输入。

【技术特征摘要】
【国外来华专利技术】2011.03.04 AU 20119007831.一种用于改善分类器的分类结果的方法,包括: 接收针对被所述分类器分类为多个类别其中之一的多个要素的分类结果; 构建具有多个节点和多个标记的图形,其中,各节点与所述多个要素其中之一相对应,各标记与所述多个类别其中之一相对应; 在与相关要素相对应的节点之间添加边; 在各节点和各标记之间添加边;以及 使用图形切割算法来切割向着节点的边并且将所述图形划分成各类别,其中,所述图形切割算法使用针对与该节点相对应的要素和相关要素的分类结果作为输入。2.根据权利要求1所述的方法,其中,所述分类器是为了将所述多个要素分类成三个以上的类别其中之一所应用的多类别分类器。3.根据权利要求1或2所述的方法,其中,所述图形切割算法是用于将所述图形划分成三个以上的类别的多类别图形切割算法。4.根据权利要求1至3中任一项所述的方法,其中,所述分类器是提升分类器。5.根据权利要求1至4中任一项所述的方法,其中,所述分类结果包括针对各要素的表示该要素的分类的置信度的置信度值,并且所述图形切割算法还使用针对与该节点相对应的要素的分类的置信度值作 为输入。6.根据权利要求5所述的方法,其中,所述图形切割算法还使用针对相关要素的分类的置信度值作为输入。7.根据权利要求1至6中任一项所述的方法,其中,所述图形切割算法还使用相关要素具有相同分类的似然性作...

【专利技术属性】
技术研发人员:A·J·瓦登亨志B·W·S·沃德R·E·希尔
申请(专利权)人:LBT创新有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1