分类器训练方法和系统技术方案

技术编号:12674523 阅读:308 留言:0更新日期:2016-01-07 18:53
本发明专利技术提供了一种分类器自适应训练方法和系统。该方法包括:采用当前分类器在线识别连续输入的多帧图像,并将被识别的图像作为高置信度正负样本直接添加到分类器的样本库;以及将当前分类器难以识别的图像输出为疑难样本,并针对所述疑难样本的上下文,将其识别为正负可信样本,并赋予所识别正负可信样本一定权重后将其添加到分类器的样本库。

【技术实现步骤摘要】

本专利技术涉及在图像中识别具体对象的领域,具体而言,涉及对图像分类器的自适 应训练方法和使用该方法的系统。
技术介绍
随着数字技术的广泛普及,尤其是图像数字化的广泛应用,人们利用图像来识别 具体对象的需求也越来越多。数字图像的大量产生对人工识别来说带来了繁重的工作任 务。为此,人们期望一种能够自动识别图像中具体对象的技术。因此,对象自动识别技术应 运而生。目标识别主要应用在视频监控领域。为了识别图像中的具体目标,一方面要提取 目标的一些具体特征,另一方面要基于送些具体特征获得一些正负图像样本来训练分类 器,从而通过训练过的分类器来对当前获得的图像进行检测,从而识别当前输入图像中是 否包含有目标W及目标的位置。具体而言,监控识别系统通过采集在各种光照条件的对象 的正负样本,对它们提取特征,并进行聚类,对于聚成的各个子类分别训练分类器,然后采 用经过训练的分类器来进行对象检测。在进行对象检测时,首先获取当前场景的图像,然后 生成可能存在对象的候选区域,对每个候选区域提取特征,并根据送些特征将候选区域划 分到对应的子类,最后利用对应子类的分类器判别该候选区域是否存在对象。因此,为了提 高图像中对象的识别精度,一方面要在特征提取方面进行改进,另一方面在于在分类器方 面进行改进。特征提取的改进通常对具体对象的识别具有指向性,但是分类器的改进则对 所有识别系统具有普遍意义。 图1所示的是现有技术中训练子类分类器的流程图。如图1所示,在步骤S11处, 分类器训练单元从系统的存储器的样本库中读取样本图像。包含有对象图案的样本图像称 为正样本,而没有包含对象图案的歴本图像称为负样本。在步骤S12处,特征提取单元从每 幅样本图像中提取特征向量。随后,在步骤S13处,基于每幅图所提取的特征向量,进行聚 类处理。聚类可W采用常见的K近邻法、K均值聚类法。具体而言就是对每幅图像的特征 向量进行相似度比较,两两之间的相似度在一定阔值范围之内的特征向量所对应的两幅样 本图像归为一类。当然,也可W采用现有的其他方式进行聚类。实际上,聚类是一种常规技 术,包含了各种聚类方式,因此不在此进行具体描述。之后,在步骤S14处,将归为一类的所 有向量对应的样本图像归为一个子类,并对每个子类进行编号。送些子类在特征空间中的 均值和方差将被储存供检测时划分候选图像时使用。最后在步骤S15处,利用现有的机器 学习等方法对每个子类训练把正负样本分开的分类器。训练子类分类器可采用支持向量 机、AdaBoost等。 在针对每个子类训练了子类分类器之后,可W利用子类来检测现场所获得的图像 中是否存在对象。图2所示的是现有技术中基于被训练的子类分类器进行候选图像内对象 检测的流程图。如图2所示,首先需要在步骤S21处从当前场景中检测候选图像区域作为 输入图像。利用一些简单的特征,如依靠对称性,或者化ar+AdaBoost框架等。场景图像通 常采用场景图像获取单元获取。场景图像获取单元通常为摄像机,其可w基于对象的拍摄 照片,不断场景图像输入给计算机。随后,在步骤S22处,特征提取单元从所接收的场景图 像中提出特征向量。接着,在步骤S23处,计算对应场景图像的特征向量与样本图像集合中 每个子类之间的距离。具体而言,就是针对每个子类,计算该子类中所有样本图像对应的特 征向量的平均值,从而获得该子类的平均特征向量,即该子类的中必,然后比较对应场景图 像的特征向量与该子类的平均特征向量,获得两者之间的距离,该距离则是对应场景图像 的特征向量与该子类的距离。然后,在步骤S24处,将与对应场景图像的特征向量的距离最 近的子类作为对应场景图像所属的子类,并将该子类的编号赋予该对应场景图像的特征向 量。接着,在步骤S25处,基于对应场景图像的特征向量的子类的编号调用对应编号的子类 的分类器。最后,在步骤S26处,采用所调用的子类分类器来检测对应场景图像中是否存在 对象。具体如何采用训练器来检测候选图像中是否存在对象属于现有技术,因此不在此赏 述。 很显然,分类器的鲁棒性是面对应用场景的多变性的主要方面。在当前技术中,最 常使用的是离线训练的分类器。从统计学角度来说,收集到的训练样本种类越多,识别结果 越好。然而,实际应用中将面临的场景多种多样,因此,根本无法收集到完整的训练样本集, 送导致应用环境中目标的特征也很难被完整描述。为了使识别系统能够适应当前应用场 景,常用的方法是离线收集大量当前场景下的样本、标注最终离线训练适用于当前场景的 分类器。送是一项耗时繁琐的工作,且分类器对于场景变化十分敏感,难W应用在视频监控 中。因此,具备自适应学习的系统是十分必要的。 现有的自适应学习方法通常是收集高置信度样本来更新分类器,送些样本的分类 结果是由原始离线训练分类器决定的。送种更新算法会导致分类器过度拟合且依旧不能正 确区分当前场景下原始分类器难W正确识别的目标。
技术实现思路
为此,本专利技术提出一种自适应学习的分类器训练方法和系统,该方法和系统通过 在线自动采集基于时域、空域和语义上下文信息的可信正负样本及其它有用信息,来实时 更新原始目标识别分类器。该方法和系统可W广泛使用在视频监控领域,具备更强的适应 性和实用性。 根据本专利技术的一个方面,提供了一种自适应分类器训练方法,包括;采用当前分类 器在线识别连续输入的多顿图像,并将被识别的图像作为高置信度正负样本直接添加到分 类器的样本库;W及将当前分类器难W识别的图像输出为疑难样本,并针对所述疑难样本 的上下文,将其识别为正负可信样本,并赋予所识别正负可信样本一定权重后将其添加到 分类器的样本库。 根据本专利技术自适应分类器训练方法,所述针对所述疑难样本的上下文,将其识别 为可信正负样本,并赋予所识别正负可信样本一定权重后将其添加到分类器的样本库的步 骤包括;基于具体疑难样本的时域上下文,采集所有疑难样的时域上下文的正负可信样本, 并计算所述时域上下文的正负可信样本在时域信息下包含待识别目标的概率;基于具体疑 难样本的空域上下文,采集所有疑难样的空域上下文的正负可信样本,并计算所述空域上 下文的正负可信样本在空域信息下包含待识别目标的概率;基于具体疑难样本的语义上下 文,采集所有疑难样的语义上下文的正负可信样本,并计算所述语义上下文的正负可信样 本在语义信息下包含待识别目标的概率;W及基于当前分类器对疑难样本的影响和所计算 的疑难样本在时域信息、空域信息W及语义信息下包含待识别目标的概率,计算该疑难样 本作为上正负可信样本的联合概率,并依据所计算的联合概率赋予每个被选择为正负可信 样本的疑难样本一个权重值。 根据本专利技术自适应分类器训练方法,还包括:在最初使用当前分类器之前,收集正 现有的正负可信样本W创建待识别目标的训练样本库;对训练样本库中的每一个样本提取 特征;基于提取到的特征集训练原始的目标识别分类器从而获得初始当前分类器。 根据本专利技术自适应分类器训练方法,所述被提取特征包括;梯度直方图特征或局 部二值模式特征。 根据本专利技术自适应分类器训练方法,所述分类器包括;支持向量机、Ad油oost分 类器或神经网络。 根据本专利技术的另一个方面,提供了一种分类器自适应训练系统,包括:简单样本 分辨单元,基于当前分类器将本文档来自技高网
...

【技术保护点】
一种分类器自适应训练方法,包括:采用当前分类器在线识别连续输入的多帧图像,并将被识别的图像作为高置信度正负样本直接添加到分类器的样本库;以及将当前分类器难以识别的图像输出为疑难样本,并针对所述疑难样本的上下文,将其识别为正负可信样本,并赋予所识别正负可信样本一定权重后将其添加到分类器的样本库。

【技术特征摘要】

【专利技术属性】
技术研发人员:李静雯师忠超刘殿超鲁耀杰贺娜
申请(专利权)人:株式会社理光
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1