场景识别的方法和装置制造方法及图纸

技术编号:9838463 阅读:124 留言:0更新日期:2014-04-02 02:07
本发明专利技术公开了一种场景识别的方法和装置。该方法包括:由训练图像集训练得到多个局部检测器,该多个局部检测器中的一个局部检测器对应一类目标的一个局部区域,该一类目标包括至少两个局部区域;利用该多个局部检测器检测待识别场景,获取该待识别场景的基于目标的局部区域的特征;根据该待识别场景的基于目标的局部区域的特征识别该待识别场景。本发明专利技术实施例的场景识别的方法和装置,利用对应目标的局部区域的局部检测器检测待识别场景,获取的待识别场景的基于目标的局部区域的特征可以更完整地表示图像信息,从而能够提高场景识别性能。

【技术实现步骤摘要】
场景识别的方法和装置
本专利技术涉及信息
,并且更具体地,涉及场景识别的方法和装置。
技术介绍
图像场景识别是指利用图像的视觉信息,自动对图像进行处理和分析,并判断和识别出其中所带有的特定场景(如厨房、街道、山峦等)。判断一张图像中的场景不仅有助于对图像的整体语义内容的理解,还能为图像中具体的目标和事件的识别提供依据,因此场景识别对计算机自动图像理解起着重要的作用。场景识别技术可以应用于很多实际问题,如智能图像管理与检索等。现有的场景识别技术首先对图像的视觉信息进行描述,这一过程也称为图像的视觉特征提取;然后利用已经获取的针对不同场景的模板(或分类器)对提取的视觉特征进行匹配(或分类),并获取最终的场景识别结果。提取视觉特征的一种通用方法是计算出代表图像画面中低层视觉信息的统计。这些视觉特征包括描述颜色信息的特征,描述纹理信息的特征,以及描述形状信息的特征等。在得到低层视觉信息后,就可以通过预先训练的分类器对上述特征进行分类,进而得到最终识别结果。这种方法的主要缺点是低层视觉特征对不同场景的分辨能力较弱,无法对一些带有接近的颜色、纹理等信息的场景(如书房和图书馆)进行有效地区分和识别,从而影响场景识别性能。现有的另一种方法采用中层特征表示(或称“属性”)进行场景识别。这类方法首先需要设计大量的视觉概念检测器。视觉概念检测器检测的结果连接构成中层特征表示。最后利用分类器对该特征进行分类,进而得到最终的识别结果。这种方法主要的缺点包括:1.方法采用标注对象的整个目标的检测结果(比如“运动员”、“足球”等)作为中层特征,描述能力有限,如某个对象只有一部分出现在场景中(如“运动员只露出腿”等),则无法检测;2.检测器集合中可能存在重复:对每个训练图片集标注的每类对象训练一个检测器,由于可能存在某些类的图像含义相近(比如“裁判”和“运动员”),导致分别由这些类训练得到的检测器存在重复或高度相似,一方面造成特征信息高维灾难,另一方面多次重复检测出的结果会相对抑制出现较少的检测结果,从而影响场景识别性能。
技术实现思路
本专利技术实施例提供了一种场景识别的方法和装置,能够提高场景识别性能。第一方面,提供了一种场景识别的方法,该方法包括:由训练图像集训练得到多个局部检测器,该多个局部检测器中的一个局部检测器对应一类目标的一个局部区域,该一类目标包括至少两个局部区域;利用该多个局部检测器检测待识别场景,获取该待识别场景的基于目标的局部区域的特征;根据该待识别场景的基于目标的局部区域的特征识别该待识别场景。在第一种可能的实现方式中,该方法还包括:将该多个局部检测器中相似度高于预定阈值的局部检测器进行合并,得到合成局部检测器集合;利用该多个局部检测器检测待识别场景,获取该待识别场景的基于目标的局部区域的特征,具体实现为:利用该合成局部检测器集合中的局部检测器检测该待识别场景,获取该待识别场景的基于目标的局部区域的特征。在第二种可能的实现方式中,结合第一方面的第一种可能的实现方式,该相似度包括该多个局部检测器对应的训练图像的局部区域的特征之间的相似程度。在第三种可能的实现方式中,结合第一方面或第一方面的第一种或第二种可能的实现方式,根据该待识别场景的基于目标的局部区域的特征识别该待识别场景,具体实现为:利用分类器对该待识别场景的基于目标的局部区域的特征进行分类,获取场景识别结果。在第四种可能的实现方式中,结合第一方面或第一方面的第一种或第二种或第三种可能的实现方式,获取该待识别场景的基于目标的局部区域的特征,具体实现为:利用每一个检测该待识别场景的局部检测器获取该待识别场景的响应图;将该响应图分格成多个格子,将每个格子中的最大响应值作为每个格子的特征,将该响应图的所有格子的特征作为该响应图对应的特征,将所有检测该待识别场景的局部检测器获取的响应图对应的特征作为该待识别场景的基于目标的局部区域的特征。第二方面,提供了一种场景识别的装置,该装置包括:生成模块,用于由训练图像集训练得到多个局部检测器,该多个局部检测器中的一个局部检测器对应一类目标的一个局部区域,该一类目标包括至少两个局部区域;检测模块,用于利用该生成模块得到的该多个局部检测器检测待识别场景,获取该待识别场景的基于目标的局部区域的特征;识别模块,用于根据该检测模块获取的该待识别场景的基于目标的局部区域的特征识别该待识别场景。在第一种可能的实现方式中,该装置还包括:合并模块,用于将该多个局部检测器中相似度高于预定阈值的局部检测器进行合并,得到合成局部检测器集合;该检测模块还用于利用该合成局部检测器集合中的局部检测器检测该待识别场景,获取该待识别场景的基于目标的局部区域的特征。在第二种可能的实现方式中,结合第二方面的第一种可能的实现方式,该相似度包括该多个局部检测器对应的训练图像的局部区域的特征之间的相似程度。在第三种可能的实现方式中,结合第二方面或第二方面的第一种或第二种可能的实现方式,该识别模块具体用于利用分类器对该待识别场景的基于目标的局部区域的特征进行分类,获取场景识别结果。在第四种可能的实现方式中,结合第二方面或第二方面的第一种或第二种或第三种可能的实现方式,该检测模块具体用于利用每一个检测该待识别场景的局部检测器获取该待识别场景的响应图,将该响应图分格成多个格子,将每个格子中的最大响应值作为每个格子的特征,将该响应图的所有格子的特征作为该响应图对应的特征,将所有检测该待识别场景的局部检测器获取的响应图对应的特征作为该待识别场景的基于目标的局部区域的特征。基于上述技术方案,本专利技术实施例的场景识别的方法和装置,利用对应目标的局部区域的局部检测器检测待识别场景,获取的待识别场景的基于目标的局部区域的特征可以更完整地表示图像信息,从而能够提高场景识别性能。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的场景识别的方法的示意性流程图。图2是根据本专利技术实施例的场景识别的方法的一个例子的示意图。图3是根据本专利技术实施例的场景识别的方法的另一示意性流程图。图4是根据本专利技术实施例的场景识别的方法的另一个例子的示意图。图5是根据本专利技术实施例的场景识别的方法的又一示意性流程图。图6是根据本专利技术实施例的场景识别的装置的示意性框图。图7是根据本专利技术实施例的场景识别的装置的另一示意性框图。图8是根据本专利技术另一实施例的场景识别的装置的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。图1示出了根据本专利技术实施例的场景识别的方法100的示意性流程图。如图1所示,该方法100包括:S110,由训练图像集训练得到多个局部检测器,该多个局部检测器中的一个局部检测器对应一类目标的一个局部区域,该一类目标包括至少两个局部区域;S120,利用该多个局部本文档来自技高网
...
场景识别的方法和装置

【技术保护点】
一种场景识别的方法,其特征在于,包括:由训练图像集训练得到多个局部检测器,所述多个局部检测器中的一个局部检测器对应一类目标的一个局部区域,所述一类目标包括至少两个局部区域;利用所述多个局部检测器检测待识别场景,获取所述待识别场景的基于目标的局部区域的特征;根据所述待识别场景的基于目标的局部区域的特征识别所述待识别场景。

【技术特征摘要】
1.一种场景识别的方法,其特征在于,包括:由训练图像集训练得到多个局部检测器,所述多个局部检测器中的一个局部检测器对应一类目标的一个局部区域,所述一类目标包括至少两个局部区域;利用所述多个局部检测器检测待识别场景,获取所述待识别场景的基于目标的局部区域的特征;根据所述待识别场景的基于目标的局部区域的特征识别所述待识别场景;将所述多个局部检测器中相似度高于预定阈值的局部检测器进行合并,得到合成局部检测器集合;所述利用所述多个局部检测器检测待识别场景,获取所述待识别场景的基于目标的局部区域的特征,包括:利用所述合成局部检测器集合中的局部检测器检测所述待识别场景,获取所述待识别场景的基于目标的局部区域的特征。2.根据权利要求1所述的方法,其特征在于,所述相似度包括所述多个局部检测器对应的训练图像的局部区域的特征之间的相似程度。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述待识别场景的基于目标的局部区域的特征识别所述待识别场景,包括:利用分类器对所述待识别场景的基于目标的局部区域的特征进行分类,获取场景识别结果。4.根据权利要求3所述的方法,其特征在于,所述获取所述待识别场景的基于目标的局部区域的特征,包括:利用每一个检测所述待识别场景的局部检测器获取所述待识别场景的响应图;将所述响应图分格成多个格子,将每个所述格子中的最大响应值作为每个所述格子的特征,将所述响应图的所有格子的特征作为所述响应图对应的特征,将所有检测所述待识别场景的局部检测器获取的响应图对应的特征作为所述...

【专利技术属性】
技术研发人员:姜育刚刘洁王栋郑莹斌薛向阳
申请(专利权)人:华为技术有限公司 复旦大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1