本发明专利技术提供了一种图像主体区域的识别方法及装置,其中,该方法包括:接收待识别的图像,并从图像中提取候选主体区域;对所提取到的候选主体区域中的非主体区域进行排除,以获得目标候选主体区域,并对目标候选主体区域进行调整和分类,以获得至少一个目标候选主体区域集合;以及对每个目标候选主体区域集合中的目标候选主体区域合并,以识别出图像的主体区域。本发明专利技术实施例的提供的图像主体区域的识别方法及装置,可以准确地获得图像的主体区域,且可以从包含多个主体的图像中识别出多个主体对应的主体区域。
【技术实现步骤摘要】
本专利技术涉及计算机
,尤其涉及一种图像主体区域的识别方法及装置。
技术介绍
目前,图像信息的提取主要集中在三种粒度层面,其一是以图像整体为单位的粗粒度图像分类标注,其二是以获得图像中实体目标(例如行人、人脸、汽车等)为目的的目标检测方式,该方式需要训练专门类别的检测器进行检测。其三是精细到图像像素的细粒图像分割或者剖析,图像分割或者剖析能够对图像主体细节进行像素级的粒度描述,然而,上述三种粒度层面的图像处理方式存在的问题是,图像分类标注不能准确和全面的分析包含多个主体的图像,所获得的分析结果不稳定;目标检测方式对于包含多个类别的目标主体时需要对图像进行多次遍历处理,所需计算量大;图像分割或者剖析所需分析时间较长,可在例如人脸、服饰、皮肤、箱包分割等特定场景上使用。随着互联网技术的发展,上述单一粒度的图像处理的方式在处理效率上难以满足更加多样化的网页(web)图片、社交(social)图片等的要求,为了适应时代的发展,现有的对图像进行处理的过程为:从图像中检测出主体所在的主体区域,然后基于主体区域对主体进行后续分析,例如,可对主体进行分类或者识别。在这个整个过程中获得图像中的主体区域是获得图像准确分析结果的关键,目前常用的图像主体区域检测方式有两种,第一种方式为基于显著性区域的主体检测方式,该方式通过显著性能量函数对图像进行处理,以生成图像的能量分布图,并根据能量分布图获得显著性较高的区域,并将该区域作为图像的主体区域。第二种方式为基于深度学习的主体坐标回归,该方式获得待处理的图像,然后通过已训练好的深度神经网络预测主体外接矩形的四个点坐标,实现主体区域检测定位。然而,上述两种方式存在的问题是:第一种方式所使用的显著性能量函数不具有通用性,主体区域检测结果的准确性和有效性不足,第二种方式不仅计算复杂,时效性效果不佳,而且该方式只能返回一个主体区域,很难处理包含多个主体的图像。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术第一方面实施例在于提出一种图像主体区域的识别方法,该方法可以准确地获得图像的主体区域,且可以从包含多个主体的图像中识别出多个主体对应的主体区域。本专利技术的第二方面实施例在于提出一种图像主体区域的识别装置。为了实现上述目的,本专利技术第一方面实施例的图像主体区域的识别方法,包括:接收待识别的图像,并从所述图像中提取候选主体区域;对所提取到的候选主体区域中的非主体区域进行排除,以获得目标候选主体区域,并对所述目标候选主体区域进行调整和分类,以获得至少一个目标候选主体区域集合;以及对每个目标候选主体区域集合中的目标候选主体区域合并,以识别出所述图像的主体区域。根据本专利技术实施例的图像主体区域的识别方法,首先从待识别图像中提取候选主体区域,然后对所提取到的候选主体区域中的非主体区域进行排除,以获得目标候选主体区域,并对目标候选主体区域进行调整和分类,以获得至少一个目标候选主体区域集合,最后对每个目标候选主体区域集合中的目标候选主体区域进行合并,以识别出图像的主体区域,由此,可以准确地获得图像的主体区域,且可以从包含多个主体的图像中识别出多个主体对应的主体区域。为了实现上述目的,本专利技术第二方面实施例的图像主体区域的识别装置,包括:提取模块,用于接收待识别的图像,并从所述图像中提取候选主体区域;处理模块,用于对所提取到的候选主体区域中的非主体区域进行排除,以获得目标候选主体区域,并对所述目标候选主体区域进行调整和分类,以获得至少一组目标候选主体区域集合;以及合并模块,用于对每个目标候选主体区域集合中的目标候选主体区域合并,以识别出所述图像的主体区域。根据本专利技术实施例的图像主体区域的识别装置,通过提取模块从待识别图像中提取候选主体区域,然后通过处理模块对所提取到的候选主体区域中的非主体区域进行排除,以获得目标候选主体区域,并对目标候选主体区域进行调整和分类,以获得至少一个目标候选主体区域集合,以及对每个目标候选主体区域集合中的目标候选主体区域进行合并,以识别出图像的主体区域,由此,可以准确地获得图像的主体区域,且可以从包含多个主体的图像中识别出多个主体对应的主体区域。附图说明图1是根据本专利技术一个实施例的图像主体区域的识别方法的流程图。图2是根据本专利技术一个实施例的图像主体区域的识别方法的流程图。图3是未经过处理的原图的示例图。图4是对图3提取候选主体区域后的结果的示例图。图5是对图4中的候选主体区域排除非主体区域后的结果的示例图。图6是对图5中的候选主体区域进行调整和分类后的结果的示例图。图7是对图6中的目标候选主体区域进行合并后的结果的示例图。图8是根据本专利技术一个实施例的图像主体区域的识别装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的图像主体区域的识别方法及装置。图1是根据本专利技术一个实施例的图像主体区域的识别方法的流程图,如图1所示,该图像主体区域的识别方法包括:S101,接收待识别的图像,并从图像中提取候选主体区域。具体地,可根据通用的主体检测模型从待识别的图像中提取不同大小尺寸、长宽比的候选主体区域,为了可以使得候选主体区域可以涵盖待识别的图像中各种类别、不同大小、不同尺寸的主体内容,通常通用的主体区域检测模型可以获得图像的大量的候选主体区域,候选主体区域在图像中通常用矩形框标示。其中,通用的主体检测模型是一种提取图像的候选主体区域的模型,该模型可根据预先设定的图像特征(例如像素灰度、颜色、图像梯度、边缘、方向梯度直方图HOG(Histogram of Oriented Gradient)特征、局部二值模式LBP(Local Binary Pattern)特征等)对图像的特征进行提取,在提取待识别的图像后,可通过图像的机器学习算法(例如支持向量机svm(support vector machine)、Adaboost算法(该算法是一种自适应集成学习算法)、随机森林(random forest)算法等)对所获得的特征进行分析,以获得待识别图像对应的候选主体区域。需要说明的是,该模型提取图像的候选主体区域的效率高,一般情况下,提取一种图像的候选主体区域所需的时间为100ms。S10本文档来自技高网...
【技术保护点】
一种图像主体区域的识别方法,其特征在于,包括:接收待识别的图像,并从所述图像中提取候选主体区域;对所提取到的候选主体区域中的非主体区域进行排除,以获得目标候选主体区域,并对所述目标候选主体区域进行调整和分类,以获得至少一个目标候选主体区域集合;以及对每个目标候选主体区域集合中的目标候选主体区域合并,以识别出所述图像的主体区域。
【技术特征摘要】
1.一种图像主体区域的识别方法,其特征在于,包括:
接收待识别的图像,并从所述图像中提取候选主体区域;
对所提取到的候选主体区域中的非主体区域进行排除,以获得目标候选主体区域,并
对所述目标候选主体区域进行调整和分类,以获得至少一个目标候选主体区域集合;以及
对每个目标候选主体区域集合中的目标候选主体区域合并,以识别出所述图像的主体
区域。
2.根据权利要求1所述的方法,其特征在于,所述对所提取到的候选主体区域中的非
主体区域进行排除,包括:
使用不同级别的分类器对所提取到的候选主体区域进行识别,以排除所述非主体区域。
3.根据权利要求1所述的方法,其特征在于,所述对所述目标候选主体区域进行调整,
包括:
针对每个目标候选主体区域,根据主体和当前目标候选主体区域之间的大小关系和位
置关系对所述当前目标候选主体区域进行缩放处理和/或平移处理。
4.根据权利要求3所述的方法,其特征在于,所述对所述目标候选主体区域进行分类,
包括:
获得调整前和调整后的每个目标候选主体区域的评分和所属的类别,并根据同一类别
中目标候选主体区域的评分对对应的目标候选主体区域进行排序,并根据排序结果获得所
述目标候选主体区域集合。
5.根据权利要求1所述的方法,其特征在于,所述对每个目标候选主体区域集合中的
目标候选主体区域进行合并,以识别出所述图像的主体区域,包括:
根据目标候选主体区...
【专利技术属性】
技术研发人员:陈世佳,李旭斌,文石磊,余轶南,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。