图片处理方法及装置制造方法及图纸

技术编号:14270914 阅读:86 留言:0更新日期:2016-12-23 15:42
本公开是关于一种图片处理方法及装置。其中,方法包括:获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应至少一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,每种物品类别对应一个标号;利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和支持输出多个标号的预设卷积神经网络模型进行训练,得到所述至少一种物品类别对应的目标训练模型,所述目标训练模型用于确定对应至少一个物品类别的待分类图片所对应的目标物品类别。通过该技术方案,可以使训练出来的目标训练模型更符合实际运用,降低图片识别的错误率。

【技术实现步骤摘要】

本公开涉及图片处理
,尤其涉及图片处理方法及装置
技术介绍
深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。卷积神经网络可用于对图片的识别。但是相关技术中的卷积神经网络其输出只支持单个标号。例如,一张既有宠物,又有人的照片,如果按照单个标号,把它设定为宠物,但是在训练集合里面的其他训练集,也就是除了宠物训练集之外的“其他”集合,实际上也有包含人的照片。假设训练集合三类:猫、狗、人、其他。结果猫或者狗的训练集合里面也有包含人的照片,“其他”集合里面也有包含人的照片,这会让模型训练的时候变的很困惑,并且这样训练得到的模型在进行识别时,召回率和错误率都存在较高的偏差。
技术实现思路
本公开实施例提供一种图片处理方法及装置,包括如下技术方案:根据本公开实施例的第一方面,提供一种图片处理方法,包括:获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应至少一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,每种物品类别对应一个标号;利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和支持输出多个标号的预设卷积神经网络模型进行训练,得到所述至少一种物品类别对应的目标训练模型,所述目标训练模型用于确定对应至少一个物品类别的待分类图片所对应的目标物品类别。在一个实施例中,所述利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和预设卷积神经网络模型进行训练,得到所述至少一种物品类别对应的目标训练模型之前,所述方法还包括:将所述至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。在一个实施例中,所述目标训练模型确定对应至少一个物品类别的待分类图片所对应的目标物品类别的步骤包括:将所述待处理图片的尺寸处理为预设尺寸;根据所述目标训练模型从所述待处理图片中抽取特征向量;根据所述特征向量和所述目标训练模型,计算所述待处理图片与所述至少一种物品类别中每个物品类别之间具有对应关系的概率值;将概率值大于预设概率值的至少一个物品类别确定为所述目标物品类别。在一个实施例中,所述方法还包括:将所述待处理图片添加至所述目标物品类别对应的图片集中。在一个实施例中,所述物品类别包括猫、狗、人。根据本公开实施例的第二方面,提供一种图片处理装置,包括:获取模块,用于获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应至少一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,每种物品类别对应一个标号;训练模块,用于利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和支持输出多个标号的预设卷积神经网络模型进行训练,得到所述至少一种物品类别对应的目标训练模型,所述目标训练模型用于确定对应至少一个物品类别的待分类图片所对应的目标物品类别。在一个实施例中,所述装置还包括:第一处理模块,用于将所述至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。在一个实施例中,在所述目标训练模型确定对应至少一个物品类别的待分类图片所对应的目标物品类别时,所述装置还包括:第二处理模块,将所述待处理图片的尺寸处理为预设尺寸;抽取模块,用于根据所述目标训练模型从所述待处理图片中抽取特征向量;计算模块,用于根据所述特征向量和所述目标训练模型,计算所述待处理图片与所述至少一种物品类别中每个物品类别之间具有对应关系的概率值;确定模块,用于将概率值大于预设概率值的至少一个物品类别确定为所述目标物品类别。在一个实施例中,所述装置还包括:添加模块,用于将所述待处理图片添加至所述目标物品类别对应的图片集中。在一个实施例中,所述物品类别包括猫、狗、人。根据本公开实施例的第三方面,提供一种图片处理装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应至少一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,每种物品类别对应一个标号;利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和支持输出多个标号的预设卷积神经网络模型进行训练,得到所述至少一种物品类别对应的目标训练模型,所述目标训练模型用于确定对应至少一个物品类别的待分类图片所对应的目标物品类别。本公开的实施例提供的技术方案可以包括以下有益效果:上述技术方案,利用至少一种物品类别对应的至少一个样本图片集、预设卷积神经网络协议和支持输出多个标号的预设卷积神经网络模型进行训练,从而得到至少一种物品类别对应的目标训练模型,这样,就可以对对应至少一个物品类别的待分类图片进行分类,从而使训练出来的目标训练模型更符合实际运用,降低图片识别的错误率。例如,一个待分类图片中既包含人和又包含宠物,那么,通过该技术方案,可以将其识别为宠物类别和/或人的类别,与相关技术中的只能对待分类图片进行单个物品类别识别相比,识别结果更加全面,降低了图片识别的错误率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的图片处理方法的流程图。图2是根据一示例性实施例示出的另一种图片处理方法的流程图。图3是根据一示例性实施例示出的再一种图片处理方法的流程图。图4是根据一示例性实施例示出的又一种图片处理方法的流程图。图5是根据一示例性实施例示出的又一种图片处理方法的流程图。图6是根据一示例性实施例示出的图片处理装置的框图。图7是根据一示例性实施例示出的另一种图片处理装置的框图。图8是根据一示例性实施例示出的再一种图片处理装置的框图。图9是根据一示例性实施例示出的又一种图片处理装置的框图。图10是根据一示例性实施例示出的适用于图片处理装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。本公开实施例提供了一种图片处理方法,该方法可用于需要进行图片处理的设备中,如图1所示,该方法包括步骤S101-S102:在步骤S101中,获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应至少一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,每种物品类别对应一个标号;在一个实施例中,物品类别包括猫、狗、人。在步骤S102中,利用至少一个样本图片集中的样本图片、预设卷积神经网络协议和支持输出多个标号的预设卷积神经网络模型进行训练,得到至少一种物品类别对应的目标训练模型,目标训练模型用于确本文档来自技高网...
图片处理方法及装置

【技术保护点】
一种图片处理方法,其特征在于,包括:获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应至少一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,每种物品类别对应一个标号;利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和支持输出多个标号的预设卷积神经网络模型进行训练,得到所述至少一种物品类别对应的目标训练模型,所述目标训练模型用于确定对应至少一个物品类别的待分类图片所对应的目标物品类别。

【技术特征摘要】
1.一种图片处理方法,其特征在于,包括:获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应至少一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,每种物品类别对应一个标号;利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和支持输出多个标号的预设卷积神经网络模型进行训练,得到所述至少一种物品类别对应的目标训练模型,所述目标训练模型用于确定对应至少一个物品类别的待分类图片所对应的目标物品类别。2.根据权利要求1所述的方法,其特征在于,所述利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和预设卷积神经网络模型进行训练,得到所述至少一种物品类别对应的目标训练模型之前,所述方法还包括:将所述至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。3.根据权利要求1或2所述的方法,其特征在于,所述目标训练模型确定对应至少一个物品类别的待分类图片所对应的目标物品类别的步骤包括:将所述待处理图片的尺寸处理为预设尺寸;根据所述目标训练模型从所述待处理图片中抽取特征向量;根据所述特征向量和所述目标训练模型,计算所述待处理图片与所述至少一种物品类别中每个物品类别之间具有对应关系的概率值;将概率值大于预设概率值的至少一个物品类别确定为所述目标物品类别。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:将所述待处理图片添加至所述目标物品类别对应的图片集中。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述物品类别包括猫、狗、人。6.一种图片处理装置,其特征在于,包括:获取模块,用于获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应至少一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品,每种物品类别对应一个标号;训练模块,用于利用所述至少一个样本图片集中的样本图片、预设卷积神经网络协议和支持输出多...

【专利技术属性】
技术研发人员:张涛万韶华张旭华
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1