本申请公开了一种图像识别方法及装置,先对各样本图像的与指定色调匹配的图像区域进行规范化处理,从而得到第一图像集中的各图像,然后通过该第一图像集训练该图像分类器,以得到训练完成的图像分类器,将该待识别图像输入该训练完成的图像分类器中,得到针对该待识别图像的识别结果。由于该第一图像集中的图像为对样本图像进行处理而得到的,使得该第一图像集各图像中与预设图像类别匹配的图像区域在该图像中所占比例相对提升,在对该图像进行缩放时减少图像中与预设图像类别匹配的图像区域的信息损失,可见通过本申请提供的方法,可有效地减少第一图像集中图像的数量,在减少成本的同时也提高了该图像分类器的训练效率。
【技术实现步骤摘要】
本申请涉及信息
,尤其涉及一种图像识别方法及装置。
技术介绍
随着信息化社会的发展以及网络社交活动的增长,人们在进行网络社交活动时更倾向于使用不受地域和语言限制的图像取代文字作为传词达意的主要媒介,这使得网络中图像快速增加。如何利用网络中的海量图像就成为了近年来人们关注的热点之一。由于图像区别于文字信息,其内容无法直接通过关键字进行检索、分类等操作,所以对于如何利用图像来说,首先要解决的问题就是对图像内容的识别,也即图像识别技术。现有图像识别技术主要采用机器学习的方法,具体的,首先需要人工对图像进行分类,确定由不同内容的图像分别构成的图像集(如,风景图像构成的图像集、人脸图像构成的图像集、色情图像构成的图像集等等),之后针对每一种内容的图像集,提取该图像集包含的各图像之间的共同特征(往往为特征向量),并通过训练最终得到该图像集的特征模型,最后根据各种图像集分别对应的特征模型,对接收到的待识别图像进行图像识别,并确定该待识别图像所属类别。由于相对于人工设置并提取特征向量进行图像识别,通过机器学习和训练得到的特征模型避免了人的主观因素的影响,并且可以通过训练不断优化,所以使得图像识别的准确率更高。但是,对于机器学习的方法来说,若想要图像识别的准确率较高,首先需要大量的图像用于学习和训练不同内容的图像集对应的特征模型,若是用于学习和训练的图像太少,则确定的特征模型的准确度就会降低,影响图像识别的鲁棒性,而训练用的图像太多,又会导致机器学习的方法的资源增加,影响机器学习的效率。其次,由于在于训练特征模型时,对于用于训练的图像尺寸有统一要求(如,统一图像尺寸为分辨率:100×100),所以还需要对用于训练的图像尺寸进行调整(包括:放大、缩小、拉伸等操作),如图1所示,而导致图像中包含的特征的损失,从而影响机器学习的准确性(即,影响最终得到的特征模型的准确性),使得为了保证机器学习的准确性需要进一步增加训练用的图像。图1为对高分辨率图像进行图像缩放导致的图像中包含的特征损失示意图。其中,左侧为原始尺寸大小的图像,右侧为缩小图像尺寸之后的图像,为了体现该缩小图像尺寸之后的图像中特征的损失,将该缩小图像尺寸之后的图像再次放大到该图像的原始尺寸大小。可见,其中叶脉纹理已经模糊,若以叶脉纹理为需要提取的特征的话,该缩小图像尺寸之后的图像的特征已经出现了损失。可见由于上述问题,现有的图像识别技术需要用于训练的图像数量较多,导致图像识别的成本高。
技术实现思路
本申请实施例提供一种图像识别方法,用于解决现有技术中,在采用机器学习的方法进行图像识别时,需要大量用于训练的图像,导致图像识别的成本增加的问题。本申请实施例提供一种图像识别装置,用于解决现有技术中,在采用机器学习的方法进行图像识别时,需要大量用于训练的图像,导致图像识别的成本增加的问题。本申请实施例采用下述技术方案:一种图像识别方法,包括:确定待识别图像;将所述待识别图像输入预先训练完成的的图像分类器,得到所述图像分类器输出的针对所述待识别图像的识别结果,其中,所述图像分类器进行训练所用的第一图像集中的图像,是对样本图像中与指定色调匹配的图像区域进行规范化处理而得到的;所述指定色调,根据预设图像类别的图像的色调确定。一种图像识别装置,包括:确定模块,确定待识别图像;识别模块,将所述待识别图像输入预先训练完成的图像分类模块,得到所述图像分类器输出的针对所述待识别图像的识别结果,其中,所述图像分类模块进行训练所用的第一图像集中的图像,是对样本图像中与指定色调匹配的图像区域进行规范化处理而得到的;所述指定色调,根据预设图像类别的图像的色调确定。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:先对各样本图像的与指定色调匹配的图像区域进行规范化处理,从而得到第一图像集中的各图像,然后通过该第一图像集训练该图像分类器,以得到训练完成的图像分类器,当对待识别图像进行图像识别时,将该待识别图像输入该训练完成的该图像分类器中,以得到该图像分类器输出的针对该待识别图像的识别结果。其中,由于该第一图像集中的图像为对样本图像进行处理而得到的,使得该第一图像集各图像中与指定色调匹配的图像区域在该图像中所占比例相对提升,使得即使需要对该图像进行缩放,也可减少图像中与指定色调匹配的图像区域的特征损失,增加了该图像分类器的训练结果的准确性,可见通过本申请提供的方法,可以在不影响训练效果的情况下,有效地降低对第一图像集中图像的数量的需求,在减少成本的同时也提高了该图像分类器的训练效率。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为对高分辨率图像进行图像缩放导致的图像中包含的特征损失示意图;图2为本申请实施例提供的图像识别过程;图3为本申请实施例提供的对该卷积神经网络模型进行训练的过程;图4为本申请实施例提供的确定该样本图像中与所述指定色调匹配的图像区域,作为中间图像的示意图;图5为本申请实施例提供的待训练的卷积神经网络模型的结构示意图;图6是本申请实施例提供一种图像识别装置的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。如前所述,由于采用机器学习的方法需要大量的用于训练的图像,并且在需要对用于训练的图像进行图像尺寸统一的情况下,所需的图像数量还需要进一步增加,所以导致现有技术中所需用于训练的图像数量大大增加。进一步地,由于采用机器学习的方法,实际上是训练得到不同类的图像分别对应的特征模型,所以在现有技术中还需要预先将用于训练的图像进行分类,才可根据预先分类过的图像对特征模型进行调整,并最终得到图像识别正确率符合要求的特征模型(即,对特征模型进行训练的过程)。其中,预先对用于训练的图像进行分类通常依赖于人工进行,也就是说,需要由人工根据图像的内容对用于训练的图像集中的各图像进行分类。但是,由于现有技术需要用于训练的图像较多,所以需要大量的人工进行图像分类工作,增加了运行成本。更进一步地,由于人工在对图像进行分类时,主要依靠人的主观感觉,在对于有些可以同时分类至不同类别的图像,不同人对该图像的分类结果可能并不一致,若通过这种可以同时分类至不同类别的图像对特征模型进行训练,则可能对训练效果产生负面影响,但是由于现有技术需要用于训练的图像较多,要么增加人工对这种可以同时分类至不同类别的图像进行筛查,排除出用于训练的图像集中,要么需要进一步增加用于训练的图像。基于以上内容,本申请实施例提供一种可以减少训练用图像,且不影响对特征模型训练效果的用于图像识别的技术方案。以下结合附图,详细说明本申请各实施例提供的技术方案。图2为本申请实施例提供的图像识别过程,具体包括以下步骤:S101:确定待识别图像。在现有技术中,由于通常采用机器学习的方法训练特征模型所消耗的资源较多,所以一般由服务器进行训练该特征模型的本文档来自技高网...
【技术保护点】
一种图像识别方法,其特征在于,包括:确定待识别图像;将所述待识别图像输入预先训练完成的图像分类器,得到所述图像分类器输出的针对所述待识别图像的识别结果,其中,所述图像分类器进行训练所用的第一图像集中的图像,是对样本图像中与指定色调匹配的图像区域进行规范化处理而得到的;所述指定色调,根据预设图像类别的图像的色调确定。
【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:确定待识别图像;将所述待识别图像输入预先训练完成的图像分类器,得到所述图像分类器输出的针对所述待识别图像的识别结果,其中,所述图像分类器进行训练所用的第一图像集中的图像,是对样本图像中与指定色调匹配的图像区域进行规范化处理而得到的;所述指定色调,根据预设图像类别的图像的色调确定。2.如权利要求1所述的方法,其特征在于,所述第一图像集,采用下述方法得到:确定由样本图像组成的第二图像集;针对所述第二图像集中的每一个样本图像,根据该样本图像的色调饱和度明度HSV颜色模型,确定该样本图像中与所述指定色调匹配的图像区域;以及根据该样本图像中与所述指定色调匹配的图像区域,确定与该样本图像对应的中间图像;对所有中间图像进行规范化处理;将所有进行规范化处理后的中间图像的集合,作为所述第一图像集。3.如权利要求1所述的方法,其特征在于,所述图像分类器包括卷积神经网络模型。4.如权利要求3所述的方法,其特征在于,采用下述方式,训练所述卷积神经网络模型:确定待训练的卷积神经网络模型对应的各层初始化参数;循环执行下述步骤,直至所述待训练的卷积神经网络模型模型输出的误差值达到第一阈值以及图像识别正确率达到第二阈值为止,所述卷积神经网络模型训练完成:将所述第一图像集中的各图像依次输入所述待训练的卷积神经网络模型,使得通过所述待训练的卷积神经网络模型对输入的各图像的特征进行向前传播至输出层,计算输出的所述误差值以及所述图像识别正确率,根据所述误差值从输出层以初始化参数为基础反向调整所述待训练的卷积神经网络模型中的各层对应的参数。5.如权利要求4所述的方法,其特征在于,所述卷...
【专利技术属性】
技术研发人员:杜康华,王崇,任文越,
申请(专利权)人:微梦创科网络科技中国有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。