本发明专利技术实施例公开了图像识别方法及装置,应用于图像信息处理技术领域。在本发明专利技术实施例的图像识别方法中,结合了两种图像识别的方法,这样可以采用识别速度较高的第一图像识别方法对待识别图像进行粗分类,利用第一图像识别方法,在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本;然后采用准确度较高的第二图像识别方法对待识别图像进行精确分类时可以提高图像识别准确度,将待识别图像在所述最终识别模型中进行识别,而由于在精确分类时是将待识别图像与粗分类后确定的几种类别的训练样本进行比较,而不是与全部类别的训练样本进行比较,这样可以提高精确分类的速度,这样可以在提高识别速度的同时提高了识别准确度。
【技术实现步骤摘要】
一种图像识别方法及装置
本专利技术涉及图像信息处理
,特别涉及图像识别方法及装置。
技术介绍
现在的图像识别系统越来越广泛的应用,比如人脸识别、指纹识别,静脉识别,手写字体识别,印刷字体识别和车辆字符识别系统等,这些图像识别系统主要是将待识别图像通过一定的识别运算后,得到一定的信息比如图像中所表示的字符等。例如,车辆牌照识别系统在交通系统中有着不可替代的作用,主要是把摄像头采集到车牌图像输入到车辆牌照识别系统后,该车辆牌照识别系统可以通过图像处理和分析,分割出车牌字符,最后对分割出来的字符进行模式识别,得到该车牌图像所表示的车牌号码,比如“粤B12345”,这样给交通系统的自动管理提供了极大的方便。车辆牌照识别系统包括车牌检测,歪斜校正,边界确定,字符切分和字符识别等功能,其中,车牌字符识别是识别车牌号码过程中的重要部分。目前,图像识别方法主要包括:模板匹配,神经网络(ArtificialNeuralNetwork,ANN),隐马尔可夫模型(HiddenMarkovModel,HMM),支持向量机(SupportVectorMachine,SVM)和降维等方法,其中有些方法可以提高识别速度但是损失了识别准确度,有些方法提高了识别准确度但是损失了识别速度。
技术实现思路
本专利技术实施例提供图像识别方法及装置,在提高识别速度的同时提高了识别准确度。本专利技术实施例提供一种图像识别方法,包括:用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本,所述s为大于1的自然数;用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型;根据所述选出的前s类训练样本,将所述待识别图像在所述最终识别模型中进行识别运算,得到所述待识别图像所包含的信息。本专利技术实施例提供一种图像识别装置,包括:样本选取单元,用于利用第一图像识别方法,在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本,所述s为大于1的自然数;模型确定单元,用于用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型;识别单元,用于根据所述选出的前s类训练样本,将所述待识别图像在所述最终识别模型中进行识别运算,得到所述待识别图像所包含的信息。在本专利技术实施例的图像识别方法中,图像识别系统对待识别图像进行粗分类,即利用第一图像识别方法,在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本;然后再根据粗分类结果进行精确分类,即用第二图像识别方法对已知类别的训练样本进行训练得到最终识别模型,并根据选出的前s类训练样本,将待识别图像在所述最终识别模型中进行识别运算,得到待识别图像所包含的信息。本专利技术实施例中结合了两种图像识别的方法,这样可以采用识别速度较高的第一图像识别方法对待识别图像进行粗分类,然后采用准确度较高的第二图像识别方法对待识别图像进行精确分类时可以提高图像识别准确度,而由于在精确分类时是将待识别图像与粗分类后确定的几种类别的训练样本进行比较,而不是与全部类别的训练样本进行比较,这样可以提高精确分类的速度。可见,本专利技术实施例的方法可以在提高识别速度的同时提高了识别准确度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种图像识别方法的流程图;图2是本专利技术实施例中在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本的方法流程图;图3是本专利技术具体的实施例提供的车辆牌照识别系统中两种机器学习方法的流程图;图4是本专利技术具体的实施例提供的车牌字符识别方法的流程图;图5是本专利技术实施例提供的一种图像识别装置的结构示意图;图6是本专利技术实施例提供的另一种图像识别装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种图像识别方法,主要是图像识别系统将待识别图像经过一定的识别运算得到待识别图像中的一些信息比如字符等信息的方法,对于车辆牌照识别系统来说主要是从车牌图像中识别出车牌字符等,流程图如图1所示,包括:步骤101,用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本,这里s为大于1的自然数,这里第一图像识别方法可以是降维的图像识别方法等。本专利技术实施例中对于图像的识别是先通过降维的图像识别方法对待识别图像进行粗分类,具体地,可以通过大量前期收集的试验样本作为训练样本集,在训练样本集中可以包括多种类别的训练样本,先经过训练得到训练样本的协方差矩阵的特征值矩阵和特征向量矩阵,其中协方差矩阵可以表示训练样本的不同维度之间的协方差即两个随机变量关系的统计量,协方差越大,说明两个变量关系越大,且协方差矩阵的特征值越大,说明对应的元素区分度越大;然后将特征值较大的特征向量组成的特征向量矩阵作为投影矩阵;最后将训练样本和待识别图像通过投影矩阵分别投影到最佳投影空间,即可将训练样本和待识别图像分别降到低维空间,从而可以在低维空间中比较训练样本与待识别图像,得到本步骤中最相近的前s类训练样本。具体参见图2所示,可以通过如下的步骤来实现:A:利用降维方法对已知类别的训练样本进行训练得到表示元素区分度的矩阵,这里已知类别的训练样本是指每个类别的字符对应的图像样本,例如对于汉字来说,共有31个类别,而字母有24个类别,数字0-9和字母A-Z(除I和O)共有34个类别等,其中每个类别都可以有多种图像样本,用来与待识别图像进行比较。在得到表示元素区分度的矩阵时,图像识别系统具体可以采用线性降维和/或非线性降维相结合的方法,其中线性降维方法包括:主成分分析(PrincipalComponentAnalysis,PCA)法、线性鉴别分析(LinearDiscriminantAnalysis,LDA)法、独立成分分析(IndependentComponentAnalysis,ICA)法、二维主成分分析(2DPCA)法和二维线性鉴别分析(2DLDA)法等,而非线性降维方法包括:核主成分分析(KPCA)法、核线性鉴别分析(KLDA)法和核独立成分分析(KICA)法等。且图像识别系统在对已知类型的训练样本进行训练时,具体是对已知类型的训练样本进行特征提取,其中上述PCA法主要是提取出训练样本中最主要的元素和结构,去除噪音和冗余后,将原有的复杂数据降维,而2DPCA法与PCA法类似,不同的是2DPCA法不需要将训练样本的图像数据展开成一维向量,直接利用图像的二维信息产生协方差矩阵,大大节约了训练过程;LDA法主要针对线性可分的情况,具体地确定一个线性转换矩阵即一组投影方向,使训练样本在该投影方向投影的类内散布矩阵最小(即每一类的训练样本尽可能多的聚在一起),而类间散布矩阵最大(即不同类别的训练样本最大程度分开),2DLDA法与本文档来自技高网...
【技术保护点】
一种图像识别方法,其特征在于,包括:用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本,所述s为大于1的自然数;用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型;根据所述选出的前s类训练样本,将所述待识别图像在所述最终识别模型中进行识别运算,得到所述待识别图像所包含的信息。
【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本,所述s为大于1的自然数;其中,所述已知类别的训练样本是指每个类别的字符对应的图像样本;用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型;根据所述选出的前s类训练样本,将所述待识别图像在所述最终识别模型中进行识别运算,得到所述待识别图像所包含的信息;其中,所述用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本,具体包括:利用降维方法对所述已知类别的训练样本进行训练得到表示元素区分度的矩阵;基于所述表示元素区分度的矩阵,选择特征值大于预置特征值所对应的特征向量组成投影矩阵;将所述待识别图像和已知类型的训练样本通过所述投影矩阵分别投影到最佳投影空间,并分别得到待识别图像在所述最佳投影空间的特征向量及各类别样本的最佳分类特征矩阵;计算所述待识别图像在所述最佳投影空间的特征向量分别与各个类别样本的最佳分类特征矩阵的欧式距离,并选取较小的前s个欧式距离所对应的训练样本的类别。2.如权利要求1所述的方法,其特征在于,所述降维方法包括线性降维法和/或非线性降维法的结合;所述线性降维法包括:主成分分析PCA法、线性鉴别分析LDA法、独立成分分析ICA法、二维主成分分析2DPCA法或二维线性鉴别分析2DLDA法;所述非线性降维法包括:核主成分分析KPCA法、核线性鉴别分析KLDA法或核独立成分分析KICA法。3.如权利要求1至2任一项所述的方法,其特征在于,所述用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型具体包括:对所述已知类别的训练样本进行支持向量机SVM的训练得到SVM模型;根据所述选出的前s类训练样本,将所述待识别图像在所述最终识别模型中进行识别运算具体包括:将所述待识别图像在所述SVM模型中按照所述前s类训练样本进行识别运算;或,所述用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型具体包括:对所述已知类别的训练样本进行隐马尔科夫模型HMM的训练得到HMM模型;根据所述选出的前s类训练样本,将所述待识别图像在所述最终识别模型中进行识别运算具体包括:将所述待识别图像在所述HMM模型中按照所述前s类训练样本进行识别...
【专利技术属性】
技术研发人员:唐健,陶昆,吴伟华,廖振生,
申请(专利权)人:深圳市捷顺科技实业股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。