一种支持向量机的车牌字符识别方法技术

技术编号:7115604 阅读:301 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种车牌字符识别方法,包括支持向量机的训练过程和使用支持向量机进行车牌识别过程,本发明专利技术的车牌字符识别方法,采用LPP算法提取字符特征,得到的字符特征更具有分类判别性,提高判别效果;对字母数字分类器采用分层组建,可针对车牌的特点实现小类别范围内的识别,提高识别分别率,降低了识别算法的复杂度和训练参数存储资源,适用于嵌入式系统应用。采用基于置信度的视频流统计识别,避免了因单帧拍摄效果不好或车牌预处理效果不好而导致的识别效果不好的弊端,可进一步提高识别率。

【技术实现步骤摘要】

本专利技术涉及一种车牌字符识别方法,具体地说,是涉及,属于智能交通

技术介绍
车牌字符识别是在智能交通中对所抓拍的车牌视频或者图像中识别提取出车牌号码,我国的车牌号码由有限的汉字、英文字母和数字组成。车牌识别通常包括车牌预处理完成对车牌字符的分割、字符样本的提取;然后对车牌字符进行特征提取;最后对提取的特征利用分类器进行分类识别得到车牌字符的识别结果。对于车牌字符识别,目前最常用的方法是基于模板匹配的方法和基于神经网络的方法。模板匹配法多利用了字符的轮廓、网格、投影等统计特征进行字符的识别,而导致相似字符区分能力差以及因特征数据维数过大而导致识别速度慢等问题,还有模板的选择问题。神经网络方法通过多层神经网络对输入字符图像样本进行训练,产生分类器模型用于字符识别。但神经网络需要大量训练样本,存在网络输入数据的选择、网络结构设计和不易区分特征值相近的字符(如0,D, Q ;8, B)等问题。目前也有使用支持向量机法进行车牌字符识别,而目前使用该方法的字符识别过程,在车牌字符特征提取部分,一般是基于轮廓、网格、投影等统计特征,只能提取到字符的部分特征不利用分类识别(例如专利200910059360. 8);利用字符特征降维的方法现在逐渐利用到车牌字符特征提取上,能够全面提取字符特征,字符识别效果好,另外一种较多使用的降维方法是主成分分析(Principal Component Analysis,PCA)法,但这种方法是从全局的角度对数据进行降维,并未考虑数据的局部特征,在降维的过程中,不可避免地损失了一些重要信息,譬如数据的局部聚类情况。基于此,如何专利技术一种车牌字符识别方法,基于支持向量机,既能保持了支持向量机的优点,同时在字符特征提取方面可以在对高维数据进行降维映射后有效地保留数据内部的非线性结构,并利用多帧识别结果综合判断得到最优识别结果提高识别率,对字母数字分类器采用分层组建,提高识别分别率,降低了训练参数存储资源,提高识别率减少资源耗费是本专利技术主要解决的问题。
技术实现思路
本专利技术为了解决现有车牌字符识别效果差的问题,提出了一种车牌字符识别方法,识别率高,而且误判率低,提高了字符识别的正确率。为了解决上述技术问题,本专利技术采用以下技术方案予以实现,包括支持向量机的训练过程和使用支持向量机进行车牌识别过程,其中,支持向量机的训练过程包括以下步骤(1)、对训练车牌字符样本进行车牌预处理得到字符样本集Xtrain;(2)、对字符样本集Xtrain利用LPP算法计算得到变换矩阵A,可以使高维数据集 Xtrain映射到低维映射空间;(3)、对Xtrain利用变换矩阵A进行特征提取,得到训练车牌样本的特征数据集 Ytrain ;(4)、利用特征数据集Ytrain训练支持向量机,得到车牌字符识别的分类器; 使用支持向量机分类器进行车牌识别过程包括以下步骤(5)、对抓拍视频流中的每帧图片进行车牌定位,将定位得到的车牌预处理以及字符分割,得到测试字符样本集Xtest ;(6)、对Xtest利用变换矩阵A进行特征提取,得到训练车牌样本的特征数据集Ytest;(7)、将Ytest输入到支持向量机分类器,得到字符识别结果,并计算该识别结果的置信度;(8)、对多帧图片中该车牌的字符识别结果进行统计投票,确定最终识别结果。进一步的,根据经验值确定拒识阈值,字符识别结果的置信度高于此阈值才采信, 否则拒识,拒识的字符识别结果不参与投票。所述的支持向量机分类器采用一对一算法组建,包括字母-数字分类器和汉字分类器两大类分类器,具体的,所述字母-数字分类器采用三层的方式构建,这种构造方式相当于一个字母数字分类器规模,但可以根据需要分别对字母类、数字类、字母和数字类进行分类识别,在小范围内进行分类识别,提高了分类准确度以及计算速度,方法如下设nL个字母,nD个数字,第一层为nL个字母分别两两组成一个字母子分类器,共 nLX(nL-l)/2个字母子分类器;第二层为nD个数字分别两两组成一个数字子分类器,共nD X (nD_l)/2个数字子分类器;第三层为nL个字母与nD个数字分别两两组成一个字母_数字子分类器,共nLX nD个字母_数字子分类器;所述的汉字分类器采用一层的方式构建,设共nC个汉字,该nC个汉字分别两两组成一个汉字子分类器,共nCX (nC-l)/2个汉字子分类器,其中,nL、nD、nC均为正整数。具体的,步骤(8)中的分类识别过程为根据所组建的分层字母-数字分类器和汉字分类器两大类分类器,分别对车牌中字母、数字、字母和数字、汉字进行识别。又进一步的,步骤(9)中所述统计投票过程为根据匹配计算得出待测数据χ对每一个分类器所分类别的归属概率,遍历所有的分类器,进行投票,待测数据X属于得到的票数最多的类别,其中,X e xtest。在步骤(1)中,采集足够的车牌样本图片,含有的字符种类至少包括《中华人民共和国机动车号牌》(GA36-2007)附录B中定义的所有字符,每个字符的个数至少为30个。根据我国车牌特征,包括汉字、字母以及数字共7个字符,因此,在步骤(6)中,每一帧的车牌图片的测试样本集Xtest包括7个字符。在所述步骤(3)与步骤(4)之间,还包括将特征参数集Ytrain中的字符以同一字符为准,分成若干个特征参数子集,即包括nL个字母特征参数子集,nD个数字特征参数子集,nC个汉字特征参数子集。这样进行划分可以非常短时、有效的对支持向量机的各子分类器进行训练。步骤(1)和步骤(5)中所述的车牌预处理包括车牌二值化处理、车牌倾斜校正、车牌水平分割、车牌竖直分割处理。与现有技术相比,本专利技术的优点和积极效果是本专利技术的车牌字符识别方法,采用 LPP算法提取字符特征,得到的字符特征更具有分类判别性,提高判别效果;对字母数字分类器采用分层组建,可针对车牌的特点实现小类别范围内的识别,提高识别分别率,降低了识别算法的复杂度和训练参数存储资源,适用于嵌入式系统应用;采用基于置信度的视频流统计识别,避免了因单帧拍摄效果不好或车牌预处理效果不好而导致的识别效果不好的弊端,可进一步提高识别率。结合附图阅读本专利技术实施方式的详细描述后,本专利技术的其他特点和优点将变得更加清楚。附图说明图1是本专利技术所提出的车牌字符识别方法实施例一中的部分流程图; 图2是本专利技术所提出的车牌字符识别方法实施例一中的另外一部分流程图3是本专利技术所提出的车牌字符识别方法实施例一中支持向量机分类线示意图。具体实施例方式本专利技术的车牌字符识别方法为了提高车牌字符的识别率,以及同时降低了算法的复杂度,减小了计算量。下面结合附图对本专利技术的具体实施方式作进一步详细地说明。实施例一,本实施例的支持向量机的车牌字符识别方法,包括支持向量机的训练过程和使用支持向量机进行车牌识别过程,其中,参见图1所示,支持向量机的训练过程包括以下步骤S01、对训练样本车牌进行车牌预处理得到字符样本集Xtrain ; 作为一个具体的实施例,训练样本车牌是通过采集足够的车牌样本图片,使得车牌样本图片中所包含的字符种类至少包括《中华人民共和国机动车号牌》(GA36-2007)附录B中定义的所有字符,而且,由于在车牌抓拍过程中拍摄角度、光线的不同,即便是同一字符所拍出的样式也差别非常大,为了提高字符识别本文档来自技高网
...

【技术保护点】
1.一种支持向量机的车牌字符识别方法,包括支持向量机的训练过程和使用支持向量机进行车牌识别过程,其特征在于,支持向量机的训练过程包括以下步骤:(1)、对训练车牌字符样本进行车牌预处理得到字符样本集Xtrain;(2)、对字符样本集Xtrain利用LPP算法计算得到变换矩阵A,使高维数据集Xtrain映射到低维映射空间;(3)、对Xtrain利用变换矩阵A进行特征提取,得到训练车牌样本的特征数据集Ytrain;(4)、利用特征数据集Ytrain训练支持向量机,得到车牌字符识别的分类器;使用支持向量机分类器进行车牌识别过程包括以下步骤:(5)、对抓拍视频流中的每帧图片进行车牌定位,将定位得到的车牌预处理以及字符分割,得到测试字符样本集Xtest;(6)、对Xtest利用变换矩阵A进行特征提取,得到训练车牌样本的特征数据集Ytest;(7)、将Ytest输入到支持向量机分类器,得到字符识别结果,并计算该识别结果的置信度;(8)、对多帧图片中该车牌的字符识别结果进行统计投票,确定最终识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:裴雷陈维强朱中刘微刘韶王晓曼魏楠楠卜柯
申请(专利权)人:青岛海信网络科技股份有限公司
类型:发明
国别省市:95

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1