一种基于互信息与特征提取的车牌识别方法技术

技术编号:14570270 阅读:156 留言:0更新日期:2017-02-06 04:10
本发明专利技术公开一种基于互信息与特征提取的车牌识别方法,首先,根据不同的车牌颜色以及我国车牌的编号特征进行模板库的分类,分别建立汉字模板库、数字字母模板库、数字模板库以及字母模板库等。其次,本发明专利技术采用多模板互信息匹配,对于字母与数字的识别,如果同样采用多模板互信息匹配,则大大增加了其计算复杂度。在实际应用中,本发明专利技术对字母与数字采用单模板互信息匹配与易混字特征提取的方法进行判别。这样将模板分成不同的库以及不同的字符采用不同的识别方案,不仅大大提高了速度,又提高了正确识别率,真正解决了实际应用场景的技术问题。

【技术实现步骤摘要】

本专利技术公开一种车牌识别方法,特别是一种基于互信息与特征提取的车牌识别方法
技术介绍
车牌识别系统经过多年的发展,已经是一项较为成熟的技术,但由于外界环境光线变化、季节环境等变化及车牌本身比较模糊等条件的影响,使得车牌识别系统一直是一个有解但一直不能解决得很好的问题,而且现有技术中的许多方法都计算复杂,并没有考虑到实时处理的环境。虽然目前国内外都有一些实用的车牌识别系统面市,但是,这些系统的识别率都因获取条件的不良变化有很大降低,至今车牌自动识别技术尚未达到很完善的程度,仍需进一步的研究与完善。车牌识别系统将向着不断提高适应性和实时性的方向发展。另外,我国车牌的类型复杂也为识别带来了困难。目前,我国车牌主要具有以下特点:(1)我国车牌类型可分为蓝底白字、黑底白字、黄底黑字以及白底黑字四种类型。(2)我国车牌上的汉字部分一般都表示不同省份自治区直辖市的简称(总共31个),设置在车牌的第一个字符。其中,黑底车牌还包含了使馆汽车号牌和摩托车号牌,其机动车登记编号的简称汉字为“使”。(3)2013年5月,新式武警车牌与军用车牌正式启用,新式武警车牌的第二个字符块将原来的小写数字改成汉字(例如:WJ01.12345改成WJ京.12345)。军用车牌的第一个字符由原来的汉字改成字母(例如:海A.12345改成HA.12345)。因此,第一个字符包含了31个汉字和10个字母(即由原来7个军<br>区汉字简称以及“军”、“海”、“空”组成的10个汉字变成10个字母简称)。(4)在车牌中第二个字符位置一般为26个字母。(5)蓝底车牌与黑底车牌的第三个字符到第七个字符一般为数字与字母,其中,黑牌的第七个字符还包含了领馆车的“领”与港澳台车牌的“港澳台”。黄底车牌与白底车牌的第三个与第四个字符为数字与字母,第五个与第七个字符一般为数字,其中黄底车牌的第七个字符还包含教练汽车号牌和摩托车号牌的机动车登记编号中使用汉字简称“学”字,挂车号牌的机动车登记编号中使用汉字简称“挂”字,试验车的临时行驶车号牌的机动车登记编号中使用汉字简称“试”字,以及特型车的临时行驶车号牌的机动车登记编号中使用汉字简称“超”字等;白底车牌的第七个字符还包含警用车牌的“警”字。(6)我国车牌上还存在一些字符结构特征比较相似的字符(如阿拉伯数字“2”与英文字母“Z”、“8”和“B”、“5”和“S”、“0”和“Q”等)这些特征都会给车牌字符识别带来困扰,其通常被称为“易混字符”。正因为我国车牌的这种特殊性,使得我国车牌的识别与国外相比更具挑战性。国内许多学者针对我国车牌的特点提出了很多有效的车牌识别方法。现有技术中车牌识别方法主要分为三大类:基于模板匹配、特征统计匹配与基于分类器的字符识别。模板匹配算法结构设计简单,易于实现,但识别结果受分割出的二值图像质量的影响,如果字符倾斜、断裂、模糊或是光照不均等,均会造成字符识别错误;字符的统计特征算法本身比较复杂,将字符点矩阵看作是一个整体,根据每个字符的笔画特征点不同,将字符分解为横、竖、撇、捺等一种或几种的组合,经过统计从而得到相应的特征,在实际的应用中,由于外部原因造成的字符模糊、倾斜等情况,导致了部分字符无法正确识别;机器学习受这些影响较小,但其本身结构复杂,对字符的特征提取方法要求较高,样本选取困难,且训练速度慢,难于收敛,所以这三类方法各有利弊。
技术实现思路
针对上述提到的现有技术中的车牌识别方法各自存在的弊端,本专利技术针对我国车牌特征以及字符特征,采用不同的识别方法来提高其识别效果。首先,我国车牌拥有蓝底、黑底、白底与黄底四种类型,根据不同的车牌颜色以及我国车牌的编号特征进行模板库的分类,分别建立汉字模板库、数字字母模板库、数字模板库以及字母模板库等。其次,车牌中的汉字常常出现粘连、模糊不清、缺失等情况,本专利技术采用多模板互信息匹配,能很好解决其问题。对于字母与数字的识别,如果同样采用多模板互信息匹配,则大大增加了其计算复杂度。在实际应用中,字母与数字比汉字更加清晰完整,但字母与数字拥有很多的相似字符,仅采用互信息匹配已无法满足易混字符(即相似字符,如0与D)的判别,所以本专利技术对字母与数字采用单模板互信息匹配与易混字特征提取的方法进行判别。这样将模板分成不同的库以及不同的字符采用不同的识别方案,不仅大大提高了速度,又提高了正确识别率,真正解决了实际应用场景的技术问题。本专利技术解决其技术问题采用的技术方案是:一种基于互信息与特征提取的车牌识别方法,该车牌识别方法包括下述步骤:步骤S1:第一个字符识别,如果是白牌,则判断是否为警用车牌,如果是警用车牌,则同黄牌、黑牌与蓝牌一样选用32个汉字多模板库,进行多模板互信息匹配,不是警用车牌,则选择军用车牌的10个单模板字母库,采用互信息单模板匹配与易混字特征提取;步骤S2:第二个字符识别,选择26个字母的单模板库,采用互信息单模板匹配与易混字特征提取方法;步骤S3:第三个字符与第四个字符识别,选用24个字母与10个数字的单模板库,进行互信息单模板匹配与易混字特征提取。步骤S4:第五个字符与第六个字符识别,如果为蓝牌与黑牌,则选用24个字母与10个数字的单模板库,如果是黄牌与白牌,则选用10个数字的单模板库,同样采用互信息单模板匹配与易混字特征提取;步骤S5:第七个字符识别,如果是蓝牌,则选用24个字母与10个数字的单模板库,如果是黄牌,则选择10个数字的单模板与3个汉字多模板库,如果是黑牌,则选择10个数字与24个字母的单模板库与“港澳台领”的多模板库,同样采用互信息与易混字特征提取方法。本专利技术解决其技术问题采用的技术方案进一步还包括:所述的步骤S1中所述的多模板互信息匹配识别一个待识别字符,其主要步骤如下:a.首先计算待识别字符与字符库中每个模板的互信息,并求得最大互信息;b.互信息计算公式为:I(A,B)=H(A)+H(B)-H(AB),其中,H=-(p1log2p1+p2log2p2+…+pnlog2pn),对于输入的二值图像I(x,y),其熵可得,H(A)=-(pA(0)log2pA(0)+pA(1)log2pA(1)),同理,模板库中第i个模板的熵为:H(i)=-(pi(0)log2pi(0)+pi(1)log2pi(1)),则可得待识别字符与第i个模板互信息为:H(A,i)=-(pA,i(0)log2pA,i(0)+pA,i(1)log2pA,i(1本文档来自技高网
...

【技术保护点】
一种基于互信息与特征提取的车牌识别方法,其特征是:所述的车牌识别方法包括下述步骤:步骤S1:第一个字符识别,如果是白牌,则判断是否为警用车牌,如果是警用车牌,则同黄牌、黑牌与蓝牌一样选用32个汉字多模板库,进行多模板互信息匹配,不是警用车牌,则选择军用车牌的10个单模板字母库,采用互信息单模板匹配与易混字特征提取;步骤S2:第二个字符识别,选择26个字母的单模板库,采用互信息单模板匹配与易混字特征提取方法;步骤S3:第三个字符与第四个字符识别,选用24个字母与10个数字的单模板库,进行互信息单模板匹配与易混字特征提取。步骤S4:第五个字符与第六个字符识别,如果为蓝牌与黑牌,则选用24个字母与10个数字的单模板库,如果是黄牌与白牌,则选用10个数字的单模板库,同样采用互信息单模板匹配与易混字特征提取;步骤S5:第七个字符识别,如果是蓝牌,则选用24个字母与10个数字的单模板库,如果是黄牌,则选择10个数字的单模板与3个汉字多模板库,如果是黑牌,则选择10个数字与24个字母的单模板库与“港澳台领”的多模板库,同样采用互信息与易混字特征提取方法。

【技术特征摘要】
1.一种基于互信息与特征提取的车牌识别方法,其特征是:所述的车牌识别
方法包括下述步骤:
步骤S1:第一个字符识别,如果是白牌,则判断是否为警用车牌,如果是
警用车牌,则同黄牌、黑牌与蓝牌一样选用32个汉字多模板库,进行多模板互
信息匹配,不是警用车牌,则选择军用车牌的10个单模板字母库,采用互信息
单模板匹配与易混字特征提取;
步骤S2:第二个字符识别,选择26个字母的单模板库,采用互信息单模板
匹配与易混字特征提取方法;
步骤S3:第三个字符与第四个字符识别,选用24个字母与10个数字的单
模板库,进行互信息单模板匹配与易混字特征提取。
步骤S4:第五个字符与第六个字符识别,如果为蓝牌与黑牌,则选用24
个字母与10个数字的单模板库,如果是黄牌与白牌,则选用10个数字的单模
板库,同样采用互信息单模板匹配与易混字特征提取;
步骤S5:第七个字符识别,如果是蓝牌,则选用24个字母与10个数字的
单模板库,如果是黄牌,则选择10个数字的单模板与3个汉字多模板库,如果
是黑牌,则选择10个数字与24个字母的单模板库与“港澳台领”的多模板库,同
样采用互信息与易混字特征提取方法。
2.根据权利要求1所述的基于互信息与特征提取的车牌识别方法,其特征是:
所述的步骤S1中所述的多模板互信息匹配识别一个待识别字符,其主要
步骤如下:
a.首先计算待识别字符与字符库中每个模板的互信息,并求得最大互信息;
b.互信息计算公式为:I(A,B)=H(A)+H(B)-H(AB),其中,
H=-(p1log2p1+p2log2p2+…+pnlog2pn),对于输入的二值图像I(x,y),其熵可得,

\tH(A)=-(pA(0)log2pA(0)+pA(1)log2pA(1)),同理,模板库中第i个模板的熵为:
H(i)=-(pi(0)log2pi(0)+pi(1)log2pi(1)),则可得待识别字符与第i个模板互信息为:
H(A,i)=-(pA,i(0)log2pA,i(0)+pA,i(1)log2pA,i(1)),其中,pA,i(0)表示待识别字符与模板
字符像素点都为0的概率;
c.将待识别字符判为互信息最大的模板所属的那一类。
3.根据权利要求1所述的基于互信息与特征提取的车牌识别方法,其特征是:
所述的步骤S1中所述的单模板互信息与易混字特征提取方法的主要步骤
包括:
1)对待识别字符进行单模板互信息识别,每个字符只对应一个模板;
2)如果经过单模板互信息匹配判别的字符属于易混字符,则进行易混字符
特征提取判别,并输出判别结果;如果不属于易混字符,则输出单模板互信息
的判别结果。
4.根据权利要求3所述的基于互信息与特征提取的车牌识别方法,其特征是:
所述的易混字符的特征提取判别方法实现步骤如下:首先,根据单模板互
信息匹配判别的结果,进行不同的特征提取,然后将其特征与模板库对应
的特征求欧氏距离,将其判为欧氏距离最小的那一类。
5.根据权利要求4所述的基于互信息与特征提取的车牌识别方法,其特征是:
所述的特征提取的统计特征包括:①中间部分的白像素和,基于32*16
大小的字符模板,其区域范围为:左上坐标为(6,10),右下坐标为(10,20);
②右下角部分的白像素和,基于32*16大小的字符模板,其区域范围为:
左上坐标为(10,16),右下坐标为(16,32);③下半部分白像素和,基于
32*16大小的字符模板,其区域范围为:左上坐标为(1,16),右下坐标为
(16,32);侧面轮廓深度指字符某一侧面离边界的深度和,令在第i行,

\t从右边界向左边界扫描,当遇到第一个像素不为零时,计算右边界到此像
素点之间的为零数量,通过提取字符4个侧面的轮廓深度累加和,能够获
得4个特征向量,即左侧面轮廓深度、右侧面轮廓深度、上侧面轮廓深度、
下侧面轮廓深度;最大上轮廓深度指从中间列向右边扫描,计算每一列为
零像素深度,获得最大的轮廓深度为其特征;轮廓的宽度比指从每一行的
左边开始扫描,计算每行的第一次由1变为0到第一次由0变1中间为0
的个数,并计算其最大与最小的个数比即为轮廓宽度比。
6.根据权利要求5所述的基于互信息与特征提取的车牌识别方法,其特征是:
所述的步骤S2中易混字符与其特征提取方法包含如下:
①与“E”“F”易混字有:“B”,其采用的特征方法为:下半部分像素统计特
征与右轮廓深度;
②与“B”易混字有:“D”,其采用的特征方法为:中间像素统计;
③与“D”易混字有:“O”:其可根据左直线像素统计特征与左上左下的零像
素统计进行识别;
④与“G”易混字有:“Q、S、B”,首先根据左直线像素统计特征与左上左
下的零像素统计区分出“B”,然后根据右...

【专利技术属性】
技术研发人员:肖娟李战斌李赫刘中奎林苏鹏
申请(专利权)人:江苏省兴泽实业发展有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1