一种基于多分类支持向量机的集装箱箱号识别方法技术

技术编号:6970536 阅读:320 留言:0更新日期:2012-04-11 18:40
一种基于多分类支持向量机的集装箱箱号识别方法,属于计算机图像处理技术领域。首先采集集装箱箱号字符图像,经二值化和归一化处理后分成字母图像集和数字图像集;然后构建两个多分类支持向量机,分别采用字母图像集和数字图像集的特征向量矩阵进行训练,训练过程中采用Adaboost算法,得到两个多分类支持向量机分类器SVC和SVN;箱号识别过程中,将待识别集装箱箱号分割成11个字符图像,经二值化和归一化处理后,将第1至第4个特征向量输入到SVC进行识别,第5至第11个特征向量输入到SVN进行识别。本发明专利技术创新性地将支持向量机和Adaboost算法结合起来应用于集装箱箱号字符识别,相比于其他同领域的技术方案具有更高的识别率和较小的计算量。

【技术实现步骤摘要】

本专利技术属于计算机图像处理
,涉及集装箱箱号自动识别技术。
技术介绍
集装箱是一种综合性的大型周转货箱,集装箱号指装运出口货物的集装箱箱号, 全球所有的集装箱都具有一个唯一的箱号与之对应。标准箱号构成基本概念采用IS06346标准1.第一部分由4位英文字母组成。前三位代码主要说明箱主、经营人,第四位代码说明集装箱类型。例如CBHU开头的标准装箱是表明箱主和经营人为中远集运。2.第二部分由6位数字组成。是箱体注册码,用于一个集装箱箱体特有的唯一标识。3.第三部分为校验码由前四位字母和6位数字经过校验规则运算得到,用于识别在校验时是否发生错误。即第11位数字。本专利技术中集装箱箱号识别是一种视频光学字符自动识别,利用计算机视觉技术来完成对集装箱箱号的识别。集装箱箱号识别系统一般要求能实时识别通过港口的集装箱箱号并通过计算机检索系统查询集装箱的信息。典型的集装箱箱号识别方法可以分为四个过程箱号采集、箱号定位、箱号字符分割和字符识别,而如何进行精确的字符识别是影响集装箱箱号识别系统识别率高低的一个关键问题。虽然集装箱箱号识别可以借鉴现有的一些通用的计算机字符识别方法,但很难达到理想的效果,究其原因,是因为集装箱箱号字符识别具有自身的特点,而一般通用的字符识别方法都没有将这些特点考虑进去,识别的效果不好也在情理之中,其特点为字符集小 (数字和字母)、箱号字体没有统一的印刷标准(箱号字体的印刷因集装箱所属公司而有所不同)、干扰和几何变形较多(如集装箱背面还存在着很多非箱号的其他字符)、甚至出现箱号破损的情况。而且集装箱箱号字符识别要求更高的识别率,上下文字符也没有语义和概率上的相关性。现有的计算机字符识别主要有以下几种方法1.模板匹配的方法,利用字符轮廓、骨干、网络或者投影等特征,与标准字符比对分类。但是,由于实际应用集装箱字符中存在的干扰和变形,因此常常没有得到理想的效^ ο2.按字符特征分类的方法,找出能够区别字符集中字符的特征集,如字符像素比例、孔洞数、字形结构、笔画特征等。由于特征算法实现起来比较困难,而且同样由于噪声干扰的问题,这一方法的识别率不高。3.神经网络的方法是目前比较成功的方法。但是要求输入数据较多和网络结构设计复杂等问题
技术实现思路
本专利技术提供,该方法基于多分类支持向量机,利用其良好的分类能力,直接对提取出来的集装箱箱号字符进行自动分类识别,具有更高的识别率。本专利技术技术方案如下,如附图说明图1所示,包括多分类支持向量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程一、多分类支持向量机的训练过程,包括如下步骤步骤1 字符图像的二值化和归一化处理。采集足够多的集装箱箱号字符图像;然后对采集的所有集装箱箱号字符图像进行二值化处理、并归一化成宽度为M个像素、高度为N个像素大小的尺寸。归一化后的二值化集装箱箱号字符图像集记为图像集Train。二值化阈值的取值范围可取为,归一化后的二值化集装箱箱号字符图像宽度M最好为16像素,高度N最好为32像素。步骤2 将步骤1所得的图像集Train分成个字母图像集Train_C_I和数字图像集Train_N_I,其中字母图像集Train_C_I包括A Z共计沈个子集,数字图像集Train_ N_I包括0 9共计10个子集。步骤3 计算步骤2所得各个子集中所有图像的特征向量,得到字母特征向量集 Train_C_V和数字特征向量集Train_N_V,其中字母特征向量集I~rain_C_V包括沈个子集, 数字特征向量集Train_N_V包括10个子集。所述特征向量为一个MXN+1维的行向量,其中前MXN维由每幅二值图像的像素值按行首尾相接依次排列而成,第MXN+1维是区别36 个子集的标签。步骤4 将字母特征向量集Train_C_V中所有特征向量组合成字母特征向量矩阵 Train_C_V_M,同时将数字特征向量集Train_N_V中所有特征向量组合成数字特征向量矩阵 Train_N_V_M。步骤5 建立两个多分类支持向量机分类器SV。和SVN。构建两个多分类支持向量机,分别采用字母特征向量矩阵Train_C_V_M和数字特征向量矩阵Train_N_V_M进行训练,训练过程中采用Adaboost算法,得到两个多分类支持向量机分类器SVe和SVn。二、使用多分类支持支持向量机进行集装箱箱号识别的过程,具体包括以下步骤步骤6 采集待识别集装箱箱号图像,经定位、分割处理后得到11个的待识别的集装箱箱号字符图像;再对11个待识别的集装箱箱号字符图像进行步骤1所述的二值化和归一化处理。步骤7 计算11个归一化后的二值化待识别集装箱箱号字符图像的特征向量,并将11个特征向量按待识别集装箱箱号字符图像在待识别集装箱箱号中的位置顺序依次定义为HL、)^。所述特征向量由每幅图像的灰度值按行依次排列成。步骤8 对11个特征向量进行分类识别。由于集装箱箱号由11个字符组成,11个字符中,前4个字符为英文字母,后7个字符为阿拉伯数字;所以对& &这4个特征向量,采用多分类支持向量机分类器SVc进行识别,得到待识别集装箱箱号第1至第4个的标签,进而得到待识别集装箱箱号第1至第4个字符识别结果;对X5 X11这7个特征向量,采用多分类支持向量机分类器SVn进行识另Ij,得到待识别集装箱箱号第5至第11个的标签,进而得到待识别集装箱箱号第5至第11 个字符识别结果。需要说明的是1、步骤1中,采集集装箱箱号字符图像时,应当在各种光照条件下采集,且保证每种字符的采集数量在20个以上。2、本专利技术所述的多分类支持向量机,对于内核函数并没有特别的限定,但若采用径向基核函数,会使得最终的识别准确率更高。3、考虑到多分类支持向量机的特性,本专利技术在多分类向量机的训练过程中,采集集装箱箱号字符图像时,所采集的各种字符图像的数量应基本一致,以保证各字符平等地参与训练,从而减少由于训练次数差异带来的识别偏差本专利技术的有益效果是本专利技术创新性地将多分类支持向量机和Adaboost算法应用于集装箱箱号识别, 利用其良好的分类能力,直接对提取出来的字符分类,相比于其他同领域的方案具有更高的识别率。本专利技术区别对待集装箱箱号字符的前4位和后7位字符,将字符二值化图像特征向量分成两个集合,分别构造两个多分类支持向量机,并在识别过程中采用不同的支持向量机对需要识别的集装箱箱号字符进行逐一识别,大大减少了计算量。具体实施例方式,如图1所示,包括多分类支持向量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程一、多分类支持向量机的训练过程,包括如下步骤步骤1 字符图像的二值化和归一化处理。采集足够多的集装箱箱号字符图像;然后对采集的所有集装箱箱号字符图像进行二值化处理、并归一化成宽度为M个像素、高度为N个像素大小的尺寸。归一化后的二值化集装箱箱号字符图像集记为图像集Train。二值化阈值的取值范围可取为,归一化后的二值化集装箱箱号字符图像宽度M最好为16像素,高度N最好为32像素。步骤2 将步骤1所得的图像集Train分成个字母图像集Train_C_I和数字图像集Train_N_I,其中字母图像集Train_C_I包括A Z共计26个子集,数字图像集Train_ N_I包括0 9共计10个子集本文档来自技高网
...

【技术保护点】
1.一种基于多分类支持向量机的集装箱箱号识别方法,包括多分类支持向量机的训练过程和使用多分类支持向量机进行集装箱箱号的识别过程:一、多分类支持向量机的训练过程,包括如下步骤:步骤1:字符图像的二值化和归一化处理;采集足够多的集装箱箱号字符图像;然后对采集的所有集装箱箱号字符图像进行二值化处理、并归一化成宽度为M个像素、高度为N个像素大小的尺寸;归一化后的二值化集装箱箱号字符图像集记为图像集Train;步骤2:将步骤1所得的图像集Train分成个字母图像集Train_C_I和数字图像集Train_N_I,其中字母图像集Train_C_I包括A~Z共计26个子集,数字图像集Train_N_I包括0~9共计10个子集;步骤3:计算步骤2所得各个子集中所有图像的特征向量,得到字母特征向量集Train_C_V和数字特征向量集Train_N_V,其中字母特征向量集Train_C_V包括26个子集,数字特征向量集Train_N_V包括10个子集;所述特征向量为一个M×N+1维的行向量,其中前M×N维由每幅二值图像的像素值按行首尾相接依次排列而成,第M×N+1维是区别36个子集的标签;步骤4:将字母特征向量集Train_C_V中所有特征向量组合成字母特征向量矩阵Train_C_V_M,同时将数字特征向量集Train_N_V中所有特征向量组合成数字特征向量矩阵Train_N_V_M;步骤5:建立两个多分类支持向量机分类器SVC和SVN;构建两个多分类支持向量机,分别采用字母特征向量矩阵Train_C_V_M和数字特征向量矩阵Train_N_V_M进行训练,训练过程中采用Adaboost算法,得到两个多分类支持向量机分类器SVC和SVN;二、使用多分类支持支持向量机进行集装箱箱号识别的过程,具体包括以下步骤:步骤6:采集待识别集装箱箱号图像,经定位、分割处理后得到11个的待识别的集装箱箱号字符图像;再对11个待识别的集装箱箱号字符图像进行步骤1所述的二值化和归一化处理;步骤7:计算11个归一化后的二值化待识别集装箱箱号字符图像的特征向量,并将11个特征向量按待识别集装箱箱号字符图像在待识别集装箱箱号中的位置顺序依次定义为X1、X2、L、X11。所述特征向量由每幅图像的灰度值按行依次排列成;步骤8:对11个特征向量进行分类识别;由于集装箱箱号由11个字符组成,11个字符中,前4个字符为英文字母,后7个字符为阿拉伯数字;所以对X1~X4这4个特征向量,采用多分类支持向量机分类器SVC进行识别,得到待识别集装箱箱号第1至第4个的标签,进而得到待识别集装箱箱号第1至第4个字符识别结果;对X5~X11这7个特征向量,采用多分类支持向量机分类器SVN进行识别,得到待识别集装箱箱号第5至第11个的标签,进而得到待识别集装箱箱号第5至第11个字符识别结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:马争王伟
申请(专利权)人:电子科技大学
类型:发明
国别省市:90

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1