基于SVM的票据图像分类方法技术

技术编号:13975139 阅读:99 留言:0更新日期:2016-11-11 09:25
本发明专利技术公开了基于SVM的票据图像分类方法,包括:进行样本训练,得到性能优化的SVM分类器;制作公章模板;通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线从而判断待识别的原图像是否为非识别票据图像,对待识别的原图像进行倾斜校正;选取待识别的原图像中灰度值在最大灰度阈值和最小灰度阈值之间的所有像素,判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点,剔除面积较小的轮廓从而得到待识别的原图像中公章的轮廓;将公章轮廓与公章模板进行匹配,若匹配成功,则提取公章轮廓的HOG特征作为性能优化的SVM分类器的输入,得出待识别的原图像的票据类型。本发明专利技术分类的速度快,准确性高。

【技术实现步骤摘要】

本专利技术属于图像处理领域,尤其涉及一种基于SVM的票据图像分类方法
技术介绍
在票据的管理上,传统票务管理依靠人工,人力成本较高,效率低,而且在票据比较多,任务比较紧的时候,传统的方法需人力熬夜加班,甚至都无法完成指标,因此票据自动分类系统应运而生。票据自动分类通过对票据扫描成的票据图像的分析,采用图像处理方法自动分类票据。目前的票据自动分类方法主要分为两类,第一类是采用模板匹配方法,此方法通过将每一种类型的票据标准图像制作成模板图像,通过将待识别的图像和每类模板进行模板匹配,将票据识别为匹配率最高的那一类;第二类是通过OCR的方法,识别票据中的特殊的数字和字母,对识别出的数字和字母进行类型识别,完成图像的分类。但现有的票据分类方法存在一定的问题:首先第一类的方法和第二类的方法均从整幅图像出发,复杂性高,时间成本高;第一类的方法和第二类的方法没有倾斜校正的机制,若图像中的目标物体位置倾斜,会影响图像的匹配结果以及OCR字段识别,此时误检率较高;第一类采用模板匹配的方法需要将票据同每一类的模板进行匹配,耗时高,尤其是当票据种类较多时,此类方法呈现明显的弱势;第二类通过OCR的方法,识别图像的特殊字段来分类票据,由于不同的票据有可能包含相同的标题字段,从而造成较高概率的错误分类;第一类的方法和第二类的方法中,没有错误分类机制,它们将待识别的每一幅图像都分成我们要处理的票据类别,而实际财务处理中,会出现很多不是我们需要的票据,将这些票据加入到财务系统不仅不会减轻财务人员的工作,反而无形中增加了劳动成本。
技术实现思路
本专利技术所要解决的技术问题是针对上述现有技术的不足提供一种基于SVM的票据图像分类方法,基于SVM的票据图像分类方法能准确的去除不属于用户需要的票据图像,即提供了去除非待识别票据图像的机制,使票据图像的管理更加系统化,完善化;对票据图像的公章区域进行处理,克服了从票据图像整体进行处理的缺陷,提高了检测的速度;对票据图像进行倾斜校正,克服了由于票据图像的倾斜而造成识别错误的情况;采用SVM分类方法,分类结果更加准确。为实现上述技术目的,本专利技术采取的技术方案为:基于SVM的票据图像分类方法,包括以下步骤:(1)选取多张标准票据图像,作为样本进行SVM分类器训练,得到性能优化的SVM分类器;截取每一种类型的标准票据中的公章图像并将所有的公章图像组合成一幅公章模板;(2)对待识别的原图像进行二值化,通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线,设定两条直线之间的距离阈值,将图像中直线之间的距离小于距离阈值的两条直线合并成一条直线;设定直线数目的最大数目阈值和最小数目阈值,若图像中所有直线的数目不在最大数目阈值和最小数目阈值之间,则将此待识别的原图像分类为非识别票据图像,否则执行步骤(3);(3)对待识别的原图像进行倾斜校正;(4)根据公章的亮度特征设定公章的最大灰度阈值和最小灰度阈值,选取待识别的原图像中灰度值在最大灰度阈值和最小灰度阈值之间的所有像素,判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合,从轮廓集合中剔除面积较小的轮廓从而得到待识别的原图像中公章的轮廓;(5)将步骤(4)得到的公章轮廓与步骤(1)得到的公章模板进行匹配,若匹配不成功,则将待识别的原图像分类为非识别票据图像,若匹配成功,则执行步骤(6);(6)提取公章轮廓的HOG特征,作为步骤(1)中性能优化的SVM分类器的输入,得出待识别的原图像的票据类型。作为本专利技术进一步解决的技术方案,所述对待识别的原图像进行倾斜校正,包括:以待识别的原图像的左上角为原点,待识别的原图像的水平向右方向为X轴的正方向,待识别的原图像的垂直向下方向为Y轴的正方向,建立坐标系;通过Hough变换检测直线的方法提取待识别的原图像中的所有直线,将待识别的原图像中的直线与X轴的正方向的夹角作为直线角度;查找待识别的原图像中两条直线之间的夹角为90度的所有直线对,将所有直线对中角度最小的直线角度作为待识别的原图像的旋转角度,将待识别的原图像进行逆时针旋转,实现待识别的原图像的倾斜较正;若没有查找到待识别的原图像中的夹角为90度的直线对,通过Hough变换检测直线的方法选取待识别的原图像的所有直线中的最长直线,选取最长直线与X轴的正方向的夹角作为待识别的原图像的旋转角度,将待识别的原图像进行逆时针旋转,实现待识别的原图像的倾斜较正。作为本专利技术进一步解决的技术方案,所述对待识别的原图像进行二值化,包括:设定灰度阈值,将待识别的原图像中灰度值低于灰度阈值的像素点的灰度值设置为1,将待识别的原图像中灰度值高于灰度阈值的像素点的灰度值设置为0,从而实现待识别的原图像的二值化。作为本专利技术进一步解决的技术方案,所述判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合,包括:将待识别的原图像的RGB颜色空间转换到HSV颜色空间,根据HSV颜色空间中的三个颜色分量的值判断选取的每个像素的颜色;过滤不属于公章部分的颜色范围的像素点从而得到轮廓集合。作为本专利技术进一步解决的技术方案,所述选取多张标准票据图像,作为样本进行SVM分类器训练,得到性能优化的SVM分类器,包括:设定SVM分类器的数目,准备训练样本集合,包括正样本集和负样本集,正样本集为多张一种类别标准票据的图像,负样本集为多张其它类别标准票据的图像;手动截取所有正样本集中的公章轮廓和负样本集中的公章轮廓;提取所有正样本集中的公章轮廓的HOG特征和负样本集中的公章轮廓的HOG特征,进行SVM分类器训练,得到性能优化的SVM分类器。本专利技术对票据图像的公章区域进行处理,克服了从票据图像整体进行处理的缺点,提高了分类速度;对票据图像进行倾斜校正,克服了由于票据图像的倾斜而导致分类错误的情况;每种票据图像的公章区域是最明显的分类特征,对票据图像的公章区域采用SVM分类方法,相对于采用现有的OCR识别方法进行票据图像分类,本专利技术的准确性更高;本专利技术有效的去除匹配不成功的公章轮廓的票据图像,去除所有直线的数目不在最大数目阈值和最小数目阈值之间的票据图像,因此本专利技术提供了去除非待识别票据图像的机制,使票据图像的管理更加系统化和完善化;本专利技术对票据图像的分类是基于票据类型的,因此本专利技术对票据图像进行分类,可以为之后的票据自动处理提供基础。附图说明图1为本专利技术的工作流程图。具体实施方式下面根据图1对本专利技术的具体实施方式作出进一步说明:参见图1,基于SVM的票据图像分类方法,包括以下步骤: (1)选取多张标准票据图像,作为样本进行SVM分类器训练,得到性能优化的SVM分类器;标准票据都包含公章,而且公章的规格都是严格规定的,截取每一种类型的标准票据中的公章图像并将所有的公章图像组合成一幅公章模板;(2)对待识别的原图像进行二值化,通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线,根据票据图像的线框特点设定两条直线之间的距离阈值L,将图像中直线之间的距离小于距离阈值L的两条直线合并成一条直线, 从而解决由于票据图像质量问题而造成的直线断连的问题;根据票据图像的线框的几何特征设定直线数目的最大数目阈值N1和最小数目阈值N2,通过Hough变换检测直线的方法本文档来自技高网...
基于SVM的票据图像分类方法

【技术保护点】
基于SVM的票据图像分类方法,其特征在于:包括以下步骤:(1)选取多张标准票据图像,作为样本进行SVM分类器训练,得到性能优化的SVM分类器;截取每一种类型的标准票据中的公章图像并将所有的公章图像组合成一幅公章模板;(2)对待识别的原图像进行二值化,通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线,设定两条直线之间的距离阈值,将图像中直线之间的距离小于距离阈值的两条直线合并成一条直线;设定直线数目的最大数目阈值和最小数目阈值,若图像中所有直线的数目不在最大数目阈值和最小数目阈值之间,则将此待识别的原图像分类为非识别票据图像,否则执行步骤(3);(3)对待识别的原图像进行倾斜校正;(4)根据公章的亮度特征设定公章的最大灰度阈值和最小灰度阈值,选取待识别的原图像中灰度值在最大灰度阈值和最小灰度阈值之间的所有像素,判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合,从轮廓集合中剔除面积较小的轮廓从而得到待识别的原图像中公章的轮廓;(5)将步骤(4)得到的公章轮廓与步骤(1)得到的公章模板进行匹配,若匹配不成功,则将待识别的原图像分类为非识别票据图像,若匹配成功,则执行步骤(6);(6)提取公章轮廓的HOG特征,作为步骤(1)中性能优化的SVM分类器的输入,得出待识别的原图像的票据类型。...

【技术特征摘要】
1.基于SVM的票据图像分类方法,其特征在于:包括以下步骤:(1)选取多张标准票据图像,作为样本进行SVM分类器训练,得到性能优化的SVM分类器;截取每一种类型的标准票据中的公章图像并将所有的公章图像组合成一幅公章模板;(2)对待识别的原图像进行二值化,通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线,设定两条直线之间的距离阈值,将图像中直线之间的距离小于距离阈值的两条直线合并成一条直线;设定直线数目的最大数目阈值和最小数目阈值,若图像中所有直线的数目不在最大数目阈值和最小数目阈值之间,则将此待识别的原图像分类为非识别票据图像,否则执行步骤(3);(3)对待识别的原图像进行倾斜校正;(4)根据公章的亮度特征设定公章的最大灰度阈值和最小灰度阈值,选取待识别的原图像中灰度值在最大灰度阈值和最小灰度阈值之间的所有像素,判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合,从轮廓集合中剔除面积较小的轮廓从而得到待识别的原图像中公章的轮廓;(5)将步骤(4)得到的公章轮廓与步骤(1)得到的公章模板进行匹配,若匹配不成功,则将待识别的原图像分类为非识别票据图像,若匹配成功,则执行步骤(6);(6)提取公章轮廓的HOG特征,作为步骤(1)中性能优化的SVM分类器的输入,得出待识别的原图像的票据类型。2.根据权利要求1所述的基于SVM的票据图像分类方法,其特征在于:所述对待识别的原图像进行倾斜校正,包括:以待识别的原图像的左上角为原点,待识别的原图像的水平向右方向为X轴的正方向,待识别的原图像的垂直向下方向为Y轴的正方向,建立坐标系;通过Hough变换检测直线的方法提取待识别的原图像中的所有直线,将待识别的原图像中的直线与X轴的正方向的夹角作为直线角度;查找待...

【专利技术属性】
技术研发人员:邵一婷车少帅于志文胡笳沈宇
申请(专利权)人:江苏鸿信系统集成有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1