应用于移动终端的票据自动识别系统技术方案

技术编号:8068254 阅读:219 留言:0更新日期:2012-12-08 03:33
本实用新型专利技术公开了一种应用于移动终端的票据自动识别系统,该系统包括:终端处理模块和服务处理模块;终端处理模块,设置在移动终端中,用于对拍摄后存储在该移动终端内的票据进行识别和校验,通过识别和校验产生符合要求的票据数据并保存,然后将该票据数据保存同步到服务处理模块;服务处理模块,设置在服务器中,用于提取官方数据,并将官方数据与票据数据核对,判断是否与官方数据相一致。本实用新型专利技术所述的应用于移动终端的票据自动识别方法和系统,能够实现票据的自动识别其能够便于携带或集成于其他设备中并能够进行识别后处理。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本技术属于票据自动识别领域,尤其是涉及ー种应用于移动终端的票据自动识别系统
技术介绍
现有技术中虽然有ー些设备能够实现票据的识别,但由于设别设备技术的局限,无法实现快速高效的识别,而且现有的识别设备由于本身问题,无法实现携帯方便,同时也不具有一定的识别后的处理功能等问题。综上所述,制作出一设备能够实现票据的自动识别其能够便于携帯或集成于其他设备中井能够进行识别后处理,便成为亟待解决的技术问题。
技术实现思路
本技术所要解决的技术问题是提供ー种应用于移动终端的票据自动识别系统,以解决识别设备由于本身问题,无法实现携帯方便,同时也不具有一定的识别后的处理功能等问题。为解决上述技术问题,本技术提供了ー种应用于移动终端的票据自动识别系统,该系统包括终端处理模块和服务处理模块;其中所述终端处理模块,设置在移动终端中,用于对拍摄后存储在该移动终端内的票据进行识别和校验,通过识别和校验产生符合要求的票据数据并保存,然后将该票据数据保存同步到服务处理模块;所述服务处理模块,设置在服务器中,用于提取官方数据,并将官方数据与票据数据核对,判断是否与官方数据相一致。进ー步为设置在移动终端中,用于对拍摄后存储在该移动终端内的票据使用光学字符识别技术和该移动终端内设置的票据字符库进行识别和校验,通过识别和校验产生符合要求的票据数据并保存,然后将该票据数据保存同步到服务处理模块。进ー步地,其中,所述票据字符库包括票据的基本信息和特征信息。进ー步地,其中,所述终端处理模块,进ー步为用于对拍摄后存储在该移动终端内的票据使用光学字符识别技术进行预处理;对经过预处理后的数据进行版面分析;对经过版面分析后的数据进行行分割;通过票据字符库对经过行分割的数据进行字符分割;对经过字符分割后的数据进行特征提取;对经过特征提取后的数据进行分类处理;对经过分类处理后的数据进行后处理,产生符合要求的票据数据并保存,然后将该票据数据保存同步到服务处理模块。综上所述,与现有技术相比,本技术所述的应用于移动终端的票据自动识别系统,能够实现票据的自动识别其能够便于携帯或集成于其他设备中并能够进行识别后处理。附图说明图I为本技术实施例I所述的ー种应用于移动终端的票据自动识别方法流程框图。图2为本技术实施例I所述的方法中步骤101中所述的识别的具体流程框图。图3为本技术实施例2所述的ー种应用于移动终端的票据自动识别系统的结构框图。具体实施方式以下结合附图对本技术作进ー步详细说明,但不作为对本技术的限定。如图I所示,为本技术实施例I所述的ー种应用于移动终端的票据自动识别·方法,该方法包括如下步骤步骤101,移动终端通过对拍摄后存储在其内的票据进行识别和校验,通过识别和校验产生符合要求的票据数据,并将该票据数据保存在该移动終端。其中步骤101中所述的识别可以是在移动终端中设置票据字符库,移动终端通过使用OCR (Optical Character Recognition,光学字符识别)技术结合票据字符库判断票据本身具有的ー些基本信息和特征信息。比如当彩票数据时,可以在票据字符库设置彩票数据中具有的种类信息、期号信息、时间信息、注数信息或金额信息等特征数据,还可以包括ー些其他特征数据I)彩票图像的底色都是比较统ー的颜色;2)彩票的文本区域和名片的图像区域一般是分开的;3)彩票中的重要文本信息,投注内容信息比一般文本信息字体大;4)彩票中的主要字符为中文和数字,英文字符较少且为非关键性信息;5)彩票的排版一般为从左到右横排。在票据字符库中可以设置有常用的特征数据或字段,进行权重的分配,在进行识别时候可以优先考虑先使用常用的特征数据或字段。在词语权重的设置算法中,第一种方法是由专家或者用户根据自己的经验与所掌握的领域知识人为的赋上权值。同时,运用统计的方法,也就是用文本的统计信息(如词频、词之间的同现频率等)来计算项的权重,采用的权重计算公式是基于向量空间模型的TF—IDF算法。对上述两个结果进行比对后,再对差异进行校正,从而提高权重分配的精度。其中步骤101中所述的校验方法为自动校验。其中,自动校验会根据识别数据中包含的逻辑关系,来校验结果是否正确。例如彩票的种类和玩法决定了投注方案中不可能出现ー些不符合玩法规则的数字,通过这样的逻辑校验,就可以进一歩提高自动校验判断的正确度,从而提高整体的识别率。利用光学字符识别技术对彩票信息进行自动和智能识别。步骤102,所述移动終端将该票据数据保存同步到服务器端。步骤103,所述服务器提取官方数据,并将官方数据与票据数据核对,判断是否与官方数据相一致。在这里步骤103针对彩票数据来说,实际上是所述服务器提取官方的开奖数据,并把开奖数据和彩票数据自动核对,以判断用户是否中奖以及中奖的等级、金額。后续还可以进行如下操作所述服务器把判断结果传送到移动终端,移动终端接收到判断结果后自动进行提醒。同时所述服务器还可根据预先设置的算法对彩票数据中的投注方案和收益情况进行统计,将统计结果发送给移动终端。这样用户就可以通过移动终端上提供的彩票投注方案建议进行投注。如图2所示,在上述实施例中步骤101中所述的识别过程具体为包括步骤1011,移动终端对拍摄后存储在其内的票据使用光学字符识别技术进行预处理。所谓预处理是为了去噪声,加强有用的信息,并对移动终端输入设备或其它因素所造成的退化现象进行复原。通常,预处理包括对原始图像的去噪(増大图像的分辨率)、彩 色图像转为灰度图像、倾斜校正、ニ值化;其中增大图像的分辨率,就是对图像进行插值运算,即通过图像中原有的像素点的值来确定所要増加的像素点的值;ニ值化为把灰度图像处理为ニ值(0,I)的过程,ニ值化的基本要求是(I)笔画中不能出现空白;(2) ニ值化后的笔画基本保持原来文字的特征。为了得到理想的ニ值图像,采用阈值分割技术,对物体与背景有较强对比的图像的分割特别有效,它计算简单而且总能用封闭、连通的边界定义不交叠的区域。考虑到速度和实际效果等因素,本技术实施例中采用了将整体闽值法Ostu算法和局部闽值法Bernsen算法相结合的改进的ニ值化方法。票据的文字图像经过ニ值化后得到的是ー个整体,其中包括了行与行之间,字与字之问的空白。倾斜校正为现有技术,是在用图像采集设备得到图像时,样张除了有可能放置颠倒,还有可能略微的倾斜,这种情况也会影响识别。倾斜可能是整个版面都存在问题,也可能是局部的文本块存在问题。当倾斜角度不大时,不影响识别过程,可以忽略不计。若倾斜角过大,就影响了识别的准确性。所以还需要进行自动倾斜纠正。步骤1012,对经过预处理后的数据进行版面分析。所谓版面分析是把文字与图像部分分开,它是对图像进行总体分析,识别出文本段落和图像等,只是识别出文本区域,为接下来的工作做准备。所述版面分析主要是为了区分文本域、图像域以及图表域等,这样作的目的就是为了分割出文本域。我们采取了根据实际统计的彩票上的特征,采取了象素考察法,如果在某ー个区域大面积的是前景图像,那么我们将视为非文本区域。步骤1013,对经过版面分析后的数据进行行分割。所谓行分割是将经过版面分析后的数据的文本图像切割成一行一行,主要要解决的问题就是行出现倾斜的情況。该步骤1013主要是本文档来自技高网...

【技术保护点】
一种应用于移动终端的票据自动识别系统,其特征在于,该系统包括:终端处理模块和服务处理模块;其中所述终端处理模块,设置在移动终端中,用于对拍摄后存储在该移动终端内的票据进行识别和校验,通过识别和校验产生符合要求的票据数据并保存,然后将该票据数据保存同步到服务处理模块;所述服务处理模块,设置在服务器中,用于提取官方数据,并将官方数据与票据数据核对,判断是否与官方数据相一致。

【技术特征摘要】

【专利技术属性】
技术研发人员:王湘云
申请(专利权)人:丰豪盈彩北京科技有限公司
类型:实用新型
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1