一种用于识别图片文字内容的方法技术

技术编号:27112293 阅读:31 留言:0更新日期:2021-01-25 19:09
本发明专利技术提供一种用于识别图片文字内容的方法,它包括以下步骤:拍摄或采集立体物品的原始图,所述立体物品具至少两个面存在文字;对所述原始图进行灰度化处理得到灰度图;确定所述两个面的交接线;计算交接线与Y轴角度差,旋转所述的灰度图,直至所述角度差为零;以所述的交接线为分界线,分割所述灰度图生成第一面和第二面得到两张图片;对第一面和第二面的图片分别向XY平面进行扭曲校正生成扭曲校正后的第一图和第二图;对所述第一图和第二图以交接线为左右重新组合,生成待识别的灰度整图;对所述灰度整图进行二值化、图像降噪、分割图片和文字识别,实现对立体物件两个面的文字同时进行识别。同时进行识别。同时进行识别。

【技术实现步骤摘要】
一种用于识别图片文字内容的方法


[0001]本专利技术涉及图片文字识别技术,尤其是能够识别立体物件上文字的方法。

技术介绍

[0002]OCR光学字符识别被广泛应用到图片文字的识别。 现有OCR文字识别方法依次经过以下步骤:灰度化,二值化,图像降噪,倾斜矫正,图片分割,文字识别六个步骤;现有的图片文字识别,包括OCR文字识别,对图片、拍摄和扫描的要求比较高,只能对纯平面上的文字进行识别,对立体物件上的文字往往无法识别或者识别率低。

技术实现思路

[0003]本专利技术的主要目的是克服现有技术的不足,提供一种用于识别图片文字内容的方法,它能对立体物件两个面的文字同时进行识别;其中,一种用于识别图片文字内容的方法,其特征在于:包括以下步骤:拍摄或采集立体物品的原始图,所述立体物品具至少两个面存在文字;对所述原始图进行灰度化处理得到灰度图;确定所述两个面的交接线;计算交接线与Y轴角度差,旋转所述的灰度图,直至所述角度差为零;以所述的交接线为分界线,分割所述灰度图生成第一面和第二面得到两张图片;对第一面和第二面的图片分别向XY平面进行扭曲校正生成扭曲校正后的第一图和第二图;对所述第一图和第二图以交接线为左右重新组合,生成待识别的灰度整图;对所述灰度整图进行二值化;对二值化后的图像降噪;对降噪处理后的图片分割;对分割后的图片,扫描图片上的文字提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。
附图说明
[0004]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图;图1为某优选实施方案中的灰度图示意图;图2为某优选实施方案中的方灰度图进行Y轴校正后的示意图;图3为某优选实施例中第一图示意图;图4为某优选实施例中第二图示意图;
图5为某优选实施例中灰度整图的示意图;图6为某优选实施例中核心步骤流程图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0005]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所 附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子;在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、
ꢀ“
所述”和“该”也旨在包 括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合;应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称 为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或
ꢀ“

……
时”或“响应于确定”;在一个实施例中,参考图1至6,本申请提供的用于识别图片文字内容的方法具体包括以下步骤:S01,拍摄或采集立体物品的原始图,所述立体物品具至少两个面存在文字拍摄或采集可以通过手机、相机、摄像机等拍摄或者实时采集,也可以是通过预录制的视频中采集具体图像帧来实现;S02,对所述原始图进行灰度化处理得到灰度图对原始图片进行灰度化处理,得到灰度化处理后的原始图片,简称灰度图。具体灰度化可以参考现有的OCR文字识别的灰度化处理;S03,确定所述两个面的交接线确定两个面的交接线。交接线的确定,可以通过逐行扫描计算灰度图沿X轴方向的灰度值或者亮度值,确定其中的灰度值或者亮度值的突变点,然后将所述每行的突变点连接,形成两个面的交接线。在一实施例中,为了降低计算量,可以沿Y轴选取三个不相邻的点,沿X轴方向扫描三行的灰度值,确定每行扫描的突变点,共得到三个突变点并连线作为两个面的交接线;S04,计算交接线与Y轴角度差,旋转所述的灰度图,直至所述角度差为零判断交接线是否与Y轴重合,如果不重合,则计算交接线与Y轴角度差,旋转所述的灰度图,直至角度差为零。在一实施例中,如果交接线为曲线的,可以通过计算曲线起始点连线两侧的最大曲变幅度,计算平均曲变幅度,将起始点连线平行移动至平均曲变幅度所在位置确定交接线,这样是交接线直线化。另外,对交接线允许一定阀值的曲变幅度,如果没有超过该阀值,直接忽略其曲变,直接校正为直线即可;S05,以所述的交接线为分界线,分割所述灰度图生成第一面和第二面得到两张图片以所述的交接线为分界线,分割所述灰度图,生成所述第一面和第二面两张子图片。分
割后的图可缓存形式存储在移动终端、或服务器等执行本方法的设备;S06,对第一面和第二面的图片分别向XY平面进行扭曲校正生成扭曲校正后的第一图和第二图对所述第一面和第二面的图片分别向XY平面进行扭曲校正得到扭曲校正后的第一图和第二图。具体扭曲校正方式可以有多种。其中一种确定第一图和第二图角点、通过位置探测它们的部分角点以及四条边的拟合曲线,其中保持位于交接线上的角点位置不变,计算与交接线相交接的两条拟合曲线与交接线的夹角,第一图和第二图的对应拟合曲线分别向负90度和正90度方向校正。校正时,由于扭曲形变,曲线距离有所变化。用积分的方法,求出四条边拟合曲线和扭曲图像上位置探测图形的边长。由于为线性形变,每条边的形变大小相同。根据校正图形的大小, 用积分方式求出扭曲图每条边长及伸缩系数,接下来找出与各点最近的拟合曲线上点的坐标,为扭曲图像的对应点,最后是分别一一映射,并使用灰度插值的方法即可得到该点的灰度。对校正图像中的每一点做这样的处理,就完成了图像的扭曲校正;S07,对所述第一图和第二图以交接线为左右重新组合,生成待识别的灰度整图S08,对所述灰度整图进行二值化;对所述灰度整图进行二值化:非黑即白对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩色图进行处理,使图片只有前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,形成整体二值化图。具体二值化过程根据OCR光学字符识别技术的常规手段进行S09,对二值化后的图像降噪;现实中的数字图像在数字化和传输过程中常受到成像设备与外部环境噪声干扰等影响,称为含噪图像或噪声图像。减少数字图像中噪声的过程称为图像降噪。当二值化之后的图片会显示很多小黑点 ,这些都是不需要的信息,会对后面进行图片的轮廓切割识别造成极大的影响,降噪是一个非常重要的阶段,降噪处理的好坏直接影响了图片识别的准确率。具体图像降本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于识别图片文字内容的方法,其特征在于:包括以下步骤:拍摄或采集立体物品的原始图,所述立体物品具至少两个面存在文字;对所述原始图进行灰度化处理得到灰度图;确定所述两个面的交接线;计算交接线与Y轴角度差,旋转所述的灰度图,直至所述角度差为零;以所述的交接线为分界线,分割所述灰度图生成第一面和第二面得到两张图片;对第一面和第二面的图片分别向XY平面进行扭曲校正生成扭曲校正后的第一图和第二图;对所述第一图和第二图以交接线为左右重新组合,生成待识别的灰度整图;对所述灰度整图进行二值化;对二值化后的图像降噪;对降噪处理后的图片分割;对分割后的图片,扫描图片上的文字提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。2.如权利要求1所述的用于识别图片文字内容的方法,其特征在于,所述确定所述两个面的交接线时,逐行扫描计算灰度图沿X轴方向的灰度值或者亮度值,确定其中的灰度值或者亮度值的突变点,然后将所述每行的突变点连接,形成两个面的交接线。3.如权利要求1所述的用于识别图片文字内容的方法,其特征在于,所述确定所述两个面的交接线时,沿Y轴选取三个不相邻的点,沿...

【专利技术属性】
技术研发人员:胡丙良何玉华
申请(专利权)人:全通金信控股广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1