当前位置: 首页 > 专利查询>上海大学专利>正文

一种用于标识字符识别的图像预处理方法及系统技术方案

技术编号:39057406 阅读:18 留言:0更新日期:2023-10-12 19:50
本发明专利技术公开一种用于标识字符识别的图像预处理方法及系统。本发明专利技术在HSV空间对V分量进行图像增强,对S分量进行线性拉伸,使处理后的RGB图像减少了颜色失真,图像细节、纹理、边缘清晰,有效抑制了干扰噪声,改善了整个图像质量。量。量。

【技术实现步骤摘要】
一种用于标识字符识别的图像预处理方法及系统


[0001]本专利技术涉及计算机视觉
,特别是涉及一种用于标识字符识别的图像预处理方法及系统。

技术介绍

[0002]计算机视觉技术的快速发展促使现今获取字符信息的方式从人工收集迅速转变为机器自动识别与存储。同时,机器自动识别产品标识字符,可以有效提高工作效率并减少人力物力资源浪费,且应用广泛,例如机器自动识别钢板或金属表面上的字符,从经济、环境、安全、可持续发展等各个方面为社会带来效益。
[0003]随着数字成像技术的不断发展和数字成像设备成本的不断降低,数字图像已经成为一种常见的媒体形式。图像增强的目的是为了改善图像的视觉效果,将其转换为一种更适合于人或机器进行分析和处理的形式。但在许多现实生活和自然场景特别是钢板或金属表面情况下,由于拍摄角度、拍摄环境和设备等因素的影响,大量的图像往往由于光照、曝光等问题,导致图像中钢板或金属表面的字符受到过暗或者反光的影响而不清晰,图像的视觉感知较差,在一定程度上降低了图像质量及其应用价值。
[0004]同时,为了使字符识别模型精准检测和识别出图像文字信息,输入图像必须从计算机视觉方面达到一定的清晰程度。例如图像亮度要使得文本与背景可区分、图像信噪比较高或含噪区域对检测区域无较大影响、文本弯曲或倾斜程度与检测模型相匹配、图像文字信息无残缺等。
[0005]因此,这也就催生出这样一个技术问题:在进行字符识别之前尤其是识别钢板或金属表面上的字符,如何对图像进行预处理,衰减或消除干扰噪声,增强有用信息,提升图像质量,从而提高文字可检测性。

技术实现思路

[0006]本专利技术的目的是提供一种用于标识字符识别的图像预处理方法及系统,以实现对图像进行预处理,衰减或消除干扰噪声,增强有用信息,提升图像质量,从而提高文字可检测性。
[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]一种用于标识字符识别的图像预处理方法,所述方法包括如下步骤:
[0009]对用于标识字符识别的原始RGB图像进行色彩空间转换,获得HSV图像;
[0010]采用自适应多尺度Retinex算法对HSV图像的V分量进行图像增强,获得图像增强后的V分量;
[0011]对HSV图像的S分量进行线性拉伸,获得拉伸后的S分量;
[0012]将HSV图像的H分量、图像增强后的V分量和拉伸后的S分量进行合成,获得处理后的HSV图像;
[0013]对处理后的HSV图像进行色彩空间转换,获得处理后的RGB图像。
[0014]可选的,对处理后的HSV图像进行色彩空间转换,获得处理后的RGB图像,之后还包括:
[0015]采用自动白平衡算法对处理后的RGB图像进行校正。
[0016]可选的,采用自适应多尺度Retinex算法对HSV图像的V分量进行图像增强,获得图像增强后的V分量的公式为:
[0017][0018][0019]∫fF(x,y)dxdy=1;
[0020]其中,R
MSR
(x,y)为图像增强后的V分量在像素位置(x,y)的亮度值,w
k
为第k种高斯环绕尺度的权重,K为高斯环绕尺度的数量,S(x,y)为HSV图像在像素位置(x,y)的亮度值、F
k
(x,y)为中心环绕函数,c为高斯环绕尺度、λ为系数,x为像素位置的横向坐标,y为像素位置的纵向坐标。
[0021]可选的,对HSV图像的S分量进行线性拉伸,获得拉伸后的S分量的公式为:
[0022][0023]其中,I'(x,y)为拉伸后的S分量在像素位置(x,y)的饱和度值;I(x,y)为HSV图像在像素位置(x,y)的饱和度值,MAX和MIN分别为原始RGB图像映射像素值的灰度范围的最大值和最小值;I
min
和I
max
分别为HSV图像的最小饱和度值和最大饱和度值。
[0024]可选的,对HSV图像的S分量进行线性拉伸,获得拉伸后的S分量,之前还包括:
[0025]采用双边滤波算法对HSV图像的S分量进行滤波。
[0026]一种用于标识字符识别的图像预处理系统,所述系统应用于上述的方法,所述系统包括:
[0027]第一空间转换模块,用于对用于标识字符识别的原始RGB图像进行色彩空间转换,获得HSV图像;
[0028]图像增强模块,用于采用自适应多尺度Retinex算法对HSV图像的V分量进行图像增强,获得图像增强后的V分量;
[0029]线性拉伸模块,用于对HSV图像的S分量进行线性拉伸,获得拉伸后的S分量;
[0030]合成模块,用于将HSV图像的H分量、图像增强后的V分量和拉伸后的S分量进行合成,获得处理后的HSV图像;
[0031]第二空间转换模块,用于对处理后的HSV图像进行色彩空间转换,获得处理后的RGB图像。
[0032]一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
[0033]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现上述的方法。
[0034]根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:
[0035]本专利技术公开一种用于标识字符识别的图像预处理方法,所述方法包括如下步骤:对用于标识字符识别的原始RGB图像进行色彩空间转换,获得HSV图像;采用自适应多尺度
Retinex算法对HSV图像的V分量进行图像增强,获得图像增强后的V分量;对HSV图像的S分量进行线性拉伸,获得拉伸后的S分量;将HSV图像的H分量、图像增强后的V分量和拉伸后的S分量进行合成,获得处理后的HSV图像;对处理后的HSV图像进行色彩空间转换,获得处理后的RGB图像。本专利技术在HSV空间对V分量进行图像增强,对S分量进行线性拉伸,使处理后的RGB图像减少了颜色失真,图像细节、纹理、边缘清晰,有效抑制了干扰噪声,改善了整个图像质量。
附图说明
[0036]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0037]图1为本专利技术实施例提供的一种用于标识字符识别的图像预处理方法的流程图;
[0038]图2为本专利技术实施例提供的数据集制作背景示例图;
[0039]图3为本专利技术实施例提供的数据集图片示例图。
具体实施方式
[0040]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于标识字符识别的图像预处理方法,其特征在于,所述方法包括如下步骤:对用于标识字符识别的原始RGB图像进行色彩空间转换,获得HSV图像;采用自适应多尺度Retinex算法对HSV图像的V分量进行图像增强,获得图像增强后的V分量;对HSV图像的S分量进行线性拉伸,获得拉伸后的S分量;将HSV图像的H分量、图像增强后的V分量和拉伸后的S分量进行合成,获得处理后的HSV图像;对处理后的HSV图像进行色彩空间转换,获得处理后的RGB图像。2.根据权利要求1所述的用于标识字符识别的图像预处理方法,其特征在于,对处理后的HSV图像进行色彩空间转换,获得处理后的RGB图像,之后还包括:采用自动白平衡算法对处理后的RGB图像进行校正。3.根据权利要求1所述的用于标识字符识别的图像预处理方法,其特征在于,采用自适应多尺度Retinex算法对HSV图像的V分量进行图像增强,获得图像增强后的V分量的公式为:为:∫∫F(x,y)dxdy=1;其中,R
MSR
(x,y)为图像增强后的V分量在像素位置(x,y)的亮度值,w
k
为第k种高斯环绕尺度的权重,K为高斯环绕尺度的数量,S(x,y)为HSV图像在像素位置(x,y)的亮度值、F
k
(x,y)为中心环绕函数,c为高斯环绕尺度、λ为系数,x为像素位置的横向坐标,y为像素位置的纵向坐标。4.根据权利要求1所述的用于标识字符识别的图像预处理方法,其特征在于,对HSV图像的S分量进行线性拉伸,获得拉伸后的S分量的公式为:其中,I'(x,y)为拉伸后的S分量在像素...

【专利技术属性】
技术研发人员:陈博尧沈泽霖陆小锋樊一鸣
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1