文字图像高光去除、文字识别方法及装置制造方法及图纸

技术编号：30755786 阅读：17 留言：0更新日期：2021-11-10 12:09

本发明专利技术提供一种文字图像高光去除、文字识别方法及装置，所述文字图像高光去除方法包括：确定带有高光的文字图像；将带有高光的文字图像输入至高光去除模型，得到高光去除模型输出的高光去除后的文字图像。本发明专利技术通过高光去除模型提取带有高光的文字图像对应的高光区域掩膜特征，从而可以准确定位文字图像的高光区域，聚焦于文字图像中被高光区域遮挡的文字信息。然后，高光去除模型对带有高光的文字图像特征以及高光区域掩膜特征进行融合，得到融合特征，并对融合特征进行编码和解码后，从而可以准确恢复高光区域的文字信息，以得到高光去除后的文字图像。光去除后的文字图像。光去除后的文字图像。

全部详细技术资料下载

【技术实现步骤摘要】
文字图像高光去除、文字识别方法及装置

[0001]本专利技术涉及图像处理
，尤其涉及一种文字图像高光去除、文字识别方法及装置。

技术介绍

[0002]受周围环境和物体表面材质的影响，高光在自然图像中广泛存在。高光去除技术可以改善图像质量并有利于许多视觉任务，如立体匹配、文字识别、图像分割以及图像一致性等。
[0003]传统方法中对图像进行高光去除主要包括如下方法：(1)基于双色反射模型对图像进行高光去除，双色反射模型假设图像的亮度可以用漫反射和镜面反射的线性组合来表示。(2)基于最大色度
‑
强度空间中漫反射点和镜面反射点的分布，通过识别漫反射的最大色度，然后采用镜面反射
‑
漫反射机制分离反射分量。(3)观察到彩色图像中局部的漫反射最大色度平滑变化，通过采用双边滤波提升了色度估计的实时性和鲁棒性。(4)基于强度比的高光去除方法，通过在伪色度空间中将像素划分为不同的簇来分离高光。(5)为了利用彩色图像的全局信息进行镜面反射分离，基于双色反射模型的全局颜色线约束方法(6)利用面部图像的物理先验和统计先验共同估计光照环境，并从不同光照颜色的人脸中去除高光。(7)将图像中漫反射和镜面反射的估计重新定义为可以近似求解的具有稀疏约束的能量最小化。然而，这个过程是相对低效的。(8)基于一种凸优化框架，可以有效地去除自然图像的彩色和单色区域的暗高光。这些基于双色反射模型的方法在处理具有不同颜色和复杂纹理的图像时往往性能有限，并且由于需要预处理操作导致效率较低、实用性弱。(9)基于图像修

【技术保护点】

【技术特征摘要】
1.一种文字图像高光去除方法，其特征在于，包括：确定带有高光的文字图像；将所述带有高光的文字图像输入至高光去除模型，得到所述高光去除模型输出的高光去除后的文字图像；其中，所述高光去除模型是基于带有高光区域标记的样本文字图像，以及所述样本文字图像对应的高光去除样本文字图像训练得到的；所述高光去除模型用于提取所述带有高光的文字图像特征以及所述带有高光的文字图像对应的高光区域掩膜特征后，融合所述带有高光的文字图像特征以及所述高光区域掩膜特征得到融合特征，并对所述融合特征进行编码和解码后得到所述高光去除后的文字图像。2.根据权利要求1所述的文字图像高光去除方法，其特征在于，所述将所述带有高光的文字图像输入至高光去除模型，得到所述高光去除模型输出的高光去除后的文字图像，包括：将所述带有高光的文字图像输入至所述高光去除模型的特征提取层，得到所述特征提取层输出的所述带有高光的文字图像特征以及所述高光区域掩膜特征；将所述带有高光的文字图像特征以及所述高光区域掩膜特征输入至所述高光去除模型的特征融合层，由所述特征融合层对所述带有高光的文字图像特征以及所述高光区域掩膜特征进行融合，得到所述特征融合层输出的所述融合特征；将所述融合特征输入至所述高光去除模型的特征编解码层，由所述特征编解码层对所述融合特征进行编码和解码，得到所述特征编解码层输出的所述高光去除后的文字图像。3.根据权利要求2所述的文字图像高光去除方法，其特征在于，所述特征编解码层包括编码器，特征处理模块以及解码器；所述将所述融合特征输入至所述高光去除模型的特征编解码层，由所述特征编解码层对所述融合特征进行编码和解码，得到所述特征编解码层输出的所述高光去除后的文字图像，包括：将所述融合特征输入所述编码器，由所述编码器对所述融合特征进行编码，得到所述编码器输出的编码后的融合特征；将所述编码后的融合特征输入至所述特征处理模块，由所述特征处理模块对所述编码后的融合特征进行深度特征提取，得到所述特征处理模块输出的深度融合特征；将所述深度融合特征输入至所述解码器，由所述解码器对所述深度融合特征进行解码，得到所述解码器输出的所述高光去除后的文字图像。4.根据权利要求2所述的文字图像高光去除方法，其特征在于，所述特征提取层包括三个下采样层和三个上采样层，且各下采样层后面包含两个卷积层，以及各上采样层后面包含三个卷积层。5.根据权利要求1至4任一项所述的文字图像高光去除方法，其特征在于，所述高光去除模型的损失函数为：除模型的损失函数为：L
P
＝50
×
||I
out
‑
I
gt
||1+0.1
×
(||I
out
(i，j)
‑
I
gt
(i
‑
1，j)||1+||I
out
(i，j)
‑
I
gt
(i，j
‑
1)|
|1)；L
F
＝0.05
×
||Φ(I
out
)
‑
Φ(I
gt
)||1+120
×
||Ψ(I
out
)
‑
Ψ(...

【专利技术属性】
技术研发人员：全卫泽，侯诗玉，王超群，江敬恩，严冬明，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人