字符识别方法、装置、设备及存储介质制造方法及图纸

技术编号:36604025 阅读:16 留言:0更新日期:2023-02-04 18:23
本发明专利技术提供一种字符识别方法、装置、设备及存储介质,包括:获取待识别图像;将待识别图像输入至字符识别模型,得到字符识别模型输出的字符识别结果;基于字符识别结果和预设置信度阈值,确定目标识别序列;其中,字符识别模型是基于路标样本图像和路标样本图像的字符标签,对初始模型进行迭代训练获得;初始模型是基于预先收集的场景字符图像和场景字符图像的图像标签进行预训练得到。本发明专利技术通过根据大规模的场景字符图像训练得到初始模型,再根据路标样本图像训练得到适用于路标场景下的字符识别模型,从而提高模型的鲁棒性,并且在模型识别过程中加入置信度阈值,以过滤掉置信度较小的预测结果,从而提高字符识别的准确性。从而提高字符识别的准确性。从而提高字符识别的准确性。

【技术实现步骤摘要】
字符识别方法、装置、设备及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种字符识别方法、装置、设备及存储介质。

技术介绍

[0002]OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机等)检查纸上打印的字符,通过检测暗、亮的模式,确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。目前OCR技术在车牌识别、文档检索、截图识别以及街景文字识别等方面都有着重要的应用价值,然而,针对在高速公路场景下对于限速路标的识别,由于图像采集设备在高速运动下,图像采集设备所采集到的图像可能存在暗光、模糊、雨雾等情况,导致限速路标上的字符呈现不规则形状,使得训练得到的模型的鲁棒性较低,进而导致通过模型识别字符的准确性较低。

技术实现思路

[0003]本专利技术提供一种字符识别方法、装置、设备及存储介质,旨在提高模型的鲁棒性以及模型识别字符的准确性。
[0004]本专利技术提供一种字符识别方法,包括:
[0005]获取待识别图像;
[0006]将所述待识别图像输入至字符识别模型,得到所述字符识别模型输出的字符识别结果;
[0007]基于所述字符识别结果以及预设置信度阈值,确定所述待识别图像对应的目标识别序列;
[0008]其中,所述字符识别模型是基于路标样本图像以及所述路标样本图像对应的字符标签,对初始模型进行迭代训练获得;
[0009]所述初始模型是基于预先收集的场景字符图像以及场景字符图像的图像标签进行预训练得到。
[0010]可选地,根据本专利技术提供的一种字符识别方法,所述字符识别模型还包括特征提取模块、编码模块和解码模块,所述编码模块和所述解码模块之间不共享模型参数;
[0011]所述编码模块包括第一长短期记忆网络;
[0012]所述解码模块包括第二长短期记忆网络和注意力网络;
[0013]所述第二长短期记忆网络包括隐藏层和输出层。
[0014]可选地,根据本专利技术提供的一种字符识别方法,所述将所述待识别图像输入至字符识别模型,得到所述字符识别模型输出的字符识别结果,包括:
[0015]将所述待识别图像输出至所述特征提取模块,得到所述特征提取模块输出的二维特征图;
[0016]将所述二维特征图输入至所述编码模块中的第一长短期记忆网络,得到所述第一
长短期记忆网络输出的编码特征;
[0017]将所述编码特征以及预先设置的开始标识输入至所述第二长短期记忆网络中的隐藏层,得到所述隐藏层输出的当前时间步长的隐藏状态信息;
[0018]将所述二维特征图和所述当前时间步的隐藏状态信息输入至所述注意力网络,得到所述注意力网络输出的特征加权参数;
[0019]将所述当前时间步的隐藏状态信息和所述特征加权参数输入至所述第二长短期记忆网络中的输出层,得到所述输出层输出的当前时间步长的输出结果;
[0020]将所述当前时间步长的输出结果以及隐藏状态信息输入至所述第二长短期记忆网络中的隐藏层,得到新的当前时间步的隐藏状态信息;
[0021]基于所述新的当前时间步的隐藏状态信息,返回执行所述将所述二维特征图和所述当前时间步的隐藏状态信息输入至所述注意力网络,得到所述注意力网络输出的特征加权参数的步骤,直至所述输出层的输出结果为预先设置的结束标识,得到所述字符识别结果。
[0022]可选地,根据本专利技术提供的一种字符识别方法,所述字符识别结果包括所述待识别图像中每个字符对应的字符预测向量,所述字符预测向量包括各个预测字符以及每一个预测字符对应的置信度;
[0023]所述基于所述字符识别结果以及预设置信度阈值,确定所述待识别图像对应的目标识别序列,包括:
[0024]在每一个所述字符预测向量中,选取置信度最大的预测字符作为第一目标字符;
[0025]在各所述第一目标字符中,筛选得到置信度不小于所述预设置信度阈值的各个第二目标字符;
[0026]基于各所述第二目标字符,形成所述目标识别序列。
[0027]可选地,根据本专利技术提供的一种字符识别方法,所述字符识别模型是基于如下步骤训练获得:
[0028]获取若干张场景字符图像以及若干张路标样本图像;
[0029]基于各所述场景字符图像以及各自对应的图像标签,对待训练初始模型进行预训练,得到初始模型;
[0030]基于各所述路标样本图像以及各自对应的字符标签,对所述初始模型进行迭代训练,得到所述字符识别模型。
[0031]可选地,根据本专利技术提供的一种字符识别方法,所述基于各所述路标样本图像和各自对应的字符标签,对所述初始模型进行迭代训练,得到所述字符识别模型,包括:
[0032]针对任意一个路标样本图像,基于所述路标样本图像的字符标签、预先设置的开始标识以及结束标识,形成标签序列;
[0033]对所述标签序列进行独热编码,得到字符编码结果;
[0034]将所述路标样本图像和所述字符编码结果输入至所述初始模型,得到所述初始模型输出的预测结果;
[0035]基于所述预测结果和所述字符标签,计算得到模型损失值;
[0036]基于每一次迭代得到的模型损失值,对所述初始模型进行参数更新,得到所述字符识别模型。
[0037]可选地,根据本专利技术提供的一种字符识别方法,所述将所述路标样本图像和所述字符编码结果输入至所述初始模型,得到所述初始模型输出的预测结果,包括:
[0038]将所述路标样本图像输入至特征提取模块,得到所述特征提取模块输出的训练特征图;
[0039]将所述训练特征图输入至所述第一长短期记忆网络,得到所述第一长短期记忆网络输出的训练编码特征;
[0040]将所述训练编码特征和所述字符编码结果输入至所述第二长短期记忆网络,得到所述第二长短期记忆网络输出的预测结果。
[0041]本专利技术还提供一种字符识别装置,包括:
[0042]获取模块,用于获取待识别图像;
[0043]识别模块,用于将所述待识别图像输入至字符识别模型,得到所述字符识别模型输出的字符识别结果;
[0044]确定模块,用于基于所述字符识别结果以及预设置信度阈值,确定所述待识别图像对应的目标识别序列;
[0045]其中,所述字符识别模型是基于路标样本图像以及所述路标样本图像对应的字符标签,对初始模型进行迭代训练获得;
[0046]所述初始模型是基于预先收集的场景字符图像以及场景字符图像的图像标签进行预训练得到。
[0047]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述字符识别方法。
[0048]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述字符识别方法。
[0049]本专利技术还提供一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:获取待识别图像;将所述待识别图像输入至字符识别模型,得到所述字符识别模型输出的字符识别结果;基于所述字符识别结果以及预设置信度阈值,确定所述待识别图像对应的目标识别序列;其中,所述字符识别模型是基于路标样本图像以及所述路标样本图像对应的字符标签,对初始模型进行迭代训练获得;所述初始模型是基于预先收集的场景字符图像以及场景字符图像的图像标签进行预训练得到。2.根据权利要求1所述的字符识别方法,其特征在于,所述字符识别模型还包括特征提取模块、编码模块和解码模块,所述编码模块和所述解码模块之间不共享模型参数;所述编码模块包括第一长短期记忆网络;所述解码模块包括第二长短期记忆网络和注意力网络;所述第二长短期记忆网络包括隐藏层和输出层。3.根据权利要求2所述的字符识别方法,其特征在于,所述将所述待识别图像输入至字符识别模型,得到所述字符识别模型输出的字符识别结果,包括:将所述待识别图像输出至所述特征提取模块,得到所述特征提取模块输出的二维特征图;将所述二维特征图输入至所述编码模块中的第一长短期记忆网络,得到所述第一长短期记忆网络输出的编码特征;将所述编码特征以及预先设置的开始标识输入至所述第二长短期记忆网络中的隐藏层,得到所述隐藏层输出的当前时间步长的隐藏状态信息;将所述二维特征图和所述当前时间步的隐藏状态信息输入至所述注意力网络,得到所述注意力网络输出的特征加权参数;将所述当前时间步的隐藏状态信息和所述特征加权参数输入至所述第二长短期记忆网络中的输出层,得到所述输出层输出的当前时间步长的输出结果;将所述当前时间步长的输出结果以及隐藏状态信息输入至所述第二长短期记忆网络中的隐藏层,得到新的当前时间步的隐藏状态信息;基于所述新的当前时间步的隐藏状态信息,返回执行所述将所述二维特征图和所述当前时间步的隐藏状态信息输入至所述注意力网络,得到所述注意力网络输出的特征加权参数的步骤,直至所述输出层的输出结果为预先设置的结束标识,得到所述字符识别结果。4.根据权利要求1所述的字符识别方法,其特征在于,所述字符识别结果包括所述待识别图像中每个字符对应的字符预测向量,所述字符预测向量包括各个预测字符以及每一个预测字符对应的置信度;所述基于所述字符识别结果以及预设置信度阈值,确定所述待识别图像对应的目标识别序列,包括:在每一个所述字符预测向量中,选取置信度最大的预测字符作为第一目标字符;在各所述第一目标字符中,筛选得到置信度不小于所述预设置信度阈值的各个第二目

【专利技术属性】
技术研发人员:咸晓雨田寅唐海川龚明沈晓宇邱月
申请(专利权)人:中车工业研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1