字符识别方法、装置、设备及存储介质制造方法及图纸

技术编号：36604025 阅读：16 留言：0更新日期：2023-02-04 18:23

本发明专利技术提供一种字符识别方法、装置、设备及存储介质，包括：获取待识别图像；将待识别图像输入至字符识别模型，得到字符识别模型输出的字符识别结果；基于字符识别结果和预设置信度阈值，确定目标识别序列；其中，字符识别模型是基于路标样本图像和路标样本图像的字符标签，对初始模型进行迭代训练获得；初始模型是基于预先收集的场景字符图像和场景字符图像的图像标签进行预训练得到。本发明专利技术通过根据大规模的场景字符图像训练得到初始模型，再根据路标样本图像训练得到适用于路标场景下的字符识别模型，从而提高模型的鲁棒性，并且在模型识别过程中加入置信度阈值，以过滤掉置信度较小的预测结果，从而提高字符识别的准确性。从而提高字符识别的准确性。从而提高字符识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
字符识别方法、装置、设备及存储介质

[0001]本专利技术涉及图像处理
，尤其涉及一种字符识别方法、装置、设备及存储介质。

技术介绍

[0002]OCR(Optical Character Recognition，光学字符识别)是指电子设备(例如扫描仪或数码相机等)检查纸上打印的字符，通过检测暗、亮的模式，确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。目前OCR技术在车牌识别、文档检索、截图识别以及街景文字识别等方面都有着重要的应用价值，然而，针对在高速公路场景下对于限速路标的识别，由于图像采集设备在高速运动下，图像采集设备所采集到的图像可能存在暗光、模糊、雨雾等情况，导致限速路标上的字符呈现不规则形状，使得训练得到的模型的鲁棒性较低，进而导致通过模型识别字符的准确性较低。

技术实现思路

[0003]本专利技术提供一种字符识别方法、装置、设备及存储介质，旨在提高模型的鲁棒性以及模型识别字符的准确性。
[0004]本专利技术提供一种字符识别方法，包括：
[0005]获取待识别图像；
[0006]将所述待识别图像输入至字符识别模型，得到所述字符识别模型输出的字符识别结果；
[0007]基于所述字符识别结果以及预设置信度阈值，确定所述待识别图像对应的目标识别序列；
[0008]其中，所述字符识别模型是基于路标样本图像以及所述路标样本图像对应的字符标签，对初始模型进行迭代训练获得；
[0009]所述初始模型是基于预先收集的场景字符图像以及场景...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法，其特征在于，包括：获取待识别图像；将所述待识别图像输入至字符识别模型，得到所述字符识别模型输出的字符识别结果；基于所述字符识别结果以及预设置信度阈值，确定所述待识别图像对应的目标识别序列；其中，所述字符识别模型是基于路标样本图像以及所述路标样本图像对应的字符标签，对初始模型进行迭代训练获得；所述初始模型是基于预先收集的场景字符图像以及场景字符图像的图像标签进行预训练得到。2.根据权利要求1所述的字符识别方法，其特征在于，所述字符识别模型还包括特征提取模块、编码模块和解码模块，所述编码模块和所述解码模块之间不共享模型参数；所述编码模块包括第一长短期记忆网络；所述解码模块包括第二长短期记忆网络和注意力网络；所述第二长短期记忆网络包括隐藏层和输出层。3.根据权利要求2所述的字符识别方法，其特征在于，所述将所述待识别图像输入至字符识别模型，得到所述字符识别模型输出的字符识别结果，包括：将所述待识别图像输出至所述特征提取模块，得到所述特征提取模块输出的二维特征图；将所述二维特征图输入至所述编码模块中的第一长短期记忆网络，得到所述第一长短期记忆网络输出的编码特征；将所述编码特征以及预先设置的开始标识输入至所述第二长短期记忆网络中的隐藏层，得到所述隐藏层输出的当前时间步长的隐藏状态信息；将所述二维特征图和所述当前时间步的隐藏状态信息输入至所述注意力网络，得到所述注意力网络输出的特征加权参数；将所述当前时间步的隐藏状态信息和所述特征加权参数输入至所述第二长短期记忆网络中的输出层，得到所述输出层输出的当前时间步长的输出结果；将所述当前时间步长的输出结果以及隐藏状态信息输入至所述第二长短期记忆网络中的隐藏层，得到新的当前时间步的隐藏状态信息；基于所述新的当前时间步的隐藏状态信息，返回执行所述将所述二维特征图和所述当前时间步的隐藏状态信息输入至所述注意力网络，得到所述注意力网络输出的特征加权参数的步骤，直至所述输出层的输出结果为预先设置的结束标识，得到所述字符识别结果。4.根据权利要求1所述的字符识别方法，其特征在于，所述字符识别结果包括所述待识别图像中每个字符对应的字符预测向量，所述字符预测向量包括各个预测字符以及每一个预测字符对应的置信度；所述基于所述字符识别结果以及预设置信度阈值，确定所述待识别图像对应的目标识别序列，包括：在每一个所述字符预测向量中，选取置信度最大的预测字符作为第一目标字符；在各所述第一目标字符中，筛选得到置信度不小于所述预设置信度阈值的各个第二目

【专利技术属性】
技术研发人员：咸晓雨，田寅，唐海川，龚明，沈晓宇，邱月，
申请(专利权)人：中车工业研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人