文字识别模型的训练方法、装置、设备及可读存储介质制造方法及图纸

技术编号：30786287 阅读：20 留言：0更新日期：2021-11-16 07:48

本发明专利技术提供了一种文字识别模型的训练方法、装置、设备及可读存储介质，包括：调用合成数据集对初始学习模型进行训练,以获得中间模型；调用真实数据集对所述中间模型进行训练,以获得文字识别模型,其中,所述文字识别模型用于接收图像采集装置采集到的图像,并根据所述图像生成文字对象的识别信息及其对应的位置信息。解决了现有技术无法识别不规则分布或者弯曲的文字。者弯曲的文字。者弯曲的文字。

全部详细技术资料下载

【技术实现步骤摘要】
文字识别模型的训练方法、装置、设备及可读存储介质

[0001]本专利技术涉及人工智能领域，特别涉及一种文字识别模型的训练方法、装置、设备及可读存储介质。

技术介绍

[0002]在现有技术中，已经有开放场景下的文字识别方法，但由于其识别的对象都较为规整，往往只需少数的例如旋转角度的矫正方法就可以成功对其识别。而开放场景下存在的大量的弯曲、不规则的文字排布，现有技术对于此类的识别效果是很差的，甚至不可用。同时，诸如仪表盘上面的文字也呈现出间距很大，要识别它们即意味着要对单个字符进行识别，而这也是现在的方法所不具备的。从另一方面来说，现如今的文字识别方法由于将文字识别这项任务划分为识别以及检测两个步骤，使得识别的效果也因此有所下降。而在深度学习的文字识别中这也意味着方法实现的繁琐性。
[0003]有鉴于此，提出本申请。

技术实现思路

[0004]本专利技术公开了一种文字识别模型的训练方法、装置、设备及可读存储介质，旨在解决现有技术无法识别不规则分布或者弯曲的文字。
[0005]本专利技术第一实施例提供了一种文字识别模型的训练方法，包括：
[0006]调用合成数据集对初始学习模型进行训练,以获得中间模型；
[0007]调用真实数据集对所述中间模型进行训练,以获得文字识别模型,其中,所述文字识别模型用于接收图像采集装置采集到的图像,并根据所述图像生成文字对象的识别信息及其对应的位置信息。
[0008]优选地，所述调用合成数据集对初始学习模型进行训练具体为：
[00...

【技术保护点】

【技术特征摘要】
1.一种文字识别模型的训练方法，其特征在于，包括：调用合成数据集对初始学习模型进行训练,以获得中间模型；调用真实数据集对所述中间模型进行训练,以获得文字识别模型,其中,所述文字识别模型用于接收图像采集装置采集到的图像,并根据所述图像生成文字对象的识别信息及其对应的位置信息。2.根据权利要求1所述的一种文字识别模型的训练方法，其特征在于，所述调用合成数据集对初始学习模型进行训练具体为：将所述合成数据集中的图像信息输入到所述初始学习模型中，生成文字边框，并在所述文字边框内填入高斯图；将填有高斯图的文字边框以one
‑
hot的形式展开成多个通道，以识别不同的字符。3.根据权利要求1所述的一种文字识别模型的训练方法，其特征在于，所述调用真实数据集对所述中间模型进行训练具体为：将所述真实数据集的图像信息输入至所述中间模型；接收所述中间模型的输出结果,调用分水岭算法对所述输出结果进行运算，生成字符标签；判断所述字符标签的高分区域的面积以及分割出的字符数量是否满足预设条件；若是,保留所述字符标签；若否,删除所述字符标签。4.根据权利要求1所述的一种文字识别模型的训练方法，其特征在于，所述文字识别模型用于接收图像采集装置采集到的图像,并根据所述图像生成文字对象的识别信息及其对应的位置信息具体为：将所述图像采集装置采集到的图像输入至所述文字识别模型中，并生成多张类别图像；获取多张所述类别图像中每一区域位置值最大的第一图像；对每一所述第一图像进行识别，生成文字对象的识别信息及其对应的位置信息。5.一种文字识别模型的训练方法装置，其特征在于，包括：第一训练单元,用于调用合成数据集对初始学习模型进行训练,以获得中间模型；第二训练单元,用于调用真实数据集对所述...

【专利技术属性】
技术研发人员：杜吉祥，郑剑锋，张洪博，翟传敏，
申请(专利权)人：华侨大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人