【技术实现步骤摘要】
模型训练方法、字符识别方法、装置、设备及存储介质
本申请涉及信息处理
,更具体地说,涉及一种模型训练方法、字符识别方法、装置、设备及存储介质。
技术介绍
光学字符识别(OpticalCharacterRecognition,简称OCR)是计算机视觉的子方向,目标是从图像数据中识别出文字,并保存为计算机文本数据。目前,较常用的字符识别方法是利用神经网络模型进行字符识别,然而,目前的神经网络模型在进行字符识别时易出现将偏僻字被识别成常见字的情况。
技术实现思路
有鉴于此,本申请提供了一种模型训练方法、字符识别方法、装置、设备及存储介质,以克服现有技术容易将偏僻字识别成常见字的问题。为了实现上述目的,现提出的方案如下:一种字符识别模型训练方法,包括:利用目标字符识别模型对目标图像样本进行处理,得到所述目标图像样本对应的第一字符识别结果;所述目标字符识别模型至少包括由初始字符识别模型的部分或全部网络层组成的迁移网络层,所述初始字符识别模型通过初始图像样本集训练得到,所述目标图像样本为所述初始图像样本集中字符出现频率满足预设均匀分布条件的图像样本;根据由第一目标和第二目标构成的训练目标对所述目标字符识别模型的参数进行更新;其中,所述第一目标为所述第一字符识别结果趋近于所述目标图像样本对应的字符标签,所述第二目标为所述部分或全部网络层在所述初始字符识别模型处理所述目标图像样本时输出的特征图对所述初始字符识别模型输出的第二字符识别结果的影响越大,所述迁移网络层输出的 ...
【技术保护点】
1.一种字符识别模型训练方法,其特征在于,包括:/n利用目标字符识别模型对目标图像样本进行处理,得到所述目标图像样本对应的第一字符识别结果;所述目标字符识别模型至少包括由初始字符识别模型的部分或全部网络层组成的迁移网络层,所述初始字符识别模型通过初始图像样本集训练得到,所述目标图像样本为所述初始图像样本集中字符出现频率满足预设均匀分布条件的图像样本;/n根据由第一目标和第二目标构成的训练目标对所述目标字符识别模型的参数进行更新;其中,所述第一目标为所述第一字符识别结果趋近于所述目标图像样本对应的字符标签,所述第二目标为所述部分或全部网络层在所述初始字符识别模型处理所述目标图像样本时输出的特征图对所述初始字符识别模型输出的第二字符识别结果的影响越大,所述迁移网络层输出的特征图越趋近于所述部分或全部网络层输出的特征图。/n
【技术特征摘要】
1.一种字符识别模型训练方法,其特征在于,包括:
利用目标字符识别模型对目标图像样本进行处理,得到所述目标图像样本对应的第一字符识别结果;所述目标字符识别模型至少包括由初始字符识别模型的部分或全部网络层组成的迁移网络层,所述初始字符识别模型通过初始图像样本集训练得到,所述目标图像样本为所述初始图像样本集中字符出现频率满足预设均匀分布条件的图像样本;
根据由第一目标和第二目标构成的训练目标对所述目标字符识别模型的参数进行更新;其中,所述第一目标为所述第一字符识别结果趋近于所述目标图像样本对应的字符标签,所述第二目标为所述部分或全部网络层在所述初始字符识别模型处理所述目标图像样本时输出的特征图对所述初始字符识别模型输出的第二字符识别结果的影响越大,所述迁移网络层输出的特征图越趋近于所述部分或全部网络层输出的特征图。
2.根据权利要求1所述的方法,其特征在于,所述根据由第一目标和第二目标构成的训练目标对所述目标字符识别模型的参数进行更新,包括:
根据所述目标字符识别模型的正则化损失函数,对所述目标字符识别模型的参数进行更新,以实现所述第一目标和所述第二目标;
其中,所述正则化损失函数的误差部分为所述第一字符识别结果与所述目标图像样本对应的字符标签的差异,所述正则化损失函数的正则化部分至少包括由所述迁移网络层与所述部分或全部网络层中的对应特征图的差异的加权和构成的第一正则项;其中,每一个差异的权重表征所述部分或全部网络层输出的与所述目标图像样本对应的特征图对所述第二字符识别结果的影响程度。
3.根据权利要求2所述的方法,其特征在于,所述第一正则项通过如下方式获得:
对应所述迁移网络层中的至少部分迁移网络层中的每一个特征提取模块,计算该特征提取模块基于所述目标图像样本输出的特征图与目标网络层中与该特征提取模块对应的目标特征提取模块基于所述目标图像样本输出的特征图之间的距离;其中,所述目标网络层为所述初始字符识别模型中与所述至少部分迁移网络层对应的网络层;
计算该特征提取模块基于所述目标图像样本输出的特征图与所述目标特征提取模块基于所述目标图像样本输出的特征图的距离的权重;
利用各个距离的权重,将所述至少部分迁移网络层中的各个特征提取模块基于所述目标图像样本输出的特征图对应的距离加权求和,得到与所述目标图像样本对应的第一正则项。
4.根据权利要求3所述的方法,其特征在于,所述计算该特征提取模块输出的特征图与所述目标特征提取模块输出的特征图的距离的权重,包括:
获取所述第二字符识别结果与所述目标图像样本对应的字符标签的第一差异;
获取所述目标特征提取模块的参数的取值为目标取值时,所述初始字符识别模型对所述目标图像样本进行处理得到的字符识别结果与所述目标图像样本对应的字符标签的第二差异;所述目标取值使得所述第二差异大于所述第一差异;
对所述第一差异和所述第二差异的差值进行标准化处理,得到该特征提取模块输出的特征图与所述目标特征提取模块输出的特征图的距离的权重。
5.根据权利要求2所述的方法,其特征在于,所述目标字符识别模型由所述迁移网络层和新增网络层构成;其中,所述新增网络层的参数随...
【专利技术属性】
技术研发人员:韩涛,李梓赫,谭昶,
申请(专利权)人:讯飞智元信息科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。