【技术实现步骤摘要】
OCR模型训练方法、系统及装置
[0001]本专利技术涉及计算机视觉当中的图像处理
,尤其涉及一种OCR模型训练方法、系统及装置。
技术介绍
[0002]OCR(Optical Character Recognition,光学字符识别)作为计算机视觉中一个重要的应用领域,由于其有监督网络的特性,需要大量的训练数据支撑才能取得良好的效果。因此,在OCR领域中,包含各种场景的庞大数据训练集对于得到一个良好的OCR模型至关重要。
[0003]但是现有技术中的OCR模型,其训练集通常是预设好的,在进行调试完毕后就开始进入实际应用,伴随着实际使用,往往真实的识别准确度会低于训练出后的预期准确度,降低用户体验。举例而言,在银行体系中,某些票据给开发模型的仅有有限数量的图像样本,此时制作出的训练集的数量较少,因此训练出的OCR模型的识别准确度相应地就不是很高。
技术实现思路
[0004]为了克服上述缺陷,提出了本专利技术,以解决或至少部分地解决目前较少数量的图像样本无法使OCR模型的准确度达到较高水平的技术问题。本专利技术提供了一种OCR模型训练方法、系统及装置。
[0005]第一方面、提供一种OCR模型训练方法,包括:
[0006]对初始图像样本进行标注以生成第一OCR训练集;
[0007]在待训练的OCR模型中输入所述第一OCR训练集进行训练,得到第一OCR模型;
[0008]将实物图像样本输入所述第一OCR模型进行识别;
[0009]根据识别结果获得所述实 ...
【技术保护点】
【技术特征摘要】
1.一种OCR模型训练方法,其特征在于,包括:对初始图像样本进行标注以生成第一OCR训练集;在待训练的OCR模型中输入所述第一OCR训练集进行训练,得到第一OCR模型;将实物图像样本输入所述第一OCR模型进行识别;根据识别结果获得所述实物图像样本中被识别错误的图像样本;将被识别错误的图像样本作为第一补充OCR训练集,并为第一OCR训练集与第一补充OCR训练集分别分配权重,合并后生成第一优化OCR训练集;在所述第一OCR模型中输入所述第一优化OCR训练集进行训练,以得到第一优化OCR模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:循环执行如下操作,直至第n优化OCR模型满足需求:继续将实物图像样本输入第n-1优化OCR模型进行识别;根据识别结果获得所述实物图像样本中被识别错误的图像样本;将被识别错误的图像样本作为第n补充OCR训练集,并为所述第n-1优化OCR训练集与所述第n补充OCR训练集分别分配权重,合并后生成第n优化OCR训练集;在第n-1优化OCR模型中输入所述第n优化OCR训练集进行训练,以得到第n优化OCR模型;其中,n为大于等于2的自然数。3.根据权利要求2所述的方法,其特征在于,“继续将实物图像样本输入第n-1优化OCR模型进行识别”的步骤之前,所述方法还包括:去除已分配的第n-1优化OCR训练集中第n-1OCR训练集和第n-1补充OCR训练集的权重。4.根据权利要求1所述的方法,其特征在于,将被识别错误的图像样本作为第一补充OCR训练集,并为第一OCR训练集与第一补充OCR训练集分别分配权重,具体包括:对被识别错误的图像样本的数量进行统计;当统计的数量值达到预设值时,将被识别错误的图像样本作为第一补充OCR训练集;根据被识别错误的图像样本的数量与第一OCR训练集的图像样本的总数为第一OCR训练集与第一补充OCR训练集分别分配权重。5.根据权利要求1所述的方法,其特征在于,将被识别错误的图像样本作为第一补充OCR训练集,并为第一OCR训练集与第一补充OCR训练集分别分配权重,具体包括:对被识别错误的图像样本对应的被识别错误的字符的数量进行统计;当统计的数量值达到预设值时,将被识别错误的图像样本作为第一补充OCR训练集;根据被识别错误的字符的数量与第一OCR训练集的图像样本对应的字符的总数,为第一OCR训练集与第一补充OCR训练集分别分配权重。6.根据权利要求1所述的方法,其特征在于,将被识别错误的图像样本作为第一补充OCR训练集,并为第一OCR训练集与第一补充OCR训练集分别分配权重,具体包括:对被识别错误的图像样本的数量进行统计;当统计的数量值达到预设值时,将被识别错误的图像样本作为第一补充OCR训练集;对每张被识别错误的图像样本进行质量度的评分和识别结果置信度的评分;根据所有被识别错误的图像样本的质量度与识别结果置信度的总评分为第一OCR训练
集与第一补充OCR训练集分别分配权重;其中,所述质量度为基于图像模糊程度、反光程度、阴影程度、分辨率所得出的质量评分,所述质量度用于体现所述被识别错误的图像样本的易识别程度;其中,所述识别结果置信度为基于生僻字数量、相似字数量、印章数量所得出的置信度评分,所述识别结果置信度用于体现所述被识别错误的图像样本的可靠程度。7.一种OCR模型训练系统,其特征在于,包括:第一OCR训练集生成模块,用于对初始图像样本进行标注以生成第一OCR训练集;第一OCR模型生成模块,用于在待训练的OCR模型中输入所述第一OCR训练集进行训练,得到第一OCR模型;...
【专利技术属性】
技术研发人员:司法,
申请(专利权)人:北京云从科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。