深度学习模型训练方法、文本行检测方法、装置及设备制造方法及图纸

技术编号：39191439 阅读：12 留言：0更新日期：2023-10-27 08:38

本公开公开了一种深度学习模型训练方法、文本行检测方法、装置及设备，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习技术领域，可用于光学字符识别场景。具体实现方案为：利用目标检测模型分别处理无标签样本集包括的多个第一样本图像，得到多个第一样本图像各自的伪标签，其中，目标检测模型包括利用标注样本集训练得到。利用多个第一样本图像、多个第一样本图像各自的伪标签和标注样本集训练初始模型，得到深度学习模型。得到深度学习模型。得到深度学习模型。

全部详细技术资料下载

【技术实现步骤摘要】
深度学习模型训练方法、文本行检测方法、装置及设备

[0001]本公开涉及人工智能
，尤其涉及计算机视觉和深度学习
，可用于光学字符识别场景。更具体地，公开了一种深度学习模型训练方法、文本行检测方法、装置、电子设备以及存储介质。

技术介绍

[0002]文本行检测是计算机视觉领域的一个重要任务，它是指在图像中定位和识别文本行的过程。在许多应用场景中，如车牌识别、身份证识别、票据识别等，文本行检测技术的准确性直接影响到整个系统的性能表现。

技术实现思路

[0003]本公开提供了一种深度学习模型训练方法、文本行检测方法、装置、电子设备以及存储介质。
[0004]根据本公开的一方面，提供了一种深度学习模型训练方法，包括：利用目标检测模型分别处理无标签样本集包括的多个第一样本图像，得到上述多个第一样本图像各自的伪标签，其中，上述目标检测模型包括利用标注样本集训练得到；以及利用上述多个第一样本图像、上述多个第一样本图像各自的伪标签和上述标注样本集训练初始模型，得到深度学习模型。。
[0005]根据本公开的另一方面，提供了一种文本行检测方法，包括：利用深度学习模型处理待检测图像，得到文本行检测结果；其中，上述深度学习模型包括利用如上所述的深度学习模型训练方法训练得到。
[0006]根据本公开的另一方面，提供了一种深度学习模型训练装置，包括：第一处理模块，用于利用目标检测模型分别处理无标签样本集包括的多个第一样本图像，得到上述多个第一样本图像各自的伪标签，其中，上述目标检测模型包括利...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型训练方法，包括：利用目标检测模型分别处理无标签样本集包括的多个第一样本图像，得到所述多个第一样本图像各自的伪标签，其中，所述目标检测模型包括利用标注样本集训练得到；以及利用所述多个第一样本图像、所述多个第一样本图像各自的伪标签和所述标注样本集训练初始模型，得到深度学习模型。2.根据权利要求1所述的方法，其中，所述利用目标检测模型分别处理无标签样本集包括的多个第一样本图像，得到所述多个第一样本图像各自的伪标签，包括：对于每个所述第一样本图像，对所述第一样本图像进行数据增强处理，得到多个第二样本图像；利用所述目标检测模型分别处理所述多个第二样本图像，得到多个第一标签；以及基于所述多个第一标签，确定所述第一样本图像的伪标签。3.根据权利要求2所述的方法，其中，所述基于所述多个第一标签，确定所述第一样本图像的伪标签，包括：基于所述多个第一标签各自包括的置信度数值，对所述多个第一标签进行非极大值抑制处理，得到所述第一样本图像的伪标签。4.根据权利要求2所述的方法，其中，所述对所述第一样本图像进行数据增强处理，得到多个第二样本图像，包括：对所述第一样本图像进行多次尺度变换，得到所述多个第二样本图像，其中，所述多次尺度变换各自所使用的缩放比例不同。5.根据权利要求4所述的方法，其中，所述基于所述多个第一标签，确定所述第一样本图像的伪标签，包括：对于每个所述第二样本图像，基于生成所述第二样本图像时所使用的缩放比例，对所述第一标签进行还原处理，得到第二标签；以及基于所述多个第二标签，确定所述第一样本图像的伪标签。6.根据权利要求1所述的方法，其中，所述利用所述多个第一样本图像、所述多个第一样本图像各自的伪标签和所述标注样本集训练初始模型，得到深度学习模型，包括：对所述多个第一样本图像和所述标注样本集进行采样处理，得到训练样本集；以及利用所述训练样本集训练所述初始模型，得到所述深度学习模型。7.根据权利要求1所述的方法，还包括：基于所述多个第一样本图像各自的伪标签包括的置信度数值，确定第一置信度阈值；以及基于所述第一置信度阈值，将所述多个第一样本图像划分为第一样本子集和第二样本子集，其中，与所述第一样本子集包括的第一样本图像相关的置信度数值大于或等于所述第一置信度阈值，与所述第二样本子集包括的第一样本图像相关的置信度数值小于所述第一置信度阈值。8.根据权利要求7所述的方法，其中，所述初始模型包括回归分支网络和分类分支网络；其中，所述利用所述多个第一样本图像、所述多个第一样本图像各自的伪标签和所述标注样本集训练初始模型，得到深度学习模型，包括：
利用所述第一样本子集和所述标注样本集训练所述回归分支网络；以及利用所述第一样本子集、所述第二样本子集和所述标注样本集训练所述分类分支网络。9.根据权利要求7所述的方法，其中，所述基于所述多个第一样本图像各自的伪标签包括的置信度数值，确定第一置信度阈值，包括：基于所述多个第一样本图像各自的伪标签包括的置信度数值，确定与多个预设置信区间各自相关的比例数据；以及基于与多个预设置信区间各自相关的比例数据和所述多个预设置信区间各自的区间端点值，确定所述第一置信度阈值。10.根据权利要求1所述的方法，其中，所述标注样本集包括多个标注样本图像和所述多个标注样本图像各自的标签；其中，所述利用所述多个第一样本图像、所述多个第一样本图像各自的伪标签和所述标注样本集训练初始模型，得到深度学习模型，包括：基于所述多个第一样本图像、所述多个第一样本图像各自的伪标签和所述多个第一样本图像各自的掩膜值，得到第一损失；基于损失多个标注样本图像和所述多个标注样本图像各自的标签，得到第二损失；以及利用所述第一损失和损失第二损失，调整所述初始模型的模型参数，以最终训练得到所述深度学习模型。11.根据权利要求10所述的方法，还包括：基于所述多个第一样本图像各自的伪标签包括的置信度数值，确定第二置信度阈值；以及基于所述多个第一样本图像各自的伪标签和所述第二置信度阈值，确定所述多个第一样本图像各自的掩膜值。12.根据权利要求1～11所述的方法，还包括：基于预设评价参数，从所述标注样本集中筛选得到所述第一样本图像。13.根据权利要求1～11所述的方法，还包括：从前端图像识别服务的回流数据中筛选得到所述第一样本图像。14.根据权利要求1～11所述的方法，还包括：基于预设场景特征，从共享资源中筛选得到所述第一样本图像。15.一种文本行检测方法，包括：利用深度学习模型处理待检测图像，得到文本行检测结果；其中，所述深度学习模型包括利用根据权利要求1～14中任一项所述的深度学习模型训练方法训练得到。16.一种深度学习模型训练装置，包括：第一处理模块，用于利用目标检测模型分别处理无标签样本集包括的多个第一样本图像，得到所述多个第一样本图像各自的伪标签，其中，所述目标检测模型包括利用标注样本集训练得到；以及训练模块，用于利用所述多个第一样本图像、所述多个第一样本图像各自的伪标签和
所述标注样本集训练初始模型，得到深度学习模型。17.根据权利要求16所述的装置，其中，所述第一处理模块包括第一处理单元、第二处...

【专利技术属性】
技术研发人员：万星宇，吕鹏原，范森，章成全，姚锟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人