一种基于深度学习的计算机视觉数据集半自动标注方法及系统技术方案

技术编号：27536787 阅读：45 留言：0更新日期：2021-03-03 11:24

本发明专利技术提出了一种基于深度学习的计算机视觉数据集半自动标注方法及系统，包括以下步骤：步骤1：从样本图片集A中按一定比例进行随机采样，生成图片集B；步骤2：对经过步骤1操作的图片集B进行人工标注、图像扩充和图像预处理，生成训练集B；步骤3：采用训练集B对Faster

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的计算机视觉数据集半自动标注方法及系统

[0001]本专利技术属于计算机视觉数据标注
，具体涉及一种基于深度学习的计算机视觉数据集半自动标注方法及系统。

技术介绍

[0002]人工智能作为当下最热门的技术，但如何对已有数据进行高效的预处理是人工智能技术中关键的一环。在计算机视觉这个分支领域，对图像进行标注，获取深度神经网络训练所需的图片数据集是前期必须的工作。但图像标注这类工作具有如下问题：
[0003](1)重复率高导致工作量大、工作细节繁琐，消耗软件算法工程师大量时间和精力，无形中增加了人力成本；
[0004](2)在电力或医疗等专业业务领域，对图像标注的工作须依赖业务人员的先验知识，增加了同类图片标注的复用难度。
[0005]在实际生产应用中，电力专业领域的图像标注效率低问题普遍存在。例如电力巡检图像，仅单个部门采集的不同故障类型图像多达数千张，包含若干绝缘子、防震锤、鸟巢等多个待识别目标，需要将所有待识别目标进行画框和标注。该项标注工作不仅耗时而且极易出错，尤其是线路图像中的小金具如线夹、防震锤等细小肉眼难以识别的物体，错标和漏标难以避免。同时电气设备的缺陷类型识别需要业务专家的参与指导，无形中增加了人力成本和实施难度。
[0006]针对上述问题，亟需一套图像标注工具辅助工程师进行标注提高效率，人为只需标注小部分样本再使用该方法即可快速实现半自动标注，实现人工智能辅助人类的人机过程。

技术实现思路

[0007]专利技术目的：为解决电力专业领...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的计算机视觉数据集半自动标注方法，其特征在于：包括以下步骤：步骤1：从样本图片集A中按一定比例进行随机采样，生成图片集B；步骤2：对经过步骤1操作的图片集B进行人工标注、图像扩充和图像预处理，生成训练集B；步骤3：采用训练集B对Faster-rcnn算法中的深度神经网络模型进行初训练，得到模型权重；步骤4：利用模型权重，结合人机耦合的标注方法，对样本图片集A进行标注，对标注好的样本图片集A进行图像扩充和图像预处理，生成训练集A；步骤5：采用训练集A对Faster-rcnn算法中的深度神经网络模型进行再训练；步骤6：将待识别的图像输入至经过步骤5训练好的深度神经网络模型中，得到标注结果。2.根据权利要求1所述的一种基于深度学习的计算机视觉数据集半自动标注方法，其特征在于：所述的图像预处理至少包括：图像几何矫正和图像色彩增强。3.根据权利要求1所述的一种基于深度学习的计算机视觉数据集半自动标注方法，其特征在于：Faster-rcnn算法中的深度神经网络模型的训练方法，包括：采用训练集B/训练集A对Faster-rcnn算法中的深度神经网络模型，得到训练完成的模型权重参数；对模型权重参数进行排序，通过裁剪模型权重参数小于设定值的卷积层，完成Faster-rcnn算法中的深度神经网络模型的训练。4.根据权利要求1所述的一种基于深度学习的计算机视觉数据集半自动标注方法，其特征在于：所述的Faster-rcnn算法中的深度神经网络模型的构建方法，包括：依据实际电力场景所需识别标签数量与COCO数据集的比对结果，对特征提取网络的深度进行压缩；依据实际电力场景所需识别标签数量与COCO数据集的比对结果，对分类网络的深度进行按比例压缩；将权重数据以FP32和FP16两种格式进行组合训练。5.根据权利要求1所述的一种基于深度学习的计算机视觉数据集半自动标注方...

【专利技术属性】
技术研发人员：陈天宇，徐弘升，张琪培，李子琪，陆继翔，杨志宏，
申请(专利权)人：国电南瑞科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人