一种基于深度学习的计算机视觉数据集半自动标注方法及系统技术方案

技术编号:27536787 阅读:45 留言:0更新日期:2021-03-03 11:24
本发明专利技术提出了一种基于深度学习的计算机视觉数据集半自动标注方法及系统,包括以下步骤:步骤1:从样本图片集A中按一定比例进行随机采样,生成图片集B;步骤2:对经过步骤1操作的图片集B进行人工标注、图像扩充和图像预处理,生成训练集B;步骤3:采用训练集B对Faster

【技术实现步骤摘要】
一种基于深度学习的计算机视觉数据集半自动标注方法及系统


[0001]本专利技术属于计算机视觉数据标注
,具体涉及一种基于深度学习的计算机视觉数据集半自动标注方法及系统。

技术介绍

[0002]人工智能作为当下最热门的技术,但如何对已有数据进行高效的预处理是人工智能技术中关键的一环。在计算机视觉这个分支领域,对图像进行标注,获取深度神经网络训练所需的图片数据集是前期必须的工作。但图像标注这类工作具有如下问题:
[0003](1)重复率高导致工作量大、工作细节繁琐,消耗软件算法工程师大量时间和精力,无形中增加了人力成本;
[0004](2)在电力或医疗等专业业务领域,对图像标注的工作须依赖业务人员的先验知识,增加了同类图片标注的复用难度。
[0005]在实际生产应用中,电力专业领域的图像标注效率低问题普遍存在。例如电力巡检图像,仅单个部门采集的不同故障类型图像多达数千张,包含若干绝缘子、防震锤、鸟巢等多个待识别目标,需要将所有待识别目标进行画框和标注。该项标注工作不仅耗时而且极易出错,尤其是线路图像中的小金具如线夹、防震锤等细小肉眼难以识别的物体,错标和漏标难以避免。同时电气设备的缺陷类型识别需要业务专家的参与指导,无形中增加了人力成本和实施难度。
[0006]针对上述问题,亟需一套图像标注工具辅助工程师进行标注提高效率,人为只需标注小部分样本再使用该方法即可快速实现半自动标注,实现人工智能辅助人类的人机过程。

技术实现思路

[0007]专利技术目的:为解决电力专业领域中图像标注效率低、电气设备的缺陷类型识别需要业务专家的参与指导,导致人力成本高和实施难度高等问题,本专利技术提出了一种基于深度学习的计算机视觉数据集半自动标注方法及系统,通过使用该方法可快速实现半自动标注,实现人工智能辅助人类的人机过程。
[0008]技术方案:一种基于深度学习的计算机视觉数据集半自动标注方法,包括以下步骤:
[0009]步骤1:从样本图片集A中按一定比例进行随机采样,生成图片集B;
[0010]步骤2:对经过步骤1操作的图片集B进行人工标注、图像扩充和图像预处理,生成训练集B;
[0011]步骤3:采用训练集B对Faster-rcnn算法中的深度神经网络模型进行初训练,得到模型权重;
[0012]步骤4:利用模型权重,结合人机耦合的标注方法,对样本图片集A进行标注,对标
注好的样本图片集A进行图像扩充和图像预处理,生成训练集A;
[0013]步骤5:采用训练集A对Faster-rcnn算法中的深度神经网络模型进行再训练;
[0014]步骤6:将待识别的图像输入至经过步骤5训练好的深度神经网络模型中,得到标注结果。
[0015]进一步的,所述的图像预处理至少包括:图像几何矫正和图像色彩增强。
[0016]进一步的,Faster-rcnn算法中的深度神经网络模型的训练方法,包括:
[0017]采用训练集B/训练集A对Faster-rcnn算法中的深度神经网络模型,得到训练完成的模型权重参数;
[0018]对模型权重参数进行排序,通过裁剪模型权重参数小于设定值的卷积层,完成Faster-rcnn算法中的深度神经网络模型的训练。
[0019]进一步的,所述的Faster-rcnn算法中的深度神经网络模型的构建方法,包括:
[0020]依据实际电力场景所需识别标签数量与COCO数据集的比对结果,对特征提取网络的深度进行压缩;
[0021]依据实际电力场景所需识别标签数量与COCO数据集的比对结果,对分类网络的深度进行按比例压缩;
[0022]将权重数据以FP32和FP16两种格式进行组合训练。
[0023]进一步的,所述图像扩充包括采用图像水平翻转、随机扣取、尺度变换、旋转变换、基于生成式对抗网络的样本扩充算法中的一种或多种。
[0024]本专利技术公开了一种基于深度学习的计算机视觉数据集半自动标注系统,包括:
[0025]采样模块,用于从样本图片集A中按一定比例进行随机采样,生成图片集B;
[0026]图像处理模块,用于对图片集B进行人工标注、图像扩充和图像预处理,生成训练集B;
[0027]模型初训练模块,用于采用训练集B对Faster-rcnn算法中的深度神经网络模型进行初训练,得到模型权重;
[0028]训练集扩充模块,用于利用模型权重,结合人机耦合的标注方法,对样本图片集A进行标注,对标注好的样本图片集A进行图像扩充和图像预处理,生成训练集A;
[0029]模型再训练模块,采用训练集A对Faster-rcnn算法中的深度神经网络模型进行再训练,得到最终的模型权重;
[0030]标注模块,用于基于最终的模型权重,对输入的图像进行标注。
[0031]进一步的,所述模型初训练模块/模型再训练模块基于以下训练方法得到模型权重;
[0032]采用训练集B/训练集A对Faster-rcnn算法中的深度神经网络模型,得到训练完成的模型权重参数;
[0033]对模型权重参数进行排序,通过裁剪模型权重参数小于设定值的卷积层,完成Faster-rcnn算法中的深度神经网络模型的训练。
[0034]进一步的,所述模型初训练模块/模型再训练模块中的Faster-rcnn算法中的深度神经网络模型基于以下构建方法得到;
[0035]依据实际电力场景所需识别标签数量与COCO数据集的比对结果,对特征提取网络的深度进行压缩;
[0036]依据实际电力场景所需识别标签数量与COCO数据集的比对结果,对分类网络的深度进行按比例压缩;
[0037]将权重数据以FP32和FP16两种格式进行组合训练。
[0038]有益效果:本专利技术采用基于人机耦合的标注方法,对样本集中的小部分进行人工标注,利用小部分的样本集对改进的深度神经网络Faster-RCNN进行模型训练,使用优化训练后的模型进行反向自动标注,最后配合人工快速检查,能够高效完整大量电力专业图片数据集的标注工作,是辅助电力AI工程师标注工作的有力工具。
附图说明
[0039]图1为本专利技术的流程示意图;
[0040]图2为修改Faster-rcnn算法中的深度神经网络模型的流程示意图;
[0041]图3为Faster-rcnn算法中的深度神经网络模型训练流程示意图。
具体实施方式
[0042]现进一步阐述本专利技术的技术方案。
[0043]如图1所示的一种基于深度学习的计算机视觉数据集半自动标注方法,包括如下步骤:
[0044]步骤1:采集待识别目标样本图片集A,从中按10%比例进行随机采样,生成图片集B;
[0045]步骤2:对图片集B进行人工标注、图像预处理和图像扩充以提高样本训练集的质量;具体包括:
[0046]在图像预处理阶段,包括但不限于采用以下措施:(1)根据图像采集设备内参完成的图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的计算机视觉数据集半自动标注方法,其特征在于:包括以下步骤:步骤1:从样本图片集A中按一定比例进行随机采样,生成图片集B;步骤2:对经过步骤1操作的图片集B进行人工标注、图像扩充和图像预处理,生成训练集B;步骤3:采用训练集B对Faster-rcnn算法中的深度神经网络模型进行初训练,得到模型权重;步骤4:利用模型权重,结合人机耦合的标注方法,对样本图片集A进行标注,对标注好的样本图片集A进行图像扩充和图像预处理,生成训练集A;步骤5:采用训练集A对Faster-rcnn算法中的深度神经网络模型进行再训练;步骤6:将待识别的图像输入至经过步骤5训练好的深度神经网络模型中,得到标注结果。2.根据权利要求1所述的一种基于深度学习的计算机视觉数据集半自动标注方法,其特征在于:所述的图像预处理至少包括:图像几何矫正和图像色彩增强。3.根据权利要求1所述的一种基于深度学习的计算机视觉数据集半自动标注方法,其特征在于:Faster-rcnn算法中的深度神经网络模型的训练方法,包括:采用训练集B/训练集A对Faster-rcnn算法中的深度神经网络模型,得到训练完成的模型权重参数;对模型权重参数进行排序,通过裁剪模型权重参数小于设定值的卷积层,完成Faster-rcnn算法中的深度神经网络模型的训练。4.根据权利要求1所述的一种基于深度学习的计算机视觉数据集半自动标注方法,其特征在于:所述的Faster-rcnn算法中的深度神经网络模型的构建方法,包括:依据实际电力场景所需识别标签数量与COCO数据集的比对结果,对特征提取网络的深度进行压缩;依据实际电力场景所需识别标签数量与COCO数据集的比对结果,对分类网络的深度进行按比例压缩;将权重数据以FP32和FP16两种格式进行组合训练。5.根据权利要求1所述的一种基于深度学习的计算机视觉数据集半自动标注方...

【专利技术属性】
技术研发人员:陈天宇徐弘升张琪培李子琪陆继翔杨志宏
申请(专利权)人:国电南瑞科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1