卷积神经网络的训练方法、装置、设备和存储介质制造方法及图纸

技术编号:35586427 阅读:36 留言:0更新日期:2022-11-16 15:01
本发明专利技术涉及人工智能技术领域,尤其涉及一种卷积神经网络的训练方法,该方法包括:通过第一训练数据集进行模型训练,得到教学模型,其中,第一训练数据集为携带人工标注的图像;利用教学模型对第二训练数据集中每个训练数据进行标注,得到目标训练数据集,其中,第二训练数据集中每个训练数据为待识别图像,目标训练数据集中每个训练数据携带有预测标签;将第一训练数据集和目标训练数据集进行增强处理,获得增强后的第三训练数据集;根据第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足训练约束条件时的迭代检测器模型确定为目标检测器模型。该方法提高卷积神经网络的泛化能力和训练效率。训练效率。训练效率。

【技术实现步骤摘要】
卷积神经网络的训练方法、装置、设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种卷积神经网络的训练方法、装置、设备和存储介质。

技术介绍

[0002]近年来,深度学习方法在图像目标识别方面取得了突出的成绩,将卷积神经网络模型应用到生产生活中是当今一大趋势。当前,应用卷积神经网络模型完成目标识别任务,主要依赖于全监督学习,即训练过程中需要使用大量的人工标注数据来训练网络,标注数据需要包含注释定位目标的目标边界框。当遇到标注数据量不足,或是训练数据与测试数据属于不同领域的情况时,卷积神经网络模型的检测效果会不佳。数据集的标注是一项费事费力的工作,对于形态复杂、种类繁多的视觉目标进行精确的样本标注,需要耗费大量人工劳动,训练效率低。

技术实现思路

[0003]本申请实施例通过提供一种卷积神经网络的训练方法、装置、设备和存储介质,解决了现有技术中卷积神经网络在训练中需要对目标进行大量地标注,从而引发的训练效率低的技术问题,实现了充分利用无标注数据进行卷积神经网络训练,降低卷积神经网络的训练成本,同时提高卷积神经网络的泛化能力和训练效率的技术效果。
[0004]第一方面,本专利技术实施例提供一种卷积神经网络的训练方法,包括:
[0005]通过已获取的第一训练数据集进行模型训练,得到教学模型,其中,所述第一训练数据集为携带人工标注的图像;
[0006]利用所述教学模型对第二训练数据集中每个训练数据进行标注,得到目标训练数据集,其中,所述第二训练数据集中每个训练数据为待识别图像,所述目标训练数据集中每个训练数据携带有预测标签;
[0007]将所述第一训练数据集和所述目标训练数据集进行增强处理,获得增强后的第三训练数据集;
[0008]根据所述第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足所述训练约束条件时的迭代检测器模型确定为目标检测器模型。
[0009]优选的,所述利用所述教学模型对第二训练数据集中每个训练数据进行标注,得到目标训练数据集,包括:
[0010]将所述第二训练数据集中的每个训练数据输入到所述教学模型中进行预测,得到标注训练数据集,其中,所述标注训练数据集中每个训练数据包括预测框信息、预测框的置信度和分类信息;
[0011]从所述标注训练数据集中获取目标训练数据集,其中,所述目标训练数据集中的每个训练数据的所述预测框的置信度不小于置信度阈值,并且将每个训练数据的所述预测
框信息、所述预测框的置信度和所述分类信息生成每个训练数据的预测标签。
[0012]优选的,所述将所述第一训练数据集和所述目标训练数据集进行增强处理,获得增强后的第三训练数据集,包括:
[0013]从所述第一训练数据集和所述第二数据集中选取N个数据子集,其中,所述N个数据子集中的每个数据子集为包括至少4张图像的数据集,N≥2;
[0014]针对所述每个数据子集,对数据子集中的图像进行组合处理,生成一张组合图像;其中,所述组合处理作为所述增强处理;
[0015]对所述每个数据子集进行上述操作之后,得到N张组合图像,其中,所述N张组合图像作为所述第三训练数据集。
[0016]优选的,所述根据所述第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足所述训练约束条件时的迭代检测器模型确定为目标检测器模型,包括:
[0017]根据所述第三训练数据集对所述初始检测器模型进行迭代训练,直至迭代的检测器模型对应的损失函数得到的当前损失函数值不大于损失函数阈值时,将当前检测器模型作为目标检测器模型。
[0018]优选的,所述当前检测器模型的当前损失函数值的获取步骤,包括:
[0019]获取上一个检测器模型的损失函数值更新的权重值;
[0020]根据所述权重值和所述损失函数,获得所述当前检测器对应的当前损失函数值。
[0021]优选的,所述根据所述第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足所述训练约束条件时的迭代检测器模型确定为目标检测器模型,包括:
[0022]根据所述第三训练数据集对所述初始检测器模型进行迭代训练,直到迭代训练的次数满足迭代次数阈值时,将满足所述迭代次数阈值时的当前检测器确定为所述目标检测器模型。
[0023]优选的,所述将所述迭代后的检测器模型确定为目标检测器模型之后,还包括:
[0024]将所述目标检测器模型以指定的文本格式进行保存。
[0025]基于同一专利技术构思,第二方面,本专利技术还提供一种卷积神经网络的训练装置,包括:
[0026]教学模块,用于通过已获取的第一训练数据集进行模型训练,得到教学模型,其中,所述第一训练数据集为携带人工标注的图像;
[0027]生成模块,用于利用所述教学模型对第二训练数据集中每个训练数据进行标注,得到目标训练数据集,其中,所述第二训练数据集中每个训练数据为待识别图像,所述目标训练数据集中每个训练数据携带有预测标签;
[0028]增强模块,用于将所述第一训练数据集和所述目标训练数据集进行增强处理,获得增强后的第三训练数据集;
[0029]处理模块,用于根据所述第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足所述训练约束条件时的迭代检测器模型确定为目标检测器模型。
[0030]基于同一专利技术构思,第三方面,本专利技术提供一种计算机设备,包括存储器、处理器
及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现卷积神经网络的训练方法的步骤。
[0031]基于同一专利技术构思,第四方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现卷积神经网络的训练方法的步骤。
[0032]本专利技术实施例中的一个或多个技术方案,至少具有如下技术效果或优点:
[0033]在本申请实施例中,卷积神经网络的训练方法首先通过带有人工标注的图像的第一训练数据集训练教学模型,得到性能可靠和稳定的教学模型,提升教学模型的预测精度。再将待识别图像通过得到的教学模型进行训练,获得带有预测标签的图像的第二数据集。由于教学模型预测精度高,训练得到的第二数据集的准确度也随之升高。接着,将第一训练数据集和第二数据集进行增强处理,获得第三训练数据集。第三训练数据集中的数据是增强后的,且其中任意一张图像包括多张图像,丰富了第三训练数据集的数据,进而通过第三训练数据集进行初始检测器模型的训练,会使得到的检测器模型的鲁棒性更好,提高了GPU处理效率和训练效率。然后,通过第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足训练约束条件时的迭代检测器模型确定为目标检测器模型。由于第一训练数据集、第二数据集、第三训练数据集和教学模型的准确性高,使初始检测器模型经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种卷积神经网络的训练方法,其特征在于,包括:通过已获取的第一训练数据集进行模型训练,得到教学模型,其中,所述第一训练数据集为携带人工标注的图像;利用所述教学模型对第二训练数据集中每个训练数据进行标注,得到目标训练数据集,其中,所述第二训练数据集中每个训练数据为待识别图像,所述目标训练数据集中每个训练数据携带有预测标签;将所述第一训练数据集和所述目标训练数据集进行增强处理,获得增强后的第三训练数据集;根据所述第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足所述训练约束条件时的迭代检测器模型确定为目标检测器模型。2.如权利要求1所述的方法,其特征在于,所述利用所述教学模型对第二训练数据集中每个训练数据进行标注,得到目标训练数据集,包括:将所述第二训练数据集中的每个训练数据输入到所述教学模型中进行预测,得到标注训练数据集,其中,所述标注训练数据集中每个训练数据包括预测框信息、预测框的置信度和分类信息;从所述标注训练数据集中获取目标训练数据集,其中,所述目标训练数据集中的每个训练数据的所述预测框的置信度不小于置信度阈值,并且将每个训练数据的所述预测框信息、所述预测框的置信度和所述分类信息生成每个训练数据的预测标签。3.如权利要求1所述的方法,其特征在于,所述将所述第一训练数据集和所述目标训练数据集进行增强处理,获得增强后的第三训练数据集,包括:从所述第一训练数据集和所述第二数据集中选取N个数据子集,其中,所述N个数据子集中的每个数据子集为包括至少4张图像的数据集,N≥2;针对所述每个数据子集,对数据子集中的图像进行组合处理,生成一张组合图像;其中,所述组合处理作为所述增强处理;对所述每个数据子集进行上述操作之后,得到N张组合图像,其中,所述N张组合图像作为所述第三训练数据集。4.如权利要求3所述的方法,其特征在于,所述根据所述第三训练数据集对初始检测器模型进行迭代训练,直至迭代的检测器模型满足训练约束条件时,将满足所述训练约束条件时的迭代检测器模型确定为目标检测器模型,包括:根据所述第三训练数据集对所述初始检测器模型进行迭代训练,直至迭代的检测器模型对应的损...

【专利技术属性】
技术研发人员:王章君沛李功燕许绍云
申请(专利权)人:中国科学院微电子研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1