选择器模型的训练方法、图像检测方法及相关设备技术

技术编号:29923331 阅读:19 留言:0更新日期:2021-09-04 18:37
本申请适用于人工智能领域,提供了选择器模型的训练方法、图像检测方法及相关设备。选择器模型的训练方法包括:获取奖励函数和图像检测条件;执行训练步骤,训练步骤包括:根据奖励函数和图像检测条件对选择器模型进行训练,得到待优化的选择器模型;根据待优化的选择器模型和图像检测条件对奖励函数进行训练,得到待优化的奖励函数。将待优化的奖励函数作为新的奖励函数,将待优化的选择器模型作为新的选择器模型,循环执行训练步骤,直到得到目标奖励函数以及目标选择器模型。其中,目标奖励函数和目标选择器模型满足预设训练停止条件,从而提高选择器模型的训练精度,进而根据训练好的目标选择器模型选择出更准确的图像检测器。的目标选择器模型选择出更准确的图像检测器。的目标选择器模型选择出更准确的图像检测器。

【技术实现步骤摘要】
选择器模型的训练方法、图像检测方法及相关设备


[0001]本申请属于人工智能
,尤其涉及选择器模型的训练方法、图像检测方法及相关设备。

技术介绍

[0002]现有的图像检测系统,在模型训练过程中,一般是固定奖励函数对模型进行训练,得到最优的模型。但是不同的图像检测条件,例如,不同的硬件运行环境、不同的图像检测精度等对模型训练过程中的奖励函数的要求不同,在多变的图像检测条件下,固定的奖励函数无法保证模型训练的精度。

技术实现思路

[0003]有鉴于此,本申请实施例提供了选择器模型的训练方法、图像检测方法及相关设备,以在选择器模型的训练过程中提高模型训练的精度,进而选择出准确的图像检测器进行图像检测。
[0004]本申请实施例的第一方面提供了一种选择器模型的训练方法,所述选择器模型是用于根据图像检测条件选择对应的图像检测器的标识的模型,所述图像检测器用于检测图像,所述选择器模型的训练方法包括:
[0005]获取奖励函数和图像检测条件;
[0006]执行训练步骤,所述训练步骤包括:
[0007]根据所述奖励函数和所述图像检测条件对所述选择器模型进行训练,得到待优化的选择器模型;
[0008]根据所述待优化的选择器模型和所述图像检测条件对所述奖励函数进行训练,得到待优化的奖励函数;
[0009]将所述待优化的奖励函数作为新的奖励函数,将所述待优化的选择器模型作为新的选择器模型,循环执行所述训练步骤,直到满足预设训练停止条件,将满足预设训练停止条件的待优化的奖励函数作为目标奖励函数,将满足预设训练停止条件的待优化的选择器模型作为目标选择器模型。
[0010]在一种可能的实现方式中,所述根据所述奖励函数和所述图像检测条件对所述选择器模型进行训练,得到待优化的选择器模型,包括:
[0011]根据所述图像检测条件和所述选择器模型确定第一标识;
[0012]根据确定的第一标识对应的图像检测器和预设的测试图像计算所述奖励函数的取值;
[0013]根据所述奖励函数的取值调整所述选择器模型的参数,得到奖励函数的取值大于预设值时对应的选择器模型,根据奖励函数的取值大于预设值时对应的选择器模型的参数生成所述待优化的选择器模型。
[0014]在一种可能的实现方式中,所述根据确定的第一标识对应的图像检测器和预设的
测试图像计算所述奖励函数的取值,包括:
[0015]根据所述确定的第一标识对应的图像检测器检测所述测试图像;
[0016]根据所述测试图像的检测结果计算所述奖励函数的取值。
[0017]在一种可能的实现方式中,所述根据所述待优化的选择器模型和所述图像检测条件对所述奖励函数进行训练,得到待优化的奖励函数,具体包括:
[0018]根据所述待优化的选择器模型和所述图像检测条件确定第二标识;
[0019]根据确定的第二标识对应的图像检测器和预设的测试图像调整奖励函数的参数,得到取值大于预设值的奖励函数,根据取值大于预设值的奖励函数的参数生成所述待优化的奖励函数。
[0020]在一种可能的实现方式中,所述根据确定的第二标识对应的图像检测器和预设的测试图像调整奖励函数的参数,包括:
[0021]根据所述确定的第二标识对应的图像检测器检测所述测试图像;
[0022]根据所述测试图像的检测结果调整所述奖励函数的参数。
[0023]本申请实施例的第二方面提供了一种图像检测方法,包括:
[0024]获取待测图像和图像检测条件;
[0025]根据目标选择器模型确定与所述图像检测条件对应的图像检测器的标识,其中,所述目标选择器模型是执行上述第一方面所述的选择器模型的训练方法训练得到的;
[0026]根据所述图像检测器的标识对应的图像检测器对所述待测图像进行图像检测。
[0027]本申请实施例的第三方面提供了一种选择器模型的训练装置,所述选择器模型是用于根据图像检测条件选择对应的图像检测器的标识的模型,所述图像检测器用于检测图像,所述选择器模型的训练装置包括:
[0028]获取模块,用于获取奖励函数和图像检测条件;
[0029]训练模块,用于执行训练步骤,所述训练步骤包括:
[0030]根据所述奖励函数和所述图像检测条件对所述选择器模型进行训练,得到待优化的选择器模型;
[0031]根据所述待优化的选择器模型和所述图像检测条件对所述奖励函数进行训练,得到待优化的奖励函数;
[0032]循环模块,用于将所述待优化的奖励函数作为新的奖励函数,将所述待优化的选择器模型作为新的选择器模型,循环执行所述训练步骤,直到满足预设训练停止条件,将满足预设训练停止条件的待优化的奖励函数作为目标奖励函数,将满足预设训练停止条件的待优化的选择器模型作为目标选择器模型。
[0033]在一种可能的实现方式中,所述训练模块具体用于:
[0034]根据所述图像检测条件和所述选择器模型确定第一标识;
[0035]根据确定的第一标识对应的图像检测器和预设的测试图像计算所述奖励函数的取值;
[0036]根据所述奖励函数的取值调整所述选择器模型的参数,得到奖励函数的取值大于预设值时对应的选择器模型,根据奖励函数的取值大于预设值时对应的选择器模型的参数生成所述待优化的选择器模型。
[0037]在一种可能的实现方式中,所述训练模块具体还用于:
[0038]根据所述确定的第一标识对应的图像检测器检测所述测试图像;
[0039]根据所述测试图像的检测结果计算所述奖励函数的取值。
[0040]在一种可能的实现方式中,所述训练模块具体还用于:
[0041]根据所述待优化的选择器模型和所述图像检测条件确定第二标识;
[0042]根据确定的第二标识对应的图像检测器和预设的测试图像调整奖励函数的参数,得到取值大于预设值的奖励函数,根据取值大于预设值的奖励函数的参数生成所述待优化的奖励函数。
[0043]在一种可能的实现方式中,所述奖励函数包括至少一个约束条件以及与每个约束条件对应的系数。
[0044]在一种可能的实现方式中,所述训练模块具体还用于:
[0045]根据所述确定的第二标识对应的图像检测器检测所述测试图像;
[0046]根据所述测试图像的检测结果计算所述约束条件对应的值;
[0047]根据所述约束条件对应的值调整每个约束条件对应的系数。
[0048]本申请实施例的第四方面提供了一种图像检测装置,其特征在于,包括:
[0049]输入模块,用于获取待测图像和图像检测条件;
[0050]确定模块,用于根据目标选择器模型确定与所述图像检测条件对应的图像检测器的标识,其中,所述目标选择器模型是执行上述第一方面所述的选择器模型的训练方法训练得到的;
[0051]检测模块,用于根据所述图像检测器的标识对应的图像检测器对所述待测图像进行图像检测。...

【技术保护点】

【技术特征摘要】
1.一种选择器模型的训练方法,其特征在于,所述选择器模型是用于根据图像检测条件选择对应的图像检测器的标识的模型,所述图像检测器用于检测图像,所述选择器模型的训练方法包括:获取奖励函数和图像检测条件;执行训练步骤,所述训练步骤包括:根据所述奖励函数和所述图像检测条件对所述选择器模型进行训练,得到待优化的选择器模型;根据所述待优化的选择器模型和所述图像检测条件对所述奖励函数进行训练,得到待优化的奖励函数;将所述待优化的奖励函数作为新的奖励函数,将所述待优化的选择器模型作为新的选择器模型,循环执行所述训练步骤,直到满足预设训练停止条件,将满足预设训练停止条件的待优化的奖励函数作为目标奖励函数,将满足预设训练停止条件的待优化的选择器模型作为目标选择器模型。2.如权利要求1所述的选择器模型的训练方法,其特征在于,所述根据所述奖励函数和所述图像检测条件对所述选择器模型进行训练,得到待优化的选择器模型,包括:根据所述图像检测条件和所述选择器模型确定第一标识;根据确定的第一标识对应的图像检测器和预设的测试图像计算所述奖励函数的取值;根据所述奖励函数的取值调整所述选择器模型的参数,得到奖励函数的取值大于预设值时对应的选择器模型,根据奖励函数的取值大于预设值时对应的选择器模型的参数生成所述待优化的选择器模型。3.如权利要求2所述的选择器模型的训练方法,其特征在于,所述根据确定的第一标识对应的图像检测器和预设的测试图像计算所述奖励函数的取值,包括:根据所述确定的第一标识对应的图像检测器检测所述测试图像;根据所述测试图像的检测结果计算所述奖励函数的取值。4.如权利要求1所述的选择器模型的训练方法,其特征在于,所述根据所述待优化的选择器模型和所述图像检测条件对所述奖励函数进行训练,得到待优化的奖励函数,具体包括:根据所述待优化的选择器模型和所述图像检测条件确定第二标识;根据确定的第二标识对应的图像检测器和预设的测试图像调整奖励函数的参数,得到取值大于预设值的奖励函数,根据取值大于预设值的奖励函数的参数生成所述待优化的奖励函数。5.如权利要求4所述的选择器模型的训练方法,其特征在于,所述根据确定的第二标识对应的图像...

【专利技术属性】
技术研发人员:杨傲楠
申请(专利权)人:深圳云天励飞技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1