System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 标签预测的方法、装置、电子设备及存储介质制造方法及图纸_技高网

标签预测的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41662695 阅读:5 留言:0更新日期:2024-06-14 15:22
本申请涉及一种标签预测的方法、装置、电子设备及存储介质。该方法包括:获取待测试图像和初始标签预测模型,构建针对初始标签预测模型的初始激活函数,并对初始激活函数进行参数训练处理,获得与初始激活函数对应的目标激活函数,将目标激活函数添加至初始标签预测模型中,生成目标标签预测模型,将待测试图像输入至目标标签预测模型中,输出针对待测试图像的预测标签。本申请提供的方案,能够令目标标签预测模型具有较强的非线性分解能力,避免模型产生梯度消失的问题、提高模型的收敛速度以及收敛性,进而大大提高了目标标签预测模型识别图像标签的精准度。

【技术实现步骤摘要】

本申请涉及模型数据处理,尤其涉及标签预测的方法、装置、电子设备及存储介质


技术介绍

1、激活函数(activation functions)具有非线性建模的能力,其属于神经网络中不可或缺的部分,通过在神经网络中添加非线性的激活函数,令神经网络能够负责将神经元的输入映射到输出端。一般而言,神经网络常用的激活函数包括sigmoid函数(s型函数)、tanh函数(双曲正切函数)以及relu及其系列函数(线性整流函数)。

2、但是,在采用多层网络层的神经网络识别图像时,如果采用sigmoid函数和tanh函数进行映射,sigmoid函数和tanh函数计算出的梯度值比较小,而将多层数值小的梯度进行相乘后所得到的值是非常小的,这就使得神经网络产生了梯度消失的问题,神经网络无法继续进行模型训练,收敛速度也变得缓慢。如果采用relu及其系列函数进行映射,则容易出现偏移现象以及神经元死亡现象,这两种现象在一定程度上影响了神经网络的收敛性,从而由于神经网络容易出现梯度消失、收敛速度慢以及收敛性差,导致采用现有神经网络进行标签预测时图像识别准确度低。


技术实现思路

1、本申请提供一种标签预测的方法、装置、电子设备及存储介质,能够解决或者部分解决由于神经网络容易出现梯度消失、收敛速度慢以及收敛性差,导致采用现有神经网络进行标签预测时图像识别准确度低的问题。

2、本申请第一方面提供一种标签预测的方法,包括:

3、获取待测试图像和初始标签预测模型;

4、构建针对所述初始标签预测模型的初始激活函数,并对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数;

5、将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型;

6、将所述待测试图像输入至所述目标标签预测模型中,输出针对所述待测试图像的预测标签。

7、可选地,所述构建针对所述初始标签预测模型的初始激活函数,包括:

8、获取两个多项式集合,所述多项式集合包括第一多项式集合和第二多项式集合,所述第一多项式集合和所述第二多项式集合包括若干个正交基函数;

9、采用所述第一多项式集合和所述第二多项式集合构造分数,将所述分数作为所述初始标签预测模型的初始激活函数;

10、其中,所述第一多项式集合为所述分数的分子,所述第二多项式集合为所述分数的分母。

11、可选地,所述初始激活函数的形式如下:

12、

13、其中,式子中的f(x)为所述初始激活函数,p(x)为所述第一多项式集合,q(x)为所述第二多项式集合,x为所述目标激活函数的输入参数,a0、a1、a2……am为所述p(x)的训练系数,b1、b2……bn为所述f(x)的训练系数,j、k均为x的阶次,m为所述p(x)中x的最高阶次,n为所述q(x)中x的最高阶次。

14、可选地,所述参数训练处理包括求导操作,所述对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数,包括:

15、对所述初始激活函数进行求导操作,分别获得所述第一多项式集合和所述第二多项式集合的训练系数;

16、将所述训练系数代入至所述初始激活函数中,生成所述目标激活函数;

17、其中,所述初始激活函数的求导操作如下:

18、

19、

20、

21、其中,q(x)=1+|a(x)|;a(x)=b1x+b2x2+…+bnxn。

22、可选地,所述初始标签预测模型包括若干层卷积层,所述将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型,包括:

23、分别获取与所述初始标签模型对应的卷积核尺寸、卷积核滑动步长以及填充数据;

24、将所述卷积核尺寸、所述卷积核滑动步长、所述填充数据以及所述目标激活函数添加至所述若干层卷积层,生成所述目标标签预测模型。

25、可选地,所述待测试图像包括交通灯测试图像,所述将所述待测试图像输入至所述目标标签预测模型中,输出针对所述待测试图像的预测标签,包括:

26、将所述交通灯测试图像输入至所述卷积层,在所述卷积层中分别对所述交通灯测试图像进行采样操作,生成交通灯特征图;

27、按照预设格式将所述交通灯特征图转换为字符串,并将所述字符串作为模型预测数据输入至所述目标标签预测模型中,获得所述交通灯特征图对应的预测标签。

28、可选地,每一所述卷积层包括编码器和解码器,所述采样操作包括上采样操作和下采样操作,所述将所述交通灯测试图像输入至所述卷积层,在所述卷积层中分别对所述交通灯测试图像进行采样操作,生成交通灯特征图,包括:

29、将所述交通灯测试图像输入至所述卷积层;

30、通过所述编码器对所述交通灯测试图像进行下采样操作,将所述交通灯测试图像的通道数量增加一倍,同时将所述交通灯测试图像的图像尺寸减小一半,获得交通灯采样图像;

31、通过所述解码器对所述交通灯采样图像进行上采样操作,将所述交通灯采样图像的通道数量减少一倍,同时将所述交通灯采样图像的图像尺寸增大一倍,生成所述交通灯特征图。

32、本申请第二方面提供一种标签预测的装置,包括:

33、信息获取模块,用于获取待测试图像和初始标签预测模型;

34、目标激活函数生成模块,用于构建针对所述初始标签预测模型的初始激活函数,并对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数;

35、目标标签预测模型生成模块,用于将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型;

36、预测标签输出模块,用于将所述待测试图像输入至所述目标标签预测模型中,输出针对所述待测试图像的预测标签。

37、本申请第三方面提供一种电子设备,包括:

38、处理器;以及

39、存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。

40、本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。

41、本申请提供的技术方案可以包括以下有益效果:

42、在本申请实施例中,能够获取待测试图像和初始标签预测模型,构建针对初始标签预测模型的初始激活函数,并对初始激活函数进行参数训练处理,获得与初始激活函数对应的目标激活函数,将目标激活函数添加至初始标签预测模型中,生成目标标签预测模型,将待测试图像输入至目标标签预测模型中,输出针对待测试图像的预测标签,从而通过对初始激活函数进行参数训练处理,获得可训练的目标激活函数,增强目标激活函数的非线性作用,并且通过将可训练的目标激活函数与初始标签预测模型进行结合,生成目标标签预本文档来自技高网...

【技术保护点】

1.一种标签预测的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述构建针对所述初始标签预测模型的初始激活函数,包括:

3.根据权利要求2所述的方法,其特征在于,所述初始激活函数的形式如下:

4.根据权利要求3所述的方法,其特征在于,所述参数训练处理包括求导操作,所述对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数,包括:

5.根据权利要求1所述的方法,其特征在于,所述初始标签预测模型包括若干层卷积层,所述将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型,包括:

6.根据权利要求5所述的方法,其特征在于,所述待测试图像包括交通灯测试图像,所述将所述待测试图像输入至所述目标标签预测模型中,输出针对所述待测试图像的预测标签,包括:

7.根据权利要求6所述的方法,其特征在于,每一所述卷积层包括编码器和解码器,所述采样操作包括上采样操作和下采样操作,所述将所述交通灯测试图像输入至所述卷积层,在所述卷积层中分别对所述交通灯测试图像进行采样操作,生成交通灯特征图,包括:

8.一种标签预测的装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种标签预测的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述构建针对所述初始标签预测模型的初始激活函数,包括:

3.根据权利要求2所述的方法,其特征在于,所述初始激活函数的形式如下:

4.根据权利要求3所述的方法,其特征在于,所述参数训练处理包括求导操作,所述对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数,包括:

5.根据权利要求1所述的方法,其特征在于,所述初始标签预测模型包括若干层卷积层,所述将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型,包括:

6.根据权利要求5所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:李宁贾双成万如
申请(专利权)人:智道网联科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1