System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及模型数据处理,尤其涉及标签预测的方法、装置、电子设备及存储介质。
技术介绍
1、激活函数(activation functions)具有非线性建模的能力,其属于神经网络中不可或缺的部分,通过在神经网络中添加非线性的激活函数,令神经网络能够负责将神经元的输入映射到输出端。一般而言,神经网络常用的激活函数包括sigmoid函数(s型函数)、tanh函数(双曲正切函数)以及relu及其系列函数(线性整流函数)。
2、但是,在采用多层网络层的神经网络识别图像时,如果采用sigmoid函数和tanh函数进行映射,sigmoid函数和tanh函数计算出的梯度值比较小,而将多层数值小的梯度进行相乘后所得到的值是非常小的,这就使得神经网络产生了梯度消失的问题,神经网络无法继续进行模型训练,收敛速度也变得缓慢。如果采用relu及其系列函数进行映射,则容易出现偏移现象以及神经元死亡现象,这两种现象在一定程度上影响了神经网络的收敛性,从而由于神经网络容易出现梯度消失、收敛速度慢以及收敛性差,导致采用现有神经网络进行标签预测时图像识别准确度低。
技术实现思路
1、本申请提供一种标签预测的方法、装置、电子设备及存储介质,能够解决或者部分解决由于神经网络容易出现梯度消失、收敛速度慢以及收敛性差,导致采用现有神经网络进行标签预测时图像识别准确度低的问题。
2、本申请第一方面提供一种标签预测的方法,包括:
3、获取待测试图像和初始标签预测模型;
4、构建针
5、将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型;
6、将所述待测试图像输入至所述目标标签预测模型中,输出针对所述待测试图像的预测标签。
7、可选地,所述构建针对所述初始标签预测模型的初始激活函数,包括:
8、获取两个多项式集合,所述多项式集合包括第一多项式集合和第二多项式集合,所述第一多项式集合和所述第二多项式集合包括若干个正交基函数;
9、采用所述第一多项式集合和所述第二多项式集合构造分数,将所述分数作为所述初始标签预测模型的初始激活函数;
10、其中,所述第一多项式集合为所述分数的分子,所述第二多项式集合为所述分数的分母。
11、可选地,所述初始激活函数的形式如下:
12、
13、其中,式子中的f(x)为所述初始激活函数,p(x)为所述第一多项式集合,q(x)为所述第二多项式集合,x为所述目标激活函数的输入参数,a0、a1、a2……am为所述p(x)的训练系数,b1、b2……bn为所述f(x)的训练系数,j、k均为x的阶次,m为所述p(x)中x的最高阶次,n为所述q(x)中x的最高阶次。
14、可选地,所述参数训练处理包括求导操作,所述对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数,包括:
15、对所述初始激活函数进行求导操作,分别获得所述第一多项式集合和所述第二多项式集合的训练系数;
16、将所述训练系数代入至所述初始激活函数中,生成所述目标激活函数;
17、其中,所述初始激活函数的求导操作如下:
18、
19、
20、
21、其中,q(x)=1+|a(x)|;a(x)=b1x+b2x2+…+bnxn。
22、可选地,所述初始标签预测模型包括若干层卷积层,所述将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型,包括:
23、分别获取与所述初始标签模型对应的卷积核尺寸、卷积核滑动步长以及填充数据;
24、将所述卷积核尺寸、所述卷积核滑动步长、所述填充数据以及所述目标激活函数添加至所述若干层卷积层,生成所述目标标签预测模型。
25、可选地,所述待测试图像包括交通灯测试图像,所述将所述待测试图像输入至所述目标标签预测模型中,输出针对所述待测试图像的预测标签,包括:
26、将所述交通灯测试图像输入至所述卷积层,在所述卷积层中分别对所述交通灯测试图像进行采样操作,生成交通灯特征图;
27、按照预设格式将所述交通灯特征图转换为字符串,并将所述字符串作为模型预测数据输入至所述目标标签预测模型中,获得所述交通灯特征图对应的预测标签。
28、可选地,每一所述卷积层包括编码器和解码器,所述采样操作包括上采样操作和下采样操作,所述将所述交通灯测试图像输入至所述卷积层,在所述卷积层中分别对所述交通灯测试图像进行采样操作,生成交通灯特征图,包括:
29、将所述交通灯测试图像输入至所述卷积层;
30、通过所述编码器对所述交通灯测试图像进行下采样操作,将所述交通灯测试图像的通道数量增加一倍,同时将所述交通灯测试图像的图像尺寸减小一半,获得交通灯采样图像;
31、通过所述解码器对所述交通灯采样图像进行上采样操作,将所述交通灯采样图像的通道数量减少一倍,同时将所述交通灯采样图像的图像尺寸增大一倍,生成所述交通灯特征图。
32、本申请第二方面提供一种标签预测的装置,包括:
33、信息获取模块,用于获取待测试图像和初始标签预测模型;
34、目标激活函数生成模块,用于构建针对所述初始标签预测模型的初始激活函数,并对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数;
35、目标标签预测模型生成模块,用于将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型;
36、预测标签输出模块,用于将所述待测试图像输入至所述目标标签预测模型中,输出针对所述待测试图像的预测标签。
37、本申请第三方面提供一种电子设备,包括:
38、处理器;以及
39、存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
40、本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
41、本申请提供的技术方案可以包括以下有益效果:
42、在本申请实施例中,能够获取待测试图像和初始标签预测模型,构建针对初始标签预测模型的初始激活函数,并对初始激活函数进行参数训练处理,获得与初始激活函数对应的目标激活函数,将目标激活函数添加至初始标签预测模型中,生成目标标签预测模型,将待测试图像输入至目标标签预测模型中,输出针对待测试图像的预测标签,从而通过对初始激活函数进行参数训练处理,获得可训练的目标激活函数,增强目标激活函数的非线性作用,并且通过将可训练的目标激活函数与初始标签预测模型进行结合,生成目标标签预本文档来自技高网...
【技术保护点】
1.一种标签预测的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述构建针对所述初始标签预测模型的初始激活函数,包括:
3.根据权利要求2所述的方法,其特征在于,所述初始激活函数的形式如下:
4.根据权利要求3所述的方法,其特征在于,所述参数训练处理包括求导操作,所述对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数,包括:
5.根据权利要求1所述的方法,其特征在于,所述初始标签预测模型包括若干层卷积层,所述将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型,包括:
6.根据权利要求5所述的方法,其特征在于,所述待测试图像包括交通灯测试图像,所述将所述待测试图像输入至所述目标标签预测模型中,输出针对所述待测试图像的预测标签,包括:
7.根据权利要求6所述的方法,其特征在于,每一所述卷积层包括编码器和解码器,所述采样操作包括上采样操作和下采样操作,所述将所述交通灯测试图像输入至所述卷积层,在所述卷积层中分别对所述交通灯测试图像进行采样操作,生成交
8.一种标签预测的装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
...【技术特征摘要】
1.一种标签预测的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述构建针对所述初始标签预测模型的初始激活函数,包括:
3.根据权利要求2所述的方法,其特征在于,所述初始激活函数的形式如下:
4.根据权利要求3所述的方法,其特征在于,所述参数训练处理包括求导操作,所述对所述初始激活函数进行参数训练处理,获得与所述初始激活函数对应的目标激活函数,包括:
5.根据权利要求1所述的方法,其特征在于,所述初始标签预测模型包括若干层卷积层,所述将所述目标激活函数添加至所述初始标签预测模型中,生成目标标签预测模型,包括:
6.根据权利要求5所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:李宁,贾双成,万如,
申请(专利权)人:智道网联科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。