标签预测的方法、装置、电子设备及存储介质制造方法及图纸

技术编号：41662695 阅读：5 留言：0更新日期：2024-06-14 15:22

本申请涉及一种标签预测的方法、装置、电子设备及存储介质。该方法包括：获取待测试图像和初始标签预测模型，构建针对初始标签预测模型的初始激活函数，并对初始激活函数进行参数训练处理，获得与初始激活函数对应的目标激活函数，将目标激活函数添加至初始标签预测模型中，生成目标标签预测模型，将待测试图像输入至目标标签预测模型中，输出针对待测试图像的预测标签。本申请提供的方案，能够令目标标签预测模型具有较强的非线性分解能力，避免模型产生梯度消失的问题、提高模型的收敛速度以及收敛性，进而大大提高了目标标签预测模型识别图像标签的精准度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及模型数据处理，尤其涉及标签预测的方法、装置、电子设备及存储介质。

技术介绍

1、激活函数(activation functions)具有非线性建模的能力，其属于神经网络中不可或缺的部分，通过在神经网络中添加非线性的激活函数，令神经网络能够负责将神经元的输入映射到输出端。一般而言，神经网络常用的激活函数包括sigmoid函数(s型函数)、tanh函数(双曲正切函数)以及relu及其系列函数(线性整流函数)。

2、但是，在采用多层网络层的神经网络识别图像时，如果采用sigmoid函数和tanh函数进行映射，sigmoid函数和tanh函数计算出的梯度值比较小，而将多层数值小的梯度进行相乘后所得到的值是非常小的，这就使得神经网络产生了梯度消失的问题，神经网络无法继续进行模型训练，收敛速度也变得缓慢。如果采用relu及其系列函数进行映射，则容易出现偏移现象以及神经元死亡现象，这两种现象在一定程度上影响了神经网络的收敛性，从而由于神经网络容易出现梯度消失、收敛速度慢以及收敛性差，导致采用现有神经网络进行标签预测时图像识别准确度低。

技术实现思路

1、本申请提供一种标签预测的方法、装置、电子设备及存储介质，能够解决或者部分解决由于神经网络容易出现梯度消失、收敛速度慢以及收敛性差，导致采用现有神经网络进行标签预测时图像识别准确度低的问题。

2、本申请第一方面提供一种标签预测的方法，包括：

3、获取待测试图像和初始标签预测模型；

4、构建针

5、将所述目标激活函数添加至所述初始标签预测模型中，生成目标标签预测模型；

6、将所述待测试图像输入至所述目标标签预测模型中，输出针对所述待测试图像的预测标签。

7、可选地，所述构建针对所述初始标签预测模型的初始激活函数，包括：

8、获取两个多项式集合，所述多项式集合包括第一多项式集合和第二多项式集合，所述第一多项式集合和所述第二多项式集合包括若干个正交基函数；

9、采用所述第一多项式集合和所述第二多项式集合构造分数，将所述分数作为所述初始标签预测模型的初始激活函数；

10、其中，所述第一多项式集合为所述分数的分子，所述第二多项式集合为所述分数的分母。

11、可选地，所述初始激活函数的形式如下：

12、

13、其中，式子中的f(x)为所述初始激活函数，p(x)为所述第一多项式集合，q(x)为所述第二多项式集合，x为所述目标激活函数的输入参数，a0、a1、a2……am为所述p(x)的训练系数，b1、b2……bn为所述f(x)的训练系数，j、k均为x的阶次，m为所述p(x)中x的最高阶次，n为所述q(x)中x的最高阶次。

14、可选地，所述参数训练处理包括求导操作，所述对所述初始激活函数进行参数训练处理，获得与所述初始激活函数对应的目标激活函数，包括：

15、对所述初始激活函数进行求导操作，分别获得所述第一多项式集合和所述第二多项式集合的训练系数；

16、将所述训练系数代入至所述初始激活函数中，生成所述目标激活函数；

17、其中，所述初始激活函数的求导操作如下：

18、

19、

20、

21、其中，q(x)＝1+|a(x)|；a(x)＝b1x+b2x2+…+bnxn。

22、可选地，所述初始标签预测模型包括若干层卷积层，所述将所述目标激活函数添加至所述初始标签预测模型中，生成目标标签预测模型，包括：

23、分别获取与所述初始标签模型对应的卷积核尺寸、卷积核滑动步长以及填充数据；

24、将所述卷积核尺寸、所述卷积核滑动步长、所述填充数据以及所述目标激活函数添加至所述若干层卷积层，生成所述目标标签预测模型。

25、可选地，所述待测试图像包括交通灯测试图像，所述将所述待测试图像输入至所述目标标签预测模型中，输出针对所述待测试图像的预测标签，包括：

26、将所述交通灯测试图像输入至所述卷积层，在所述卷积层中分别对所述交通灯测试图像进行采样操作，生成交通灯特征图；

27、按照预设格式将所述交通灯特征图转换为字符串，并将所述字符串作为模型预测数据输入至所述目标标签预测模型中，获得所述交通灯特征图对应的预测标签。

28、可选地，每一所述卷积层包括编码器和解码器，所述采样操作包括上采样操作和下采样操作，所述将所述交通灯测试图像输入至所述卷积层，在所述卷积层中分别对所述交通灯测试图像进行采样操作，生成交通灯特征图，包括：

29、将所述交通灯测试图像输入至所述卷积层；

30、通过所述编码器对所述交通灯测试图像进行下采样操作，将所述交通灯测试图像的通道数量增加一倍，同时将所述交通灯测试图像的图像尺寸减小一半，获得交通灯采样图像；

31、通过所述解码器对所述交通灯采样图像进行上采样操作，将所述交通灯采样图像的通道数量减少一倍，同时将所述交通灯采样图像的图像尺寸增大一倍，生成所述交通灯特征图。

32、本申请第二方面提供一种标签预测的装置，包括：

33、信息获取模块，用于获取待测试图像和初始标签预测模型；

34、目标激活函数生成模块，用于构建针对所述初始标签预测模型的初始激活函数，并对所述初始激活函数进行参数训练处理，获得与所述初始激活函数对应的目标激活函数；

35、目标标签预测模型生成模块，用于将所述目标激活函数添加至所述初始标签预测模型中，生成目标标签预测模型；

36、预测标签输出模块，用于将所述待测试图像输入至所述目标标签预测模型中，输出针对所述待测试图像的预测标签。

37、本申请第三方面提供一种电子设备，包括：

38、处理器；以及

39、存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如上所述的方法。

40、本申请第四方面提供一种计算机可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如上所述的方法。

41、本申请提供的技术方案可以包括以下有益效果：

42、在本申请实施例中，能够获取待测试图像和初始标签预测模型，构建针对初始标签预测模型的初始激活函数，并对初始激活函数进行参数训练处理，获得与初始激活函数对应的目标激活函数，将目标激活函数添加至初始标签预测模型中，生成目标标签预测模型，将待测试图像输入至目标标签预测模型中，输出针对待测试图像的预测标签，从而通过对初始激活函数进行参数训练处理，获得可训练的目标激活函数，增强目标激活函数的非线性作用，并且通过将可训练的目标激活函数与初始标签预测模型进行结合，生成目标标签预本文档来自技高网...

【技术保护点】

1.一种标签预测的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述构建针对所述初始标签预测模型的初始激活函数，包括：

3.根据权利要求2所述的方法，其特征在于，所述初始激活函数的形式如下：

4.根据权利要求3所述的方法，其特征在于，所述参数训练处理包括求导操作，所述对所述初始激活函数进行参数训练处理，获得与所述初始激活函数对应的目标激活函数，包括：

5.根据权利要求1所述的方法，其特征在于，所述初始标签预测模型包括若干层卷积层，所述将所述目标激活函数添加至所述初始标签预测模型中，生成目标标签预测模型，包括：

6.根据权利要求5所述的方法，其特征在于，所述待测试图像包括交通灯测试图像，所述将所述待测试图像输入至所述目标标签预测模型中，输出针对所述待测试图像的预测标签，包括：

7.根据权利要求6所述的方法，其特征在于，每一所述卷积层包括编码器和解码器，所述采样操作包括上采样操作和下采样操作，所述将所述交通灯测试图像输入至所述卷积层，在所述卷积层中分别对所述交通灯测试图像进行采样操作，生成交通灯特征图，包括：

8.一种标签预测的装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种标签预测的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述构建针对所述初始标签预测模型的初始激活函数，包括：

3.根据权利要求2所述的方法，其特征在于，所述初始激活函数的形式如下：

6.根据权利要求5所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：李宁，贾双成，万如，
申请(专利权)人：智道网联科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人