模型训练、图像识别方法、终端设备及计算机存储介质技术

技术编号：41841783 阅读：3 留言：0更新日期：2024-06-27 18:22

本申请提供了一种基于图像识别的模型训练、图像识别方法、终端设备及计算机存储介质，模型训练方法包括：将图像训练样本输入到基础网络分支中，获取基础网络分支的输出基础输出特征；将训练样本输入到多尺度网络分支中，激活多尺度网络分支中每一卷积层中的基础卷积核以及所述其他大小的卷积核中的至少一个，获取多尺度网络分支的多尺度输出特征；将基础输出特征输入卷积神经网络的任务头，获取基础输出；将多尺度输出特征输入卷积神经网络的任务头，获取多尺度输出；利用基础输出和所述多尺度输出对基础卷积核的网络参数进行训练，获取最终的卷积神经网络。通过上述方式，提高训练效率，不引入额外的计算负担。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机视觉，特别是涉及一种基于图像识别的模型训练、图像识别方法、终端设备及计算机存储介质。

技术介绍

1、近年来，基于深度学习的方法极大地促进了计算机视觉领域的发展，比如图像分类、目标检测和语义分割等任务都得到了显著的性能提升，这些都得益于研究人员设计的优异的特征提取网络。由于目标具有不同大小的尺度，多尺度特征对于特征提取网络是重要的，比如inception结构，使用并行的不同大小的卷积核，提取了不同尺度的特征。尽管该结构能有效地提取多尺度的特征，但是现有技术中，对于计算能力有限的设备(比如嵌入式设备)，在推理时会带来不少的计算负担，对于实际的部署是不友好的。

技术实现思路

1、为解决上述技术问题，本申请提出了一种基于图像识别的模型训练、图像识别方法、终端设备及计算机存储介质。

2、为解决上述技术问题，本申请提出了一种模型训练方法，所述模型训练方法应用于一种卷积神经网络，所述卷积神经网络包括基础网络分支和多尺度网络分支，所述基础网络分支中的卷积层由基础卷积核组成，所述多尺度网络分支中的卷积层由所述基础卷积核以及其他大小的卷积核组成；所述模型训练方法包括：将图像训练样本输入到基础网络分支中，获取所述基础网络分支输出的基础输出特征；将所述训练样本输入到所述多尺度网络分支中，激活所述多尺度网络分支中每一卷积层中的基础卷积核以及所述其他大小的卷积核中的至少一个，获取所述多尺度网络分支的多尺度输出特征；将所述基础输出特征输入所述卷积神经网络的任务头，获取基础输出；将所述

3、其中，所述其他大小的卷积核均大于所述基础卷积核。

4、其中，所述其他大小的卷积核的卷积核参数包括共享卷积核参数和独有卷积核参数；所述模型训练方法还包括：获取所述基础卷积核的基础卷积核参数；将所述基础卷积核参数共享至同一卷积层的其他大小的卷积核作为共享卷积核参数。

5、其中，在训练过程中，所述基础卷积核转换为基础卷积核以及1×1卷积核并联的卷积核组合。

6、其中，所述激活所述多尺度网络分支中每一卷积层中的基础卷积核以及所述其他大小的卷积核中的至少一个，包括：根据其他大小的卷积核的预设选择比例激活所述多尺度网络分支中每一卷积层中的基础卷积核以及所述其他大小的卷积核中的至少一个。

7、其中，所述利用所述基础输出和所述多尺度输出对所述基础卷积核的网络参数进行训练，获取最终的卷积神经网络，包括：利用所述基础输出和样本标签对所述基础网络分支的基础卷积核进行训练，获得所述基础网络分支的基础卷积核的第一网络参数；获取所述多尺度输出和所述样本标签的多尺度损失；利用所述多尺度损失，以及所述第一网络参数对所述多尺度网络分支的基础卷积核进行训练，获得所述多尺度网络分支的基础卷积核的第二网络参数；按照所述第二网络参数获取最终的卷积神经网络。

8、其中，所述利用所述多尺度损失，以及所述第一网络参数对所述多尺度网络分支的基础卷积核进行训练，获得所述多尺度网络分支的基础卷积核的第二网络参数，包括：获取所述多尺度网络分支的基础卷积核的第三网络参数，以及其他大小的卷积核中激活的卷积核的第四网络参数；利用所述第三网络参数、所述第四网络参数、所述多尺度损失以及超参数对所述多尺度网络分支的基础卷积核进行训练，获得所述多尺度网络分支的基础卷积核的第二网络参数；其中，所述超参数用于控制多尺度网络分支对基础网络分支的影响。

9、为解决上述技术问题，本申请提供一种图像识别方法，所述图像识别方法包括：将待识别图像输入到卷积神经网络中，获取图像特征，其中，所述卷积神经网络由上述所述的模型训练方法获取，且所述卷积神经网络的每一层卷积层均采用所述基础卷积核；根据所述图像特征对所述待识别图像进行识别。

10、其中，所述卷积神经网络为图像分类网络、目标检测网络或者语义分割网络。

11、为解决上述技术问题，本申请提供一种终端设备，所述终端设备包括存储器以及与所述存储器耦接的处理器；其中，所述存储器用于存储程序数据，所述处理器用于执行所述程序数据以实现上述所述的模型训练方法和/或图像识别方法。

12、为解决上述技术问题，本申请提供一种计算机存储介质，所述计算机存储介质用于存储程序数据，所述程序数据在被计算机执行时，用以实现上述所述的模型训练方法和/或图像识别方法。

13、与现有技术相比，本申请的有益效果是：本申请的模型训练方法应用于一种卷积神经网络，卷积神经网络包括基础网络分支和多尺度网络分支，基础网络分支中的卷积层由基础卷积核组成，多尺度网络分支中的卷积层由所述基础卷积核以及其他大小的卷积核组成；模型训练方法包括：将图像训练样本输入到基础网络分支中，获取基础网络分支的输出基础输出特征；将训练样本输入到多尺度网络分支中，激活多尺度网络分支中每一卷积层中的基础卷积核以及所述其他大小的卷积核中的至少一个，获取多尺度网络分支的多尺度输出特征；将基础输出特征输入卷积神经网络的任务头，获取基础输出；将多尺度输出特征输入卷积神经网络的任务头，获取多尺度输出；利用基础输出和所述多尺度输出对基础卷积核的网络参数进行训练，获取最终的卷积神经网络。通过上述方式，终端设备把基础卷积核作为其他大尺度卷积核的子核，训练时利用其他大尺度卷积核的额外监督来优化基础卷积核的训练，提高训练效率，不引入额外的计算负担。

本文档来自技高网...

【技术保护点】

1.一种基于图像识别的模型训练方法，其特征在于，所述模型训练方法应用于一种卷积神经网络，所述卷积神经网络包括基础网络分支和多尺度网络分支，所述基础网络分支中的卷积层由基础卷积核组成，所述多尺度网络分支中的卷积层由所述基础卷积核以及其他大小的卷积核组成；所述模型训练方法包括：

2.根据权利要求1所述的模型训练方法，其特征在于

3.根据权利要求1所述的模型训练方法，其特征在于，

4.根据权利要求1所述的模型训练方法，其特征在于，

5.根据权利要求1所述的模型训练方法，其特征在于，

6.根据权利要求1所述的模型训练方法，其特征在于，

7.根据权利要求6所述的模型训练方法，其特征在于，

8.一种图像识别方法，其特征在于，所述图像识别方法包括：

9.一种终端设备，其特征在于，所述终端设备包括存储器以及与所述存储器耦接的处理器；

10.一种计算机存储介质，其特征在于，所述计算机存储介质用于存储程序数据，所述程序数据在被计算机执行时，用以实现如权利要求1至7任一项所述的模型训练方法和/或

...

【技术特征摘要】

2.根据权利要求1所述的模型训练方法，其特征在于

3.根据权利要求1所述的模型训练方法，其特征在于，

4.根据权利要求1所述的模型训练方法，其特征在于，

5.根据权利要求1所述的模型训练方...

【专利技术属性】
技术研发人员：李兴明，敦婧瑜，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人