基于卷积神经网络的图像识别方法、系统、终端和介质技术方案

技术编号：27459156 阅读：144 留言：0更新日期：2021-02-25 05:11

本发明专利技术公开了一种基于卷积神经网络的图像识别方法、系统、终端和介质，法包括：采用训练图像训练执行图像识别任务的卷积神经网络模型；将待识别的图像输入所述卷积神经网络模型，输出图像识别结果；其中，所述卷积神经网络模型包括卷积神经网络，该卷积神经网络中嵌入一个正交多路径区块，所述正交多路径区块结构包含多条路径，每一条路径上的参数相互正交，增加所述卷积神经网络的稳健性。本发明专利技术解决了目前普通的神经网络在图像识别任务下稳健性非常脆弱的问题，可以在维持图像识别的高准确率的同时，具有非常高的模型稳健性。具有非常高的模型稳健性。具有非常高的模型稳健性。

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络的图像识别方法、系统、终端和介质

[0001]本专利技术属于图像处理及模式识别的
，具体涉及的是一种基于卷积神经网络的图像识别方法、系统、终端和介质。

技术介绍

[0002]在图像处理与模式识别领域中，最为常见的一个任务便是图像识别任务。在经典的图像识别数据集如CIFAR10中，图像的类别包括10类：飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车，在更大的数据集上，如IMAGENET，则包含了高达2000多个类别共计1500万张图像。图像识别任务在本质上就是一个分类任务，研究者们需要求解出一个有效的分类器，来准确地将一张图像分类到它所属的真实类别中。早期的研究者们在图像识别任务的相关研究中，所采用的是一些简单的经典图像处理方法，比如高斯模糊、特征金字塔提取等等，研究者们往往将这些经典的图像处理手段结合在一起，再配合一些先验知识，最终只能得到一个性能有限的图像识别方法。
[0003]近年来，随着大规模数据集的出现和图形处理单元运算能力的进步，神经网络模型因其强大的学习能力，开始越来越广泛地被应用于各个科研领域，包括计算机视觉、自然语言处理和推荐系统等等。图像识别任务在引入神经网络模型之后，也再次出现了飞速的发展，用于图像识别的神经网络结构从最早的多层感知机(multi-layer perceptron，MLP)发展到级联的卷积神经网络(convolution neural network，CNN)，再到具有残差连接结构的残差网络(residual network，resnet)；神经网络的...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的图像识别方法，其特征在于，包括：采用训练图像训练执行图像识别任务的卷积神经网络模型；将待识别的图像输入所述卷积神经网络模型，输出图像识别结果；其中，所述卷积神经网络模型包括卷积神经网络，该卷积神经网络中嵌入一个正交多路径区块，所述正交多路径区块结构包含多条路径，每一条路径上的参数相互正交，增加所述卷积神经网络的稳健性。2.根据权利要求1所述的基于卷积神经网络的图像识别方法，其特征在于，所述训练出执行图像识别任务的卷积神经网络模型，包括：S11，获取一批具有类别标记的训练图像；S12，初始化一个卷积神经网络，在卷积神经网络中嵌入一个正交多路径区块，增加所述卷积神经网络的稳健性；S13，从S11全部的图像中随机取一小批次图像，输入卷积神经网络，网络中正交多路径区块中的每条路径都会对图像输出一个预测的图像类别；S14，对于每条路径，分别计算其输出的预测的图像类别与这批图像的真实类别之间的差异，对全部路径计算出的差异取加权平均；S15，根据计算出的平均差异，用梯度下降法更新网络参数；S16，重复S13到S15，直至平均差异收敛，或者设置一个足够多的重复次数，达到重复次数后便停止训练，从而获取到一个训练好的神经网络模型。3.根据权利要求2所述的基于卷积神经网络的图像识别方法，其特征在于，所述正交多路径区块嵌入在所述卷积神经网络的任意位置，具体的嵌入位置根据实际使用业务需求确定。4.根据权利要求3所述的基于卷积神经网络的图像识别方法，其特征在于，所述正交多路径区块嵌入在所述卷积神经网络的最后线性层，则该区块中的每条路径即为一个线性层，这些路径上的线性层参数相互正交，这些线性层共享网络的前层。5.根据权利要求3所述的基于卷积神经网络的图像识别方法，其特征在于，...

【专利技术属性】
技术研发人员：方堃，杨杰，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人