基于卷积神经网络的图像识别方法、系统、终端和介质技术方案

技术编号:27459156 阅读:144 留言:0更新日期:2021-02-25 05:11
本发明专利技术公开了一种基于卷积神经网络的图像识别方法、系统、终端和介质,法包括:采用训练图像训练执行图像识别任务的卷积神经网络模型;将待识别的图像输入所述卷积神经网络模型,输出图像识别结果;其中,所述卷积神经网络模型包括卷积神经网络,该卷积神经网络中嵌入一个正交多路径区块,所述正交多路径区块结构包含多条路径,每一条路径上的参数相互正交,增加所述卷积神经网络的稳健性。本发明专利技术解决了目前普通的神经网络在图像识别任务下稳健性非常脆弱的问题,可以在维持图像识别的高准确率的同时,具有非常高的模型稳健性。具有非常高的模型稳健性。具有非常高的模型稳健性。

【技术实现步骤摘要】
基于卷积神经网络的图像识别方法、系统、终端和介质


[0001]本专利技术属于图像处理及模式识别的
,具体涉及的是一种基于卷积神经网络的图像识别方法、系统、终端和介质。

技术介绍

[0002]在图像处理与模式识别领域中,最为常见的一个任务便是图像识别任务。在经典的图像识别数据集如CIFAR10中,图像的类别包括10类:飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车,在更大的数据集上,如IMAGENET,则包含了高达2000多个类别共计1500万张图像。图像识别任务在本质上就是一个分类任务,研究者们需要求解出一个有效的分类器,来准确地将一张图像分类到它所属的真实类别中。早期的研究者们在图像识别任务的相关研究中,所采用的是一些简单的经典图像处理方法,比如高斯模糊、特征金字塔提取等等,研究者们往往将这些经典的图像处理手段结合在一起,再配合一些先验知识,最终只能得到一个性能有限的图像识别方法。
[0003]近年来,随着大规模数据集的出现和图形处理单元运算能力的进步,神经网络模型因其强大的学习能力,开始越来越广泛地被应用于各个科研领域,包括计算机视觉、自然语言处理和推荐系统等等。图像识别任务在引入神经网络模型之后,也再次出现了飞速的发展,用于图像识别的神经网络结构从最早的多层感知机(multi-layer perceptron,MLP)发展到级联的卷积神经网络(convolution neural network,CNN),再到具有残差连接结构的残差网络(residual network,resnet);神经网络的层数也从浅结构的5层网络发展到深达152层的残差网络;在CIFAR10和IMAGENET上,研究者们开发出更多新颖的结构和更深层的神经网络,一次又一次地刷新了这些数据集上的识别准确率。
[0004]目前,在图像识别任务的工程实践中,训练出一个性能卓越的基于卷积神经网络模型的图像分类器并不复杂。然而,研究者们发现,神经网络的泛化性能在一定情形下是非常脆弱的。以图像识别任务为例,给定一个充分训练的网络,这个网络已经具有了优秀的泛化性能,即,网络在训练数据上取得较高的识别率的同时,也能在从未见过的测试数据上取得不错的识别准确率。但是,研究者们发现,如果将训练数据或者测试数据中的图像做一些精心设计的修改,这样的修改可以是加上一点噪声,或者甚至是一个像素级别的修改,修改后的图像在肉眼上和原图几无区别,也即人类仍然可以正确识别分类这些修改后的图像,然而,神经网络却会以极高的置信度对这些修改后的图像给出错误的分类结果。这些修改后的图像被称为对抗样本(adversarial example),生成对抗样本的过程被称为对抗攻击(adversarial attack),神经网络在对抗样本上令人堪忧的识别能力引发了对神经网络稳健性(robustness)的研究,并且,对网络稳健性的研究,也有助于对神经网络本质的探索,其意义是非常重大的。

技术实现思路

[0005]针对上述卷积神经网络普遍存在的在图像识别任务中具有脆弱的稳健性的问题,
本专利技术提供一种基于卷积神经网络的图像识别方法、系统、终端和介质,该方法中采用了一种具有新颖结构的卷积神经网络作为图像分类器,可以保证卷积神经网络模型在干净的图像上保持高识别准确率的同时,也能在被扰动后的图像上维持高识别准确率,从而具有更强的稳健性。
[0006]本专利技术的第一方面,提供一种基于卷积神经网络的图像识别方法,包括:
[0007]采用训练图像训练执行图像识别任务的卷积神经网络模型;
[0008]将待识别的图像输入所述卷积神经网络模型,输出图像识别结果;
[0009]其中,所述卷积神经网络模型包括卷积神经网络,该卷积神经网络中嵌入一个正交多路径区块,所述正交多路径区块结构包含多条路径,每一条路径上的参数相互正交,增加所述卷积神经网络的稳健性。
[0010]可选地,所述训练出执行图像识别任务的卷积神经网络模型,包括:
[0011]S11,获取一批具有类别标记的训练图像;
[0012]S12,初始化一个卷积神经网络,在卷积神经网络中嵌入一个正交多路径区块,增加所述卷积神经网络的稳健性;
[0013]S13,从S11全部的图像中随机取一小批次图像,输入卷积神经网络,网络中正交多路径区块中的每条路径都会对图像输出一个预测的图像类别;
[0014]S14,对于每条路径,分别计算其输出的预测的图像类别与这批图像的真实类别之间的差异,对全部路径计算出的差异取加权平均;
[0015]S15,根据计算出的平均差异,用梯度下降法更新网络参数;
[0016]S16,重复S13到S15,直至平均差异收敛,或者设置一个足够多的重复次数,达到重复次数后便停止训练,从而获取到一个训练好的神经网络模型。
[0017]可选地,所述正交多路径区块嵌入在所述卷积神经网络的任意位置,具体根据具体使用业务需求确定。
[0018]可选地,所述正交多路径区块嵌入在所述卷积神经网络的最后线性层,则该区块中的每条路径即为一个线性层,这些路径上的线性层参数相互正交,这些线性层共享网络的前层。
[0019]可选地,所述正交多路径嵌入到在所述卷积神经网络的卷积层,则该区块中每条路径即为一个卷积层,这些路径上的卷积层参数相互正交,这些卷积层共享网络的剩余部分。
[0020]可选地,所述将待识别的图像输入所述卷积神经网络模型,输出图像识别结果,包括:
[0021]S21,将所述卷积神经网络模型部署到业务机器上;
[0022]S22,将待识别的图像输入到所述卷积神经网络模型中,所述卷积神经网络模型中的每条路径都会输出对该图像的预测结果;
[0023]S23,取这些路径的预测结果中出现次数最多的预测结果,作为该图像最终的预测结果。
[0024]可选地,所述方法还包括:在训练和识别之前,对所述训练图像、所述待识别的图像进行预处理和/或图像增强操作,包括:
[0025]所述预处理包括将图像尺寸缩放到同样大小、图像像素值大小的归一化;
[0026]所述图像增强操作包括在图像边缘补0像素再裁剪、随机水平翻转图像。
[0027]本专利技术的第二方面,提供一种基于卷积神经网络的图像识别系统,包括:
[0028]训练模块,该模块采用训练图像训练执行图像识别任务的卷积神经网络模型;
[0029]识别模块,该模块将待识别的图像输入所述卷积神经网络模型,输出图像识别结果;
[0030]其中,所述卷积神经网络模型包括卷积神经网络,该卷积神经网络中嵌入一个正交多路径区块,所述正交多路径区块结构包含多条路径,每一条路径上的参数相互正交,增加所述卷积神经网络的稳健性。
[0031]本专利技术的第三方面,提供一种电子终端,包括存储器、处理器及存储在存储器上并能在处理器上运行的计算机程序,所述处理器执行所述程序时用于执行上述的图像识别方法。
[0032]本专利技术的第四方面,提供一种计算机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括:采用训练图像训练执行图像识别任务的卷积神经网络模型;将待识别的图像输入所述卷积神经网络模型,输出图像识别结果;其中,所述卷积神经网络模型包括卷积神经网络,该卷积神经网络中嵌入一个正交多路径区块,所述正交多路径区块结构包含多条路径,每一条路径上的参数相互正交,增加所述卷积神经网络的稳健性。2.根据权利要求1所述的基于卷积神经网络的图像识别方法,其特征在于,所述训练出执行图像识别任务的卷积神经网络模型,包括:S11,获取一批具有类别标记的训练图像;S12,初始化一个卷积神经网络,在卷积神经网络中嵌入一个正交多路径区块,增加所述卷积神经网络的稳健性;S13,从S11全部的图像中随机取一小批次图像,输入卷积神经网络,网络中正交多路径区块中的每条路径都会对图像输出一个预测的图像类别;S14,对于每条路径,分别计算其输出的预测的图像类别与这批图像的真实类别之间的差异,对全部路径计算出的差异取加权平均;S15,根据计算出的平均差异,用梯度下降法更新网络参数;S16,重复S13到S15,直至平均差异收敛,或者设置一个足够多的重复次数,达到重复次数后便停止训练,从而获取到一个训练好的神经网络模型。3.根据权利要求2所述的基于卷积神经网络的图像识别方法,其特征在于,所述正交多路径区块嵌入在所述卷积神经网络的任意位置,具体的嵌入位置根据实际使用业务需求确定。4.根据权利要求3所述的基于卷积神经网络的图像识别方法,其特征在于,所述正交多路径区块嵌入在所述卷积神经网络的最后线性层,则该区块中的每条路径即为一个线性层,这些路径上的线性层参数相互正交,这些线性层共享网络的前层。5.根据权利要求3所述的基于卷积神经网络的图像识别方法,其特征在于,...

【专利技术属性】
技术研发人员:方堃杨杰
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1