基于稠密多路卷积网络的图片分类方法与系统技术方案

技术编号：26067170 阅读：19 留言：0更新日期：2020-10-28 16:40

本发明专利技术提出一种基于稠密多路卷积网络的图片分类方法和系统，包括：构建由分组、变换、聚合构成的基本单元，基于该基本单元构建新的稠密模块，将密集连接的卷积DenseNet网络网络框架中原始稠密模块替换为该新稠密模块，得到稠密多路卷积网络；使用已标记类别的图片数据作为训练数据，通过梯度反向传播更新该稠密多路卷积网络中的权重，训练该稠密多路卷积网络，得到图片分类模型；将待分类图片数据输入该分类模型，得到该待分类图片数据的分类结果。本发明专利技术提出的稠密多路卷积网络，对DenseNet网络的基本模块进行了改进和优化，以获取表达力更强的特征。

全部详细技术资料下载

【技术实现步骤摘要】
基于稠密多路卷积网络的图片分类方法与系统
本方法属于计算机视觉领域，特别涉及面向计算机视觉中图像分类的问题。
技术介绍
卷积神经网络(ConvolutionalNeuralNetworks，CNNs)在图片分类领域取得重大突破。目前许多图片分类方法是在CNN的基础上进行进一步的改进，利用增加网络宽度或深度、新型网络模块结构等方法提高分类性能。ResNeXt网络和DenseNet网络是近两年提出的具有优秀分类效果的卷积神经网络。ResNeXt网络是残差网络Resnet的变体，为了方便，下文称ResNeXt为残差网络。残差网络(ResNeXt)设计了一种同质的、多路的变换(Transformation)模块，提出了一个与深度、宽度不同的维度：基数(Cardinality)，构建了一种新的网络ResNeXt。该网络在2017年ImageNet大规模识别挑战赛的分类任务上取得了第2名的成绩，并通过实验表明增加网络的基数比增加网络的深度和宽度更有效。稠密网络DenseNet根据“层与层之间的短路连接(shortcutconnection,skipconnection)有助于使网络更深、准确率更高、训练更有效”这一观测，设计了一种稠密连接的模块，在这种模块中每层与其它所有层连接。在传统的卷积网络中，L层只有L个直接连接(当前层与下一层的连接算一次)，但在DenseNet中则共有L(L+1)/2个直接连接。对于每一层，模块内它前面的所有层是其输入，而该层又是模块内后面所有层的输入。这种连接方式能够减轻梯度消失，强化...

【技术保护点】
1.一种基于稠密多路卷积网络的图片分类方法，其特征在于，包括：/n步骤1、构建由分组、变换、聚合构成的基本单元，基于该基本单元构建新的稠密模块，将密集连接的卷积网络框架中原始稠密模块替换为该新稠密模块，得到稠密多路卷积网络；/n步骤2、使用已标记类别的图片数据作为训练数据，通过梯度反向传播更新该稠密多路卷积网络中的权重，训练该稠密多路卷积网络，得到图片分类模型；/n步骤3、将待分类图片数据输入该分类模型，得到该待分类图片数据的分类结果。/n

【技术特征摘要】
1.一种基于稠密多路卷积网络的图片分类方法，其特征在于，包括：
步骤1、构建由分组、变换、聚合构成的基本单元，基于该基本单元构建新的稠密模块，将密集连接的卷积网络框架中原始稠密模块替换为该新稠密模块，得到稠密多路卷积网络；
步骤2、使用已标记类别的图片数据作为训练数据，通过梯度反向传播更新该稠密多路卷积网络中的权重，训练该稠密多路卷积网络，得到图片分类模型；
步骤3、将待分类图片数据输入该分类模型，得到该待分类图片数据的分类结果。

2.如权利要求1所述的基于稠密多路卷积网络的图片分类方法，其特征在于，该聚合类型为串联聚合结构。

3.如权利要求1所述的基于稠密多路卷积网络的图片分类方法，其特征在于，该步骤1包括：通过在该基本模块前添加归一化模块、尺度调整层和激活函数层，得到该新稠密模块。

4.如权利要求1所述的基于稠密多路卷积网络的图片分类方法，其特征在于，训练该稠密多路卷积网络的过程具体为：训练数据输入该稠密多路卷积网络，得到模型预测值，通过对比该模型预测值与该已标记类别，得到损失，计算梯度并逐层反向传播更新该稠密多路卷积网络中的权重。

5.如权利要求1或4所述的基于稠密多路卷积网络的图片分类方法，其特征在于，该模型预测值与该已标记类别的交叉熵作为该损失函数。

【专利技术属性】
技术研发人员：刘春阳，张旭，陈志鹏，唐胜，王鹏，张翔宇，张丽，曹智，张勇东，
申请(专利权)人：国家计算机网络与信息安全管理中心，中国科学院计算技术研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人