细粒度图像识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：23025350 阅读：35 留言：0更新日期：2020-01-03 17:01

本发明专利技术公开了一种细粒度图像识别方法、装置、计算机设备及存储介质，本发明专利技术中公开的方法包括：获取图像样本，并对图像分类属性进行标注；构建双线性卷积神经网络模型，将所述图像样本导入所述双线性卷积神经网络模型中训练，并获得细粒度图像识别模型；从排序和所属类别两个方面对所述细粒度图像识别模型进行约束；通过所述细粒度图像识别模型对待识别图像进行分类识别；本发明专利技术提出的方法，通过训练双线性卷积神经网络细粒度识别模型对图形进行分类，2个并联的卷积神经网络CNN A和卷积神经网络CNN B可以同时完成区域检测和特征提取，在节省人力成本的同时，提高了分类识别的准确率。

Fine-grained image recognition method, device, computer equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
细粒度图像识别方法、装置、计算机设备及存储介质
本专利技术涉及计算机图像识别
，具体涉及一种细粒度图像识别方法、装置、计算机设备及存储介质。
技术介绍
细粒度图像识别是目前计算机视觉领域非常热门的研究课题，细粒度图像识别的目的在于正确识别一个大类中的不同小类，例如不同类别型号的车辆、不同类别的鸟类等。细粒度图像识别的关键在于寻找存在细微差别的局部区域。相较于现有的粗粒度识别，细粒度图像识别对图像细分类识别更加精准。目前，传统图像识别算法存在对图像细分类识别准确率不高、依赖人工标注等问题。
技术实现思路
本专利技术的主要目的是提供一种细粒度图像识别方法、装置、计算机设备及存储介质，旨在解决传统图像识别算法存在对图像细分类识别准确率不高、依赖人工标注等问题。为实现上述目的，本专利技术提供一种细粒度图像识别方法，包括如下步骤：获取图像样本，并对图像分类属性进行标注；构建双线性卷积神经网络模型；将所述图像样本导入所述双线性卷积神经网络模型中训练，并获得细粒度图像识别模型，其中，所述双线性卷积神经网络模型包括依次连接的：2个并联的卷积神经网络CNNA和卷积神经网络CNNB、双线性池化层Bilinearpooling、归一化层LN和全连接层Fc；从排序和所属类别两个方面对所述细粒度图像识别模型进行约束；通过所述细粒度图像识别模型对通过图像采集模块获取的待识别图像进行分类识别。优选的，所述获取图像样本，并对图像分类属性进行标注与所述构建双线性...

【技术保护点】
1.一种细粒度图像识别方法，其特征在于，包括如下步骤：/n获取图像样本，并对图像分类属性进行标注；/n构建双线性卷积神经网络模型；/n将所述图像样本导入所述双线性卷积神经网络模型中训练，并获得细粒度图像识别模型，其中，所述双线性卷积神经网络模型包括依次连接的：2个并联的卷积神经网络CNN A和卷积神经网络CNN B、双线性池化层Bilinear pooling、归一化层LN和全连接层Fc；/n从排序和所属类别两个方面对所述细粒度图像识别模型进行约束；/n通过所述细粒度图像识别模型对通过图像采集模块获取的待识别图像进行分类识别。/n

【技术特征摘要】
1.一种细粒度图像识别方法，其特征在于，包括如下步骤：
获取图像样本，并对图像分类属性进行标注；
构建双线性卷积神经网络模型；
将所述图像样本导入所述双线性卷积神经网络模型中训练，并获得细粒度图像识别模型，其中，所述双线性卷积神经网络模型包括依次连接的：2个并联的卷积神经网络CNNA和卷积神经网络CNNB、双线性池化层Bilinearpooling、归一化层LN和全连接层Fc；
从排序和所属类别两个方面对所述细粒度图像识别模型进行约束；
通过所述细粒度图像识别模型对通过图像采集模块获取的待识别图像进行分类识别。

2.如权利要求1所述的细粒度图像识别方法，其特征在于，所述获取图像样本，并对图像分类属性进行标注与所述构建双线性卷积神经网络模型，之间还包括：
对所述图像样本做预处理，其中，所述预处理包括直方图均衡化、图像二值化。

3.如权利要求1所述的细粒度图像识别方法，其特征在于，所述将所述图像样本导入基于双线性卷积神经网络细粒度图像识别模型中训练，并获得细粒度图像识别模型，还包括：
将所述图像样本分别导入所述卷积神经网络CNNA和所述卷积神经网络CNNB，其中，所述卷积神经网络CNNA包括多个依次连接的卷池组；所述卷积神经网络CNNB也包括多个依次连接的所述卷池组；所述卷池组包括依次连接的卷积层Conv和池化层Pool；
通过所述卷积层Conv对所述图像样本进行卷积操作，并通过激活函数计算卷积的输出；
通过所述池化层Pool对完成卷积操作的图像进行下采样操作以减少图像尺寸大小；
所述卷积神经网络CNNA输出特征向量X1，所述卷积神经网络CNNB输出特征向量X2；
将所述特征向量X1和所述特征向量X2均输入所述双线性池化层Bilinearpooling；
所述双线性池化层Bilinearpooling采用外积形式将所述特征向量X1和所述特征向量X2进行融合，并得到融合后的特征向量X1TX2；
将所述特征向量X1TX2输入所述归一化层LN，所述归一化层LN对所述特征向量X1TX2进行快速收敛；
将收敛后的所述特征向量X1TX2输入全连接层Fc，所述全连接层Fc对收敛后的所述特征向量X1TX2进行分类。

4.如权利要求3所述的细粒度图像识别方法，其特征在于，若所述卷积神经网络CNNA和所述卷积神经网络CNNB为相同的卷积神经网络，则所述特征向量X1＝所述特征向量X2；取X＝X1＝X2，则所述特征向量X1TX2为XTX；所述全连接层Fc对收敛后的所述特征向量X1TX2进行分类，还包括...

【专利技术属性】
技术研发人员：罗茜，张斯尧，谢喜林，王思远，黄晋，文戎，张诚，
申请(专利权)人：深圳久凌软件技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人