一种基于VLAD的图像识别方法及装置制造方法及图纸

技术编号：32827344 阅读：18 留言：0更新日期：2022-03-26 20:31

本发明专利技术涉及图像处理技术领域，特别是指一种基于VLAD的图像识别方法及装置，方法包括：获取待分类图像；将所述待分类图像输入训练好的图像分类模型中，所述模型包括改进的AlexNet模块、VLAD模块、LDA降维模块以及SVM分类模块；基于所述AlexNet模块得到所述待分类图像的局部特征描述符；基于所述改进的AlexNet模块中的NetVLAD层，将所述局部特征描述符输入到所述VLAD模块，得到所述待分类图像的特征向量；将所述特征向量输入所述LDA降维模块，得到所述待分类图像的最终向量表示；将所述最终向量表示输入所述SVM分类模块，得到所述待分类图像的分类结果。采用本发明专利技术，可以在传统VLAD算法的基础提升图像分类时的准确率，同时也提升了算法的实现速度。同时也提升了算法的实现速度。同时也提升了算法的实现速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于VLAD的图像识别方法及装置

[0001]本专利技术涉及图像处理
，特别是指一种基于VLAD的图像识别方法及装置。

技术介绍

[0002]随着信息技术的发展与智能时代的到来，各种各样的数据资源数量得到了井喷式的爆发，图像类型的数据资源在其中占据着重要的地位。图像作为一种特殊的数据类型，包含着巨大的信息量，对其进行有效的挖掘和处理便是计算机视觉领域的核心问题。图像分类是计算机视觉中一个经典且重要的课题，是图像领域的基础任务，也是重要部分。尤其是在现在人工智能的技术背景下，图像分类技术的重要性稳步上升，从人物照片分类、人脸识别到智能驾驶道路场景的检测与识别等等，与人类生活结合的越来越紧密。
[0003]传统的图像分类技术以数字图像处理与识别为基础，融合机器视觉、机器学习、系统学等多门学科，通过人工提取特征信息来表示图像内容，根据这些特征来匹配和分类图像目标。但是随着大数据时代的到来，数据数量呈指数型增长，这大大的提升了传统算法的计算难度。深度学习能够通过多层神经网络对输入的图像提取抽象的高层特征，解决数据量大带来的问题，同时可以规避传统人工神经网络对图像进行分析计算时的高代价问题。
[0004]目前常见的编码方法有BOF(Bag of Features，词袋模型)、VLAD(Vector of Locally Aggregated Descriptors，局部描述符聚合向量)、FV(Fisher Vector，费雪尔向量)：其中BOF是采用K
‑
means建立码本，在映射时...

【技术保护点】

【技术特征摘要】
1.一种基于VLAD的图像识别方法，其特征在于，所述方法包括：获取待分类图像；将所述待分类图像输入训练好的图像分类模型中，所述模型包括改进的AlexNet模块、VLAD模块、LDA降维模块以及SVM分类模块；基于所述AlexNet模块得到所述待分类图像的局部特征描述符；基于所述改进的AlexNet模块中的NetVLAD层，将所述局部特征描述符输入到所述VLAD模块，得到所述待分类图像的特征向量；将所述特征向量输入所述LDA降维模块，得到所述待分类图像的最终向量表示；将所述最终向量表示输入所述SVM分类模块，得到所述待分类图像的分类结果。2.根据权利要求1所述的方法，其特征在于，所述改进的AlexNet模块包括五层卷积层以及NetVLAD层。3.根据权利要求1所述的方法，其特征在于，所述将所述局部特征描述符输入到所述VLAD模块，得到所述待分类图像的特征向量，包括：通过K
‑
means对所述局部特征描述符进行聚类，得到k个聚类中心c
k
；计算每个局部特征描述符与所述聚类中心之间的距离，计算所述距离的期望值；将所述k个聚类中心与所述局部特征描述符之间的距离分别与所述期望值进行比较，保留距离小于所述期望值的聚类中心；通过VLAD核计算保留的聚类中心与局部特征描述符的残差和，将软分配到各个聚类中心；通过计算得到矩阵V，将所述矩阵V中的每一列D维向量进行L2归一化处理，将所述矩阵V转换成向量，对所述向量整体进行L2归一化处理，得到所述待分类图像的特征向量，所述特征向量纬度为k
×
D。4.根据权利要求3所述的方法，其特征在于，所述计算所述距离的期望值，包括：计算所述距离的期望值，根据所述期望值构建阶跃函数E(t)，所述阶跃函数E(t)如下公式(1)：E(t)＝ε(d
ik
‑
E(d
ik
))
……
(1)其中，d
ik
表示第i个局部特征描述符与第k个聚类中心之间的距离，E(d
ik
)表示距离d
ik
的期望值；当距离d
ik
小于或等于E(d
ik
)时，函数E(t)的取值为1，反之则函数E(t)的取值为0。5.根据权利要求4所述的方法，其特征在于，所述将软分配到各个聚类中心，包括：通过下述公式(2)将软分配到...

【专利技术属性】
技术研发人员：许海涛，余军，林福宏，周贤伟，
申请(专利权)人：北京科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人