一种基于VLAD的图像识别方法及装置制造方法及图纸

技术编号:32827344 阅读:18 留言:0更新日期:2022-03-26 20:31
本发明专利技术涉及图像处理技术领域,特别是指一种基于VLAD的图像识别方法及装置,方法包括:获取待分类图像;将所述待分类图像输入训练好的图像分类模型中,所述模型包括改进的AlexNet模块、VLAD模块、LDA降维模块以及SVM分类模块;基于所述AlexNet模块得到所述待分类图像的局部特征描述符;基于所述改进的AlexNet模块中的NetVLAD层,将所述局部特征描述符输入到所述VLAD模块,得到所述待分类图像的特征向量;将所述特征向量输入所述LDA降维模块,得到所述待分类图像的最终向量表示;将所述最终向量表示输入所述SVM分类模块,得到所述待分类图像的分类结果。采用本发明专利技术,可以在传统VLAD算法的基础提升图像分类时的准确率,同时也提升了算法的实现速度。同时也提升了算法的实现速度。同时也提升了算法的实现速度。

【技术实现步骤摘要】
一种基于VLAD的图像识别方法及装置


[0001]本专利技术涉及图像处理
,特别是指一种基于VLAD的图像识别方法及装置。

技术介绍

[0002]随着信息技术的发展与智能时代的到来,各种各样的数据资源数量得到了井喷式的爆发,图像类型的数据资源在其中占据着重要的地位。图像作为一种特殊的数据类型,包含着巨大的信息量,对其进行有效的挖掘和处理便是计算机视觉领域的核心问题。图像分类是计算机视觉中一个经典且重要的课题,是图像领域的基础任务,也是重要部分。尤其是在现在人工智能的技术背景下,图像分类技术的重要性稳步上升,从人物照片分类、人脸识别到智能驾驶道路场景的检测与识别等等,与人类生活结合的越来越紧密。
[0003]传统的图像分类技术以数字图像处理与识别为基础,融合机器视觉、机器学习、系统学等多门学科,通过人工提取特征信息来表示图像内容,根据这些特征来匹配和分类图像目标。但是随着大数据时代的到来,数据数量呈指数型增长,这大大的提升了传统算法的计算难度。深度学习能够通过多层神经网络对输入的图像提取抽象的高层特征,解决数据量大带来的问题,同时可以规避传统人工神经网络对图像进行分析计算时的高代价问题。
[0004]目前常见的编码方法有BOF(Bag of Features,词袋模型)、VLAD(Vector of Locally Aggregated Descriptors,局部描述符聚合向量)、FV(Fisher Vector,费雪尔向量):其中BOF是采用K

means建立码本,在映射时,利用视觉词袋量化图像特征,统计的词频直方图,该词频直方图即为编码后的特征向量,损失的信息较多;FV是对特征点用GMM(Gaussian Mixed Model,高斯混合模型)建模,GMM实际上也是一种聚类,只不过它是考虑了特征点到每个聚类中心的距离,也就是用所有聚类中心的线性组合去表示该特征点,在GMM建模的过程中也有损失信息;VLAD同样需要使用K

means建立码本,然后把每一个特征点分配给距离最近的聚类中心,计算特征描述子和聚类中心的残差和,考虑了特征点每一维的值,对图像局部信息有更细致的刻画。但是VLAD在计算特征点与聚类中心的距离的时候,有可能会遇到特征点与两个或多个聚类中心的距离相同甚至是相似的情况,这样无论将特征点归属于哪一个聚类中心都会导致信息损失。

技术实现思路

[0005]本专利技术实施例提供了一种基于VLAD的图像识别方法及装置。所述技术方案如下:
[0006]一方面,提供了一种基于VLAD的图像识别方法,该方法由电子设备实现,该方法包括:
[0007]获取待分类图像;
[0008]将所述待分类图像输入训练好的图像分类模型中,所述模型包括改进的AlexNet模块、VLAD模块、LDA降维模块以及SVM分类模块;
[0009]基于所述AlexNet模块得到所述待分类图像的局部特征描述符;
[0010]基于所述改进的AlexNet模块中的NetVLAD层,将所述局部特征描述符输入到所述
VLAD模块,得到所述待分类图像的特征向量;
[0011]将所述特征向量输入所述LDA降维模块,得到所述待分类图像的最终向量表示;
[0012]将所述最终向量表示输入所述SVM分类模块,得到所述待分类图像的分类结果。
[0013]可选地,所述改进的AlexNet模块包括五层卷积层以及NetVLAD层。
[0014]可选地,所述将所述局部特征描述符输入到所述VLAD模块,得到所述待分类图像的特征向量,包括:
[0015]通过K

means对所述局部特征描述符进行聚类,得到k个聚类中心c
k

[0016]计算每个局部特征描述符与所述聚类中心之间的距离,计算所述距离的期望值;
[0017]将所述k个聚类中心与所述局部特征描述符之间的距离分别与所述期望值进行比较,保留距离小于所述期望值的聚类中心;
[0018]通过VLAD核计算保留的聚类中心与局部特征描述符的残差和,将软分配到各个聚类中心;
[0019]通过计算得到矩阵V,将所述矩阵V中的每一列D维向量进行L2归一化处理,将所述矩阵V转换成向量,对所述向量整体进行L2归一化处理,得到所述待分类图像的特征向量,所述特征向量纬度为k
×
D。
[0020]可选地,所述计算所述距离的期望值,包括:
[0021]计算所述距离的期望值,根据所述期望值构建阶跃函数E(t),所述阶跃函数E(t)如下公式(1):
[0022]E(t)=ε(d
ik

E(d
ik
))
……
(1)
[0023]其中,d
ik
表示第i个局部特征描述符与第k个聚类中心之间的距离,E(d
ik
)表示距离d
ik
的期望值;当距离d
ik
小于或等于E(d
ik
)时,函数E(t)的取值为1,反之则函数E(t)的取值为0。
[0024]可选地,所述将软分配到各个聚类中心,包括:
[0025]通过下述公式(2)将软分配到各个聚类中心:
[0026][0027]其中w
k
=2αc
k
,b
k


α‖c
k
‖2,c
k
表示第k个聚类中心,α是一个正常数,控制响应随距离大小的衰减,T表示转置矩阵。
[0028]可选地,所述特征向量如下述公式(3):
[0029][0030]其中,V(j,k)表示特征向量,N表示局部特征描述符的数量。
[0031]另一方面,提供了一种基于VLAD的图像识别装置,该装置应用于基于VLAD的图像识别方法,该装置包括:
[0032]获取模块,用于获取待分类图像;
[0033]输入模块,用于将所述待分类图像输入训练好的图像分类模型中,所述模型包括
改进的AlexNet模块、VLAD模块、LDA降维模块以及SVM分类模块;
[0034]第一处理模块,用于基于所述AlexNet模块得到所述待分类图像的局部特征描述符;
[0035]第二处理模块,用于基于所述改进的AlexNet模块中的NetVLAD层,将所述局部特征描述符输入到所述VLAD模块,得到所述待分类图像的特征向量;
[0036]第三处理模块,用于将所述特征向量输入所述LDA降维模块,得到所述待分类图像的最终向量表示;
[0037]第四处理模块,用于将所述最终向量表示输入所述SVM分类模块,得到所述待分类图像的分类结果。
[0038]可选地,所述第二处理模块,用于:
[0039]通过K

means对所述局部特征描述符进行聚类,得到k个聚类中心c本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于VLAD的图像识别方法,其特征在于,所述方法包括:获取待分类图像;将所述待分类图像输入训练好的图像分类模型中,所述模型包括改进的AlexNet模块、VLAD模块、LDA降维模块以及SVM分类模块;基于所述AlexNet模块得到所述待分类图像的局部特征描述符;基于所述改进的AlexNet模块中的NetVLAD层,将所述局部特征描述符输入到所述VLAD模块,得到所述待分类图像的特征向量;将所述特征向量输入所述LDA降维模块,得到所述待分类图像的最终向量表示;将所述最终向量表示输入所述SVM分类模块,得到所述待分类图像的分类结果。2.根据权利要求1所述的方法,其特征在于,所述改进的AlexNet模块包括五层卷积层以及NetVLAD层。3.根据权利要求1所述的方法,其特征在于,所述将所述局部特征描述符输入到所述VLAD模块,得到所述待分类图像的特征向量,包括:通过K

means对所述局部特征描述符进行聚类,得到k个聚类中心c
k
;计算每个局部特征描述符与所述聚类中心之间的距离,计算所述距离的期望值;将所述k个聚类中心与所述局部特征描述符之间的距离分别与所述期望值进行比较,保留距离小于所述期望值的聚类中心;通过VLAD核计算保留的聚类中心与局部特征描述符的残差和,将软分配到各个聚类中心;通过计算得到矩阵V,将所述矩阵V中的每一列D维向量进行L2归一化处理,将所述矩阵V转换成向量,对所述向量整体进行L2归一化处理,得到所述待分类图像的特征向量,所述特征向量纬度为k
×
D。4.根据权利要求3所述的方法,其特征在于,所述计算所述距离的期望值,包括:计算所述距离的期望值,根据所述期望值构建阶跃函数E(t),所述阶跃函数E(t)如下公式(1):E(t)=ε(d
ik

E(d
ik
))
……
(1)其中,d
ik
表示第i个局部特征描述符与第k个聚类中心之间的距离,E(d
ik
)表示距离d
ik
的期望值;当距离d
ik
小于或等于E(d
ik
)时,函数E(t)的取值为1,反之则函数E(t)的取值为0。5.根据权利要求4所述的方法,其特征在于,所述将软分配到各个聚类中心,包括:通过下述公式(2)将软分配到...

【专利技术属性】
技术研发人员:许海涛余军林福宏周贤伟
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1