字典学习、视觉词袋特征提取方法及检索系统技术方案

技术编号：10423350 阅读：397 留言：0更新日期：2014-09-12 14:04

本发明专利技术提供一种字典学习方法，包括：1)基于维度将图像的局部特征向量分为第一分段和第二分段；2)用多个局部特征向量的第一分段构造第一数据矩阵，用多个局部特征向量的第二分段构造第二数据矩阵；3)对第一数据矩阵进行稀疏非负矩阵分解，得到用于对局部特征向量的第一分段进行稀疏编码的第一字典；对第二数据矩阵进行稀疏非负矩阵分解，得到用于对局部特征向量的第二分段进行稀疏编码的第二字典。本发明专利技术还提供了基于上述两个字典对图像局部特征进行分段稀疏表示的视觉词袋特征提取方法和相应的检索系统。本发明专利技术能够大幅减少内存占用，降低词表训练时间和特征提取时间，特别适合应用于移动终端。

全部详细技术资料下载

【技术实现步骤摘要】
字典学习、视觉词袋特征提取方法及检索系统
本专利技术涉及多媒体内容分析与检索
，具体地说，本专利技术涉及一种字典学习、视觉词袋特征提取方法及检索系统。
技术介绍
视觉搜索简单地说就是“以图搜图”。为实现视觉搜索，首先需要对大规模图像库提取特征建立索引库，在用户搜索时，对查询图像提取特征，在特征索引库中快速检索并按相关性(即相似度)排序，返回结果。这个结果是一个排序的库中图像列表，其中每个结果图像可能包含与查询图像相关、结合用户特征和搜索场景的关联信息。目前，面向PC的传统视觉搜索已经积累了大量算法和技术方案可供选择。然而，随着移动互联网的快速发展，人们对移动视觉搜索有了越来越高的需求。移动视觉搜索具有移动化、网络化和智能化等特点，它通过为用户提供“所见即所知”的新一代搜索服务，便捷地将身边现实世界的视觉对象关联至互联网信息世界的视觉对象，成为链接现实世界和信息世界的桥梁和纽带。图1示出了一种典型的移动视觉搜索的构架，它通过智能手机、平板电脑等移动终端获取现实世界中对象的图像或视频，然后进行特征提取，再通过移动互联网将所提取的特征传输至服务器，服务器基于大规模数据库进行大规模视觉搜索，再将搜索结果返回给移动终端，从而实现“所见即所知”的效果。例如在一个应用场景中，用手机拍摄一个古董，然后对所拍摄图片进行检索，即可快速便捷地获得该古董的名称、形状尺寸、历史典故、评论等相关信息，这极大地提升了用户体验，真正地实现了“所见即所知”的效果。可以说，移动视觉搜索极具想象空间，具有广阔的应用前景。然而，移动视觉搜索还面临一系列需要克服的难点，主要体现在：(1)移动...
字典学习、视觉词袋特征提取方法及检索系统

【技术保护点】
一种字典学习方法，其特征在于，包括下列步骤：1)基于维度将图像的局部特征向量分为第一分段和第二分段；2)用训练集中局部特征向量的第一分段作为列向量，构造第一数据矩阵，用训练集中局部特征向量的第二分段作为列向量，构造第二数据矩阵；3)对第一数据矩阵进行稀疏非负矩阵分解，得到用于对局部特征向量的第一分段进行稀疏编码的第一字典；对第二数据矩阵进行稀疏非负矩阵分解，得到用于对局部特征向量的第二分段进行稀疏编码的第二字典。

【技术特征摘要】
1.一种视觉词袋特征提取方法，包括下列步骤：1)从图像中提取局部特征点及其局部特征向量，并对该局部特征向量进行分段，得到相应的第一分段和第二分段；2)基于第一字典，对当前局部特征向量的第一分段进行稀疏编码，得到相应的第一稀疏编码系数向量，基于第二字典，对当前局部特征向量的第二分段进行稀疏编码，得到相应的第二稀疏编码系数向量；其中，第一字典和第二字典根据以下子步骤得出：2a)基于维度将图像的局部特征向量分为第一分段和第二分段；2b)用训练集中局部特征向量的第一分段作为列向量，构造第一数据矩阵，用训练集中局部特征向量的第二分段作为列向量，构造第二数据矩阵；2c)对第一数据矩阵进行稀疏非负矩阵分解，得到用于对局部特征向量的第一分段进行稀疏编码的第一字典；对第二数据矩阵进行稀疏非负矩阵分解，得到用于对局部特征向量的第二分段进行稀疏编码的第二字典；3)根据第一稀疏编码系数向量和第二稀疏编码系数向量中的非零元素所对应的字典基元索引号，将当前局部特征向量分配到视觉词袋中对应的视觉关键词；所述步骤3)中，找出第一稀疏编码系数向量中最大非零元素所对应的字典基元索引号I1，以及第二稀疏编码系数向量中最大非零元素所对应的字典基元索引号I2，根据索引号组合[I1、I2]将当前局部特征向量分配到视觉词袋中对应的一个视觉关键词；或者找出第一稀疏编码系数向量中最大的两个非零元素所对应的字典基元索引号I11和I12，以及第二稀疏编码系数向量中最大的两个非零元素所对应的字典基元索引号I21和I22，根据索引号组合[I11、I21]，[I11、I22]，[I12、I11]和[I12、I22]将当前局部特征向量软分配到视觉词袋中对应的四个视觉关键词。2.根据权利要求1所述的视觉词袋特征提取方法，其特征在于，所述步骤2c)中，稀疏非负矩阵分解采用在线学习算法、MOD算法或者KSVD算法实现。3.根据权利要求2所述的视觉...

【专利技术属性】
技术研发人员：唐胜，张勇东，李锦涛，徐作新，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人