一种基于多块分叉字典树索引结构的图像检索方法技术

技术编号：33541656 阅读：28 留言：0更新日期：2022-05-21 09:51

本发明专利技术提供了一种基于多块分叉字典树索引结构的图像检索方法，步骤包括：S1、获取预先构建的图像特征底库；其中，所述图像特征底库中包含图像库中各图像的二值特征向量；S2、对所述特征底库中的每个二值特征向量进行划分得到特征子串集合，并根据预设的字典树参数对各特征子串集合构建多块分叉字典树索引结构；S3、提取待检索图像的查询二值特征向量，并根据所述查询二值特征向量在多块分叉字典树索引结构中进行近邻检索，得到图像检索结果。本发明专利技术方案设计了一种高效的多块分叉字典树索引结构和检索方法，解决汉明空间下近邻搜索问题，减少海量图像特征数据带来的存储开销，提高检索速度。高检索速度。高检索速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多块分叉字典树索引结构的图像检索方法

[0001]本专利技术涉及海量图像检索
，尤其涉及一种基于多块分叉字典树索引结构的图像检索方法。

技术介绍

[0002]面向复杂场景的大规模目标检索任务中的一大挑战是如何在海量的图像底库下实现快速高效的目标图像检索。针对海量图像检索问题，大量的研究工作主要致力于提取图像中的区别特征并进行特征表达。早期的实现方式大多是基于尺度不变性和旋转不变性的特征描述子(例如SIFT，SURF)来实现的，与此同时，实现有效的特征压缩和特征降维对后续减小特征比对过程中的计算开销和响应时间具有重要意义，因此大量的研究工作主要围绕哈希算法来展开。哈希算法的目的是将特征向量从高维空间映射到低维空间，且能够最大程度的保持特征之间的近邻结构。哈希算法主要包括两大类别，数据无关算法和数据相关算法。数据无关算法不需要依赖任何训练数据，具有较高的灵活性，但往往需要较高的特征维度才能获取满足需求的性能。常见的算法包括Kernelized Locality
‑
Sensitive Hashing(KLSH)，Locality Sensitive Hashing(LSH)和Shift
‑
Invariant Kernels Hashing(SIKH)等。数据相关算法则是通过训练数据的方式来学习哈希函数，其性能要优于数据无关算法，大大推动了快速近邻检索算法的发展。例如，Gong和Lazebnik提出了Iterative Quantization(ITQ)特征量化算法，通过训练...

【技术保护点】

【技术特征摘要】
1.一种基于多块分叉字典树索引结构的图像检索方法，其特征在于，包括以下步骤：S1、获取预先构建的图像特征底库；其中，所述图像特征底库中包含图像库中各图像的二值特征向量；S2、对所述特征底库中的每个二值特征向量进行划分得到特征子串集合，并根据预设的字典树参数对各特征子串集合构建多块分叉字典树索引结构；S3、提取待检索图像的查询二值特征向量，并根据所述查询二值特征向量在多块分叉字典树索引结构中进行近邻检索，得到图像检索结果。2.根据权利要求1所述的基于多块分叉字典树索引结构的图像检索方法，其特征在于，所述字典树参数包括每个二值特征向量需要划分成的互斥特征子串数量m、每个特征子串划分成的快单元的比特数c以及建立多块分叉字典树所需要的比特数b；相应的，所述步骤S2包括以下子步骤：S21、从所述图像特征底库中获取所有图像的二值特征向量集合S22、将所述二值特征向量集合中的每个二值特征向量划分为m个互斥的二进制特征子串，并将相同位置的二进制特征子串合并成特征子串集合S23、对每个特征子串集合构建多块分叉字典树采用如下规则：针对特征子串集合中的每个特征子串取所述特征子串中连续c个比特组成一个快单元并判断该快单元是否存在，若不存在则在多块分叉字典树上新建一个分支用于存储所述快单元，判断构建多块分叉字典树的比特数是否等于b，若等于b则该多块分叉字典树已经达到最大深度，此时创建叶子结点并在叶子节点上建立哈希表，将满足前缀条件的所有特征子串都存储在该哈希表内，若不等于b则该多块分叉字典树还未达到最大深度，...

【专利技术属性】
技术研发人员：冯栋，刘治宇，刘浩，陈洪伟，张永，范超，
申请(专利权)人：青岛图灵科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人