【技术实现步骤摘要】
向量模糊检索方法及NPU
[0001]本专利技术涉及信息
,具体涉及一种向量模糊检索方法及
NPU。
技术介绍
[0002]大模型时代,向量数据库展现出了无限的潜力
。
它为大型
AI
语言模型提供了记忆与灵魂,解决了模型“幻觉”的问题
。
随着
AI
技术的进步,向量数据库将在多个领域发挥关键作用,推动
AI
技术的发展
。
向量数据库的火爆发展和资本热度显示了其在市场上的重要地位,也为其未来发展奠定了坚实基础
。
因此,基于向量索引算法变得尤为重要
。
[0003]向量检索就是在一个给定向量数据集中,按照某种度量方式,检索出与查询向量相近的
K
个向量(
K
‑
Nearest Neighbor
,
KNN
),但由于
KNN
计算量过大,我们通常只关注近似近邻(
Approximate Nearest Neighbor
,
ANN
)问题
。
常见的向量度量有以下几种:欧式距离
、
余弦
、
内积
、
海明距离等
。
为了提高算法的速率,一些基于数据聚类的方法也随之产生如
IVFPQ
,
IVFFlat
等
。
虽然它们确实提高了算法速 ...
【技术保护点】
【技术特征摘要】
1.
一种向量模糊检索方法,其特征在于,包括以下步骤:获取查询向量;根据所述查询向量的维数和所述查询向量的分量的数值,将所述查询向量转化为第一归一化矩阵,根据向量数据库中的原始向量的维数和所述原始向量的分量的数值,将所述原始向量转化为第二归一化矩阵,所述第一归一化矩阵和所述第二归一化矩阵为同型矩阵;根据所述第一归一化矩阵和所述第二归一化矩阵,获取每一个所述第二归一化矩阵关于所述第一归一化矩阵的相似性得分;根据所述相似性得分,在所述原始向量中选取若干个候选向量,以所述候选向量为检索结果输出的依据
。2.
如权利要求1所述的向量模糊检索方法,其特征在于,将所述第一归一化矩阵和所述第二归一化矩阵的行的方向作为第一方向,或者,将所述第一归一化矩阵和所述第二归一化矩阵的列的方向作为所述第一方向,与所述第一方向垂直的方向作为第二方向;若所述查询向量和所述原始向量的任意一个分量的数值均小于所述查询向量的维数,则采用以下步骤将所述查询向量转化为所述第一归一化矩阵,将所述原始向量转化为所述第二归一化矩阵:将所述查询向量的维数作为所述第一归一化矩阵和所述第二归一化矩阵在所述第一方向上的元素个数,将所述查询向量和所述原始向量中最大分量的数值或所述查询向量的维数作为所述第一归一化矩阵和所述第二归一化矩阵在所述第二方向上的元素个数;以所述查询向量的每一个分量的序号作为所述第一归一化矩阵的在所述第一方向上的第一序号,并以该分量的数值作为所述第一归一化矩阵的在所述第二方向上的第二序号;以所述原始向量的每一个分量的序号作为所述第二归一化矩阵的在所述第一方向上第三序号,并以该分量的数值作为所述第二归一化矩阵的在所述第二方向上的第四序号;根据所述第一序号和第二序号,选取所述第一归一化矩阵对应位置的元素作为标记元素,根据所述第三序号和第四序号,选取所述第二归一化矩阵对应位置的元素作为所述标记元素
。3.
如权利要求1所述的向量模糊检索方法,其特征在于,将所述第一归一化矩阵和所述第二归一化矩阵的行的方向作为第一方向,或者,将所述第一归一化矩阵和所述第二归一化矩阵的列的方向作为所述第一方向,与所述第一方向垂直的方向作为第二方向;若所述查询向量和所述原始向量中存在数值大于所述查询向量的维数的分量,则采用以下步骤将所述查询向量转化为所述第一归一化矩阵,将所述原始向量转化为所述第二归一化矩阵:将所述查询向量的维数作为所述第一归一化矩阵和所述第二归一化矩阵在所述第一方向上的元素个数,将所述查询向量和所述原始向量中最大分量的数值的预设比例数作为所述第一归一化矩阵和所述第二归一化矩阵在所述第二方向上的元素个数;以所述查询向量的每一个分量的序号作为所述第一归一化矩阵的在所述第一方向上的第一序号,若该分量的数值小于所述预设比例数,则以该分量的数值作为所述第一归一化矩阵的在所述第二方向上的第二序号,若该分量的数值大于所述预设比例数,则以所述
第二方向上的元素个数作为所述第二序号;以所述原始向量的每一个分量的序号作为所述第二归一化矩阵的在所述第一方向上第三序号,若该分量的数值小于所述预设比例数,则以该分量的数值作为所述第二归一化矩阵的在所述第二方向上的第四序号,若该分量的数值大于所述预...
【专利技术属性】
技术研发人员:王鑫炜,李剑楠,苏鹏,黄炎,陈书俊,李恒,梁广涛,
申请(专利权)人:上海爱可生信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。