【技术实现步骤摘要】
数据检索方法和装置、数据处理方法和装置、设备及介质
[0001]本公开涉及计算机
,特别是涉及一种数据检索方法、数据处理方法、数据检索装置、数据处理装置、计算机设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]随着网络技术的发展,搜索引擎的功能越来越强大,检索的内容也日益丰富,例如,语音、图片、视频、语音文字、用户行为等,都能够作为检索的样本数据提供给用户。在信息高速发展的时代,用户对于信息的需求在不断的增加。因此,如何能够更加快速、高效、准确地提供检索服务是当前搜索引擎技术面临的挑战。
技术实现思路
[0003]本公开提供一种数据检索方法、数据处理方法、数据检索装置、数据处理装置、计算机设备、计算机可读存储介质及计算机程序产品。
[0004]根据本公开的一方面,提供了一种数据检索方法,包括:响应于接收到待检索向量,确定待检索向量所对应的至少一个待检索存储介质,其中,至少一个待检索存储介质中的每一者均存储有至少一个样本向量,并且每个待检索存储介质均具有对应的存储控制器;针对至少一个待检索存储介质中的每一待检索存储介质,利用该待检索存储介质所对应的存储控制器,从该待检索存储介质所存储的至少一个样本向量中提取第一数量的样本向量,第一数量的样本向量与待检索向量的相似度高于至少一个样本向量中除第一数量的样本向量之外的其它样本向量与待检索向量的相似度;以及基于来自至少一个待检索存储介质中的每一者的第一数量的样本向量,确定待检索向量所对应的检索结果。
[0005]根据本公开的 ...
【技术保护点】
【技术特征摘要】
1.一种数据检索方法,包括:响应于接收到待检索向量,确定所述待检索向量所对应的至少一个待检索存储介质,其中,所述至少一个待检索存储介质中的每一者均存储有至少一个样本向量,并且每个待检索存储介质均具有对应的存储控制器;针对所述至少一个待检索存储介质中的每一待检索存储介质,利用该待检索存储介质所对应的存储控制器,从该待检索存储介质所存储的至少一个样本向量中提取第一数量的样本向量,所述第一数量的样本向量与所述待检索向量的相似度高于所述至少一个样本向量中除所述第一数量的样本向量之外的其它样本向量与所述待检索向量的相似度;以及基于来自所述至少一个待检索存储介质中的每一者的第一数量的样本向量,确定所述待检索向量所对应的检索结果。2.根据权利要求1所述的方法,其中,所述确定所述待检索向量所对应的至少一个待检索存储介质包括:在预存的多个候选质心向量中确定与所述待检索向量相匹配的至少一个匹配质心向量,其中,每个匹配质心向量均对应多个样本向量;以及将存储有所述多个样本向量中的至少一个样本向量的存储介质确定为待检索存储介质。3.根据权利要求2所述的方法,其中,所述至少一个匹配质心向量中的每一者为该匹配质心向量所对应的多个样本向量的均值。4.根据权利要求2所述的方法,其中,所述预存的多个候选质心向量具有对应的索引数据结构,并且其中,所述在预存的多个候选质心向量中确定与所述待检索向量相匹配的至少一个匹配质心向量包括:通过对所述索引数据结构的检索,从所述多个候选质心向量中确定至少一个匹配质心向量,所述至少一个匹配质心向量与所述待检索向量的相似度高于所述多个候选质心向量中除所述至少一个匹配质心向量之外的其它候选质心向量与所述待检索向量的相似度。5.根据权利要求1至4中任意一项所述的方法,其中,所述利用该待检索存储介质所对应的存储控制器,从该待检索存储介质所存储的至少一个样本向量中提取第一数量的样本向量包括:计算所述至少一个样本向量中的每一者与所述待检索向量的相似度值;以及通过对所述至少一个样本向量分别对应的相似度值的排序,从该待检索存储介质中提取所述第一数量的样本向量。6.根据权利要求5所述的方法,其中,所述存储控制器中包括用于缓存所述至少一个样本向量中的每一者的相似度值的缓存器。7.根据权利要求5所述的方法,其中,所述基于来自所述至少一个待检索存储介质中的每一者的第一数量的样本向量,确定所述待检索向量所对应的检索结果包括:通过对来自所述至少一个待检索存储介质中的每一者的每个样本向量的相似度值的排序,确定所述待检索向量所对应的检索结果。8.一种数据处理方法,包括:将第二数量的质心向量传输至多个存储介质中的每一者所对应的存储控制器,其中,所述第二数量的质心向量用于划分多个样本向量,每个存储介质均存储有所述多个样本向
量中的部分样本向量;针对所述多个存储介质中的每一存储介质,利用该存储介质所对应的存储控制器,计算所述第二数量的质心向量中的每一者与该存储介质中的每个样本向量之间的相似度;以及针对所述第二数量的质心向量中的每一质心向量执行修正操作,其中,所述修正操作包括:确定该质心向量所对应的至少一个相似样本向量,其中,每个相似样本向量与该质心向量之间的相似度不小于该相似样本向量与所述第二数量的质心向量中的其它质心向量之间的相似度;以及基于所述至少一个相似样本向量中的每一者与该质心向量...
【专利技术属性】
技术研发人员:廖振生,周莹,陈凯,
申请(专利权)人:瀚博半导体上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。