System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 索引更新方法、装置、电子设备和计算机可读存储介质制造方法及图纸_技高网

索引更新方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:45012676 阅读:2 留言:0更新日期:2025-04-18 16:58
本申请实施例公开了一种索引更新方法、装置、电子设备和计算机可读存储介质,该方法包括:获取当前索引版本等级,确定当前索引版本等级对应的当前向量索引;确定当前向量索引对应的标识信息,基于标识信息确定当前向量索引对应的历史向量索引以及历史向量索引的历史索引版本等级;当当前索引版本等级大于历史索引版本等级时,基于当前向量索引对历史向量索引进行更新。通过对向量索引设置索引版本等级,利用索引版本等级可以确定对应的向量索引,在确定当前索引版本等级是新版本等级后,通过当前向量索引对历史向量索引进行更新,避免了对文本索引的更新,解决了对索引进行更新时由于文本索引的无效更新导致耗费大量的资源的技术问题。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种索引更新方法、装置、电子设备和计算机可读存储介质


技术介绍

1、随着信息技术的不断发展,为了方便数据的快速查找,可以将数据按照特定格式组织在一起构建索引。如向量及文本索引在构建时是统一构建的,更新时往往需要对向量及文本索引进行全量更新,然而文本索引一般不会发生变化,导致对索引进行更新时会耗费大量的资源。


技术实现思路

1、本申请实施例提供一种索引更新方法、装置、电子设备和计算机可读存储介质,可以解决向量及文本索引在构建时是统一构建的,更新时往往需要对向量及文本索引进行全量更新,然而文本索引一般不会发生变化,导致对索引进行更新时会耗费大量的资源的技术问题。

2、第一方面,本申请实施例提供一种索引更新方法,所述方法包括:

3、获取当前索引版本等级,确定所述当前索引版本等级对应的当前向量索引;

4、确定所述当前向量索引对应的标识信息,基于所述标识信息确定所述当前向量索引对应的历史向量索引以及所述历史向量索引的历史索引版本等级;

5、当所述当前索引版本等级大于所述历史索引版本等级时,基于所述当前向量索引对所述历史向量索引进行更新。

6、可选地,所述确定所述当前向量索引对应的标识信息,包括:

7、确定所述当前向量索引的索引路径,基于所述索引路径查找所述当前向量索引对应的网址文件;

8、基于所述网址文件确定所述当前向量索引对应的标识信息。

9、可选地,所述基于所述标识信息确定所述当前向量索引对应的历史向量索引以及所述历史向量索引的历史索引版本等级,包括:

10、基于每个当前向量索引对应的网址文件确定网址文件列表;

11、获取所述历史向量索引对应的历史向量索引数据,通过所述标识信息对所述历史向量索引数据和所述网址文件列表进行匹配,得到所述当前向量索引对应的历史向量索引以及所述历史向量索引的历史索引版本等级。

12、可选地,所述基于每个当前向量索引对应的网址文件确定网址文件列表,包括:

13、基于每个当前向量索引对应网址文件的文件名和索引路径建立网址文件列表;所述网址文件包括网址信息、标识信息以及存储信息。

14、可选地,所述通过所述标识信息对历史向量索引数据和所述网址文件列表进行匹配,包括:

15、针对所述网址文件列表和所述标识信息构建目标索引,确定所述历史向量索引数据中每个历史向量索引的标识信息;

16、基于所述目标索引对每个历史向量索引的标识信息进行查询。

17、可选地,在获取当前索引版本等级之前,所述方法还包括:

18、对当前向量索引对应的当前索引信息单独存储;

19、对历史向量索引对应的历史索引信息单独存储。

20、可选地,所述基于所述当前向量索引对所述历史向量索引进行更新,包括:

21、基于所述当前向量索引对所述历史向量索引进行替换处理。

22、可选地,所述基于所述当前向量索引对所述历史向量索引进行替换处理,包括:

23、基于所述当前向量索引确定当前正排索引信息和当前倒排索引信息;

24、基于所述历史向量索引确定历史正排索引信息和历史倒排索引信息;

25、基于所述当前正排索引信息替换所述历史正排索引信息,基于所述当前倒排索引信息替换所述历史倒排索引信息。

26、第二方面,本申请实施例提供一种索引更新装置,所述装置包括:

27、获取模块,适于获取当前索引版本等级,确定所述当前索引版本等级对应的当前向量索引;

28、确定模块,适于确定所述当前向量索引对应的标识信息,基于所述标识信息确定所述当前向量索引对应的历史向量索引以及所述历史向量索引的历史索引版本等级;

29、更新模块,适于当所述当前索引版本等级大于所述历史索引版本等级时,基于所述当前向量索引对所述历史向量索引进行更新。

30、第三方面,本申请实施例提供一种电子设备,该电子设备包括:

31、处理器;以及

32、被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述中任一项所述的方法。

33、第四方面,本申请实施例提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现上述中任一项所述的方法。

34、本申请实施例一些实施例提供的技术方案带来的有益效果至少包括:首先确定当前索引版本等级,获取当前索引版本等级所对应的当前向量索引,之后,确定当前向量索引对应的标识信息,通过该标识信息获取当前向量索引对应的历史向量索引,并确定历史向量索引对应的历史索引版本等级,之后对当前索引版本等级和历史索引版本等级进行比较,在当前索引版本等级大于历史索引版本等级时,当前索引版本等级对应的当前向量索引对历史向量索引进行更新。本申请实施例通过对向量索引设置索引版本等级,利用索引版本等级可以确定对应的向量索引,并且可以通过比较当前索引版本等级和历史索引版本等级,在确定当前索引版本等级是新版本等级后,通过当前向量索引对历史向量索引进行更新,避免了对文本索引的更新,解决了向量及文本索引在构建时是统一构建的,更新时往往需要对向量及文本索引进行全量更新,然而文本索引一般不会发生变化,导致对索引进行更新时会耗费大量的资源的技术问题。

本文档来自技高网...

【技术保护点】

1.一种索引更新方法,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述确定所述当前向量索引对应的标识信息,包括:

3.根据权利要求2所述的方法,其中,所述基于所述标识信息确定所述当前向量索引对应的历史向量索引以及所述历史向量索引的历史索引版本等级,包括:

4.根据权利要求3所述的方法,其中,所述基于每个当前向量索引对应的网址文件确定网址文件列表,包括:

5.根据权利要求3所述的方法,其中,所述通过所述标识信息对历史向量索引数据和所述网址文件列表进行匹配,包括:

6.根据权利要求1所述的方法,其中,在获取当前索引版本等级之前,所述方法还包括:

7.根据权利要求1所述的方法,其中,所述基于所述当前向量索引对所述历史向量索引进行更新,包括:

8.一种索引更新装置,其中,所述装置包括:

9.一种电子设备,其中,该电子设备包括:

10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1至7中任一项所述的方法。

...

【技术特征摘要】

1.一种索引更新方法,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述确定所述当前向量索引对应的标识信息,包括:

3.根据权利要求2所述的方法,其中,所述基于所述标识信息确定所述当前向量索引对应的历史向量索引以及所述历史向量索引的历史索引版本等级,包括:

4.根据权利要求3所述的方法,其中,所述基于每个当前向量索引对应的网址文件确定网址文件列表,包括:

5.根据权利要求3所述的方法,其中,所述通过所述标识信息对历史向量索引数据和所述网址...

【专利技术属性】
技术研发人员:王勇高原
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1