System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息搜索方法及其装置制造方法及图纸_技高网

信息搜索方法及其装置制造方法及图纸

技术编号:41786816 阅读:5 留言:0更新日期:2024-06-24 20:14
本申请公开了一种信息搜索方法及其装置,属于信息搜索技术领域。信息搜索方法包括:获取用户的第一信息;将第一信息转换为第一语义向量;根据第一语义向量分别检索多个向量索引,得到参考文档片段集合;根据第一信息和参考文档片段集合,输出第一回复信息。

【技术实现步骤摘要】

本申请属于信息搜索,具体涉及一种信息搜索方法及其装置


技术介绍

1、相较于传统搜索引擎返回网页列表等文档让用户自己查看分析的方式,基于检索增强技术的大模型搜索引擎能够提供更直观易懂和准确的口语化回答,并且可以实现智能对话的效果。

2、然而,目前在通过大模型搜索引擎进行信息搜索的过程中,用户输入的问题信息大多为用户口语化的表达,与搜索引擎中的文档数据的语言形式差异较大,信息的字面意义也不一定相关,信息搜索时难以匹配到精准的关键词。例如,用户搜索“帮我在短信里找找上个月打电话花了多少钱”时,可能无法精准匹配到包含关键词“话费”的短信。这样,降低了信息搜索的准确率,降低了信息获取的效率。


技术实现思路

1、本申请实施例的目的是提供一种信息搜索方法及其装置,能够弥补用户输入信息与搜索引擎中的文档数据在语言形式的差异,提高信息搜索的准确率,提高信息获取的效率。

2、第一方面,本申请实施例提供了一种信息搜索方法,该方法包括:获取用户的第一信息;将第一信息转换为第一语义向量;根据第一语义向量分别检索多个向量索引,得到参考文档片段集合;根据第一信息和参考文档片段集合,输出第一回复信息。

3、第二方面,本申请实施例提供了一种信息搜索装置,该装置包括:获取单元,用于获取用户的第一信息;处理单元,用于将第一信息转换为第一语义向量;处理单元,还用于根据第一语义向量分别检索多个向量索引,得到参考文档片段集合;处理单元,还用于根据第一信息和参考文档片段集合,输出第一回复信息。

4、第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的信息搜索方法的步骤。

5、第四方面,本申请实施例提供了一种可读存储介质,该可读存储介质上存储有程序或指令,程序或指令被处理器执行时实现如第一方面的信息搜索方法的步骤。

6、第五方面,本申请实施例提供了一种芯片,该芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的信息搜索方法的步骤。

7、第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面的信息搜索方法的步骤。

8、在本申请实施例提供的信息搜索方法中,获取用户的第一信息;将第一信息转换为第一语义向量;根据第一语义向量分别检索多个向量索引,得到参考文档片段集合;根据第一信息和参考文档片段集合,输出第一回复信息。通过上述信息搜索方法,在搜索信息的过程中,将用户输入的第一信息转换为第一语义向量,进而基于第一语义向量分别检索多个向量索引,从多个向量索引中检索得到第一语义向量对应的参考文档片段集合,并结合用户的第一信息和参考文档片段集合,对用户的第一信息进行回答,输出第一回复信息。这样,在用户搜索信息时,通过不同维度的多个向量索引查找用户输入信息对应的文档片段,能够弥补用户输入信息与搜索引擎中的文档数据在语言形式的差异,查找到与用户输入信息存在高相关性的文档片段,提高了信息搜索的准确率,提高了信息获取的效率。

本文档来自技高网...

【技术保护点】

1.一种信息搜索方法,其特征在于,包括:

2.根据权利要求1所述的信息搜索方法,其特征在于,所述多个向量索引包括第一向量索引、第二向量索引和第三向量索引,所述根据所述第一语义向量分别检索多个向量索引前,所述信息搜索方法还包括:

3.根据权利要求2所述的信息搜索方法,其特征在于,所述基于滑动窗口算法分割每个所述样本文档,得到每个所述样本文档对应的多个文档片段,包括:

4.根据权利要求2所述的信息搜索方法,其特征在于,所述对每个所述文档片段进行第一扩展处理和第二扩展处理,得到每个所述文档片段对应的多个第二信息和多个第二回复信息,包括:

5.根据权利要求1至4中任一项所述的信息搜索方法,其特征在于,所述根据所述第一信息和所述参考文档片段集合,输出第一回复信息,包括:

6.一种信息搜索装置,其特征在于,包括:

7.根据权利要求6所述的信息搜索装置,其特征在于,所述多个向量索引包括第一向量索引、第二向量索引和第三向量索引,所述根据所述第一语义向量分别检索多个向量索引前,所述处理单元还用于:

8.根据权利要求7所述的信息搜索装置,其特征在于,所述处理单元具体用于:

9.根据权利要求7所述的信息搜索装置,其特征在于,所述处理单元具体用于:

10.根据权利要求6至9中任一项所述的信息搜索装置,其特征在于,所述处理单元具体用于:

...

【技术特征摘要】

1.一种信息搜索方法,其特征在于,包括:

2.根据权利要求1所述的信息搜索方法,其特征在于,所述多个向量索引包括第一向量索引、第二向量索引和第三向量索引,所述根据所述第一语义向量分别检索多个向量索引前,所述信息搜索方法还包括:

3.根据权利要求2所述的信息搜索方法,其特征在于,所述基于滑动窗口算法分割每个所述样本文档,得到每个所述样本文档对应的多个文档片段,包括:

4.根据权利要求2所述的信息搜索方法,其特征在于,所述对每个所述文档片段进行第一扩展处理和第二扩展处理,得到每个所述文档片段对应的多个第二信息和多个第二回复信息,包括:

5.根据权利要求1至4中任一项所...

【专利技术属性】
技术研发人员:李志帅
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1