System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 检索方法及电子设备技术_技高网

检索方法及电子设备技术

技术编号:41232566 阅读:12 留言:0更新日期:2024-05-09 23:48
本公开提供了一种检索方法,用于客户端,包括:获取用户输入的聊天内容;获取聊天内容对应的至少一个关键词;循环创建布隆过滤器,以形成布隆过滤器合集,布隆过滤器根据全部关键词中至少部分关键词创建;发送布隆过滤器合集;接收至少一个第一数据包,第一数据包通过布隆过滤器合集匹配得到;根据至少一个第一数据包和聊天内容,生成聊天内容对应的答复内容。本公开还提供了一种用于执行该方法的电子设备。

【技术实现步骤摘要】

本公开涉及数据检索与处理领域,具体涉及一种检索方法及电子设备


技术介绍

1、随着人工智能、自动控制、通信和计算机技术的快速发展,智能模型应答被越来越多地应用于工农业生产、建筑、物流、和日常生活等诸多领域。为了增强模型在某领域内的知识以及减少幻觉以及方便多客户端使用,需要在服务端部署知识库。由于需要对用户的隐私进行保护,用户在与知识库进行交互检索时,需要加密检索,而现有的加密检索方式中,实现都较为复杂,服务端开销高昂。


技术实现思路

1、本公开的一个方面提供了一种检索方法,用于客户端,包括:获取用户输入的聊天内容;获取聊天内容对应的至少一个关键词;循环创建布隆过滤器,以形成布隆过滤器合集,布隆过滤器根据全部关键词中至少部分关键词创建;发送布隆过滤器合集;接收至少一个第一数据包,第一数据包通过布隆过滤器合集匹配得到;根据至少一个第一数据包和聊天内容,生成聊天内容对应的答复内容。

2、可选地,布隆过滤器通过从全部关键词中选取k个关键词创建,每个关键词被选取的总次数为k,k为不大于关键词的总数的正整数。

3、可选地,用于客户端的检索方法还包括:获取待存储的文档;将待存储的文档进行预处理,以生成文档对应的第二数据包;生成第二数据包的匹配工具,匹配工具表征第二数据包对应文档的摘要信息以及文档对应的子文档的关键词信息;对第二数据包进行加密处理;将匹配工具添加至加密后的第二数据包中;发送第二数据包。

4、可选地,第二数据包包括文档的摘要、文档对应的至少一个子文档以及每个子文档的全部关键词,匹配工具包括n-gram布隆过滤器和至少一个计数最小草图,生成第二数据包的匹配工具包括:根据摘要生成n-gram布隆过滤器,n-gram布隆过滤器表征第二数据包对应的文档的摘要信息;针对每个子文档,根据子文档的全部关键词,生成计数最小草图,计数最小草图表征对应子文档的关键词信息。

5、可选地,第一数据包包括同属于单个文档的至少一个子文档,根据至少一个第一数据包和聊天内容,生成聊天内容对应的答复内容包括:根据聊天内容对应的全部关键词,从全部第一数据包中,查找出与聊天内容对应的全部关键词匹配度预设阈值的第一数据包作为目标数据包;根据聊天内容对应的全部关键词,从目标数据包中,查找出与聊天内容对应的全部关键词匹配度预设阈值的至少一个子文档作为目标子文档;根据目标子文档和聊天内容,生成聊天内容对应的答复内容。

6、可选地,第一数据包还包括单个文档的摘要,从全部第一数据包中,查找出与聊天内容对应的全部关键词匹配度最高的第一数据包作为目标数据包,包括:对每个第一数据包中的摘要进行解密;将聊天内容对应的全部关键词依次与每个解密后的摘要与进行匹配,获得第一目标摘要,第一目标摘要为匹配度大于预设阈值的摘要;将目标摘要对应的第一数据包作为目标数据包。

7、可选地,第一数据包还包括每个子文档的全部关键词,从目标数据包中,查找出与聊天内容对应的全部关键词匹配度最高的至少一个子文档作为目标子文档,包括:对每个子文档的全部关键词进行解密,获得每个子文档对应的关键词列表;将聊天内容对应的全部关键词依次与每个子文档对应的关键词列表匹配,获得至少一个目标关键词列表,目标关键词列表为匹配度大于预设阈值的关键词列表;将目标关键词列表对应的子文档作为目标子文档。

8、本公开的另一个方面提供了一种检索方法,用于服务端,包括:获取布隆过滤器合集,所述布隆过滤器合集根据用户输入的聊天内容的关键词生成;将布隆过滤器合集与预存储的多个第二数据包进行匹配,获得至少一个第一数据包,其中,第二数据包包括单个文档的摘要、单个文档的全部子文档和每个子文档的全部关键词,第一数据包包括与布隆过滤器合集的匹配度大于预设阈值的单个文档的摘要、至少一个子文档和每个子文档的全部关键词;发送第一数据包。

9、可选地,第二数据包还包括多个匹配工具,匹配工具表征第二数据包对应文档的摘要信息以及文档对应的子文档的关键词信息,将布隆过滤器合集与预存储的多个第二数据包进行匹配,获得至少一个第一数据包,包括:将布隆过滤器合集与每个第二数据包的多个匹配工具进行匹配,从全部第二数据包中获得匹配度大于预设阈值的摘要以及至少一个子文档;将从属于同一第二数据包且匹配度大于预设阈值的,摘要、至少一个子文档以及子文档对应的关键词整合为第一数据包。

10、本公开的另一个方面提供了一种检索装置,部署于客户端,包括:第一获取模块,用于获取用户输入的聊天内容;第二获取模块,用于获取聊天内容对应的至少一个关键词;创建模块,用于循环创建布隆过滤器,以形成布隆过滤器合集,布隆过滤器根据全部关键词中至少部分关键词创建;第一发送模块,用于发送布隆过滤器合集;接收模块,用于接收至少一个第一数据包,第一数据包通过布隆过滤器合集匹配得到;生成模块,用于根据至少一个第一数据包和聊天内容,生成聊天内容对应的答复内容。

11、本公开的另一个方面提供了一种检索装置,部署于服务端,包括:第三获取模块,用于获取布隆过滤器合集,所述布隆过滤器合集根据用户输入的聊天内容的关键词生成;匹配模块,用于将布隆过滤器合集与预存储的多个第二数据包进行匹配,获得至少一个第一数据包,其中,第二数据包包括单个文档的摘要、单个文档的全部子文档和每个子文档的全部关键词,第一数据包包括与布隆过滤器合集的匹配度大于预设阈值的单个文档的摘要、至少一个子文档和每个子文档的全部关键词;第二发送模块,用于发送第一数据包。

12、本公开的另一个方面提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的方法。

13、本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。

14、本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。

本文档来自技高网...

【技术保护点】

1.一种检索方法,用于客户端,包括:

2.根据权利要求1所述的方法,其中,所述布隆过滤器通过从全部所述关键词中选取K个所述关键词创建,每个所述关键词被选取的总次数为K,K为不大于所述关键词的总数的正整数。

3.根据权利要求1或2所述的方法,其中,还包括:

4.根据权利要求3所述的方法,其中,所述第二数据包包括所述文档的摘要、所述文档对应的至少一个子文档以及每个所述子文档的全部关键词,所述匹配工具包括n-gram布隆过滤器和至少一个计数最小草图,所述生成所述第二数据包的匹配工具包括:

5.根据权利要求1所述的方法,其中,所述第一数据包包括同属于单个文档的至少一个子文档,所述根据所述至少一个第一数据包和所述聊天内容,生成所述聊天内容对应的答复内容包括:

6.根据权利要求5所述的方法,其中,所述第一数据包还包括所述单个文档的摘要,所述从全部所述第一数据包中,查找出与所述聊天内容对应的全部关键词匹配度预设阈值的所述第一数据包作为目标数据包,包括:

7.根据权利要求5所述的方法,其中,所述第一数据包还包括每个所述子文档的全部关键词,所述从所述目标数据包中,查找出与所述聊天内容对应的全部关键词匹配度大于预设阈值的至少一个子文档作为目标子文档,包括:

8.一种检索方法,用于服务端,包括:

9.根据权利要求8所述的方法,其中,所述第二数据包还包括匹配工具,所述匹配工具表征所述第二数据包对应文档的摘要信息以及文档对应的子文档的关键词信息,所述将所述布隆过滤器合集与预存储的多个第二数据包进行匹配,获得至少一个第一数据包,包括:

10.一种电子设备,包括:

...

【技术特征摘要】

1.一种检索方法,用于客户端,包括:

2.根据权利要求1所述的方法,其中,所述布隆过滤器通过从全部所述关键词中选取k个所述关键词创建,每个所述关键词被选取的总次数为k,k为不大于所述关键词的总数的正整数。

3.根据权利要求1或2所述的方法,其中,还包括:

4.根据权利要求3所述的方法,其中,所述第二数据包包括所述文档的摘要、所述文档对应的至少一个子文档以及每个所述子文档的全部关键词,所述匹配工具包括n-gram布隆过滤器和至少一个计数最小草图,所述生成所述第二数据包的匹配工具包括:

5.根据权利要求1所述的方法,其中,所述第一数据包包括同属于单个文档的至少一个子文档,所述根据所述至少一个第一数据包和所述聊天内容,生成所述聊天内容对应的答复内容包括:

6.根据权利要...

【专利技术属性】
技术研发人员:朱鑫杰王云浩
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1