System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,特别是涉及一种基于生成式大模型的内部交互问答辅助方法及系统。
技术介绍
1、在传统的技术背景下,开发人员若要查阅公司或团队内部的文档或者判定指标是否有问题,必须通过访问各种特定平台,并进行繁琐的信息检索和比对才能获取有用的信息。
2、这个过程通常耗时且效率不高,因为它需要大量地浏览、比较和在脑海中整理得出有用的信息。为了解决现有技术的缺点,本专利技术提出了一种生成式大模型与团队内部文档的结合方式。
技术实现思路
1、有鉴于此,本公开实施例提供一种基于生成式大模型的内部交互问答辅助方法,至少部分解决现有技术中存在的问题。
2、第一方面,本公开实施例提供了一种基于生成式大模型的内部交互问答辅助方法,所述方法包括以下步骤:
3、接收用户输入的查询语句;所述查询语句为人类自然语言;
4、将所述查询语句转变为1536维度的向量;
5、计算所述1536维度的向量与向量数据库中存储的文本向量的余弦相似度;
6、选取所述向量数据库中与所述查询语句转变的1536维度的向量余弦相似度最接近的预设数量文本向量的文本片段;
7、基于格式化模板字符串拼接方式将所述文本片段和所述查询语句拼接生成新的查询语句;
8、将所述新的查询语句送入大模型进行处理,生成答案,并将所述答案推送给用户。
9、根据本公开实施例的一种具体实现方式,所述方法还包括以下步骤:
10、将所有输入
11、对所述纯文本进行分割,每段的最大长度设为500个字符;
12、按照向量长度500token对分割后的所述纯文本再次进行切割;
13、将所述再次切割的文本转变为1536维度的向量;
14、将分割并向量化后的纯文本以及其对应的向量存储至向量数据库中根据本公开实施例的一种具体实现方式,所述方法还包括:
15、在大模型工作时选择调用函数,并对函数返回的结果进行语义理解和总结处理;
16、所述选择调用函数包括:通过prompt loop的方式查找符合条件的函数。
17、根据本公开实施例的一种具体实现方式,将所述查询语句转变为1536的高维度的向量,包括:
18、对人类自然语言进行预处理;
19、基于预处理结果进行分词,并构建词汇表;
20、将所述词汇表词组向量化,包括:根据不同业务场景选择算法;
21、进行序列填充或阶段填充。
22、根据本公开实施例的一种具体实现方式,所述余弦相似度的夹角越小,匹配越准确。
23、根据本公开实施例的一种具体实现方式,选择postgresql作为向量数据库管理系统。
24、根据本公开实施例的一种具体实现方式,所述方法还包括:将数据的检索行为以函数形式存储在数据库中。
25、第二方面,本公开实施例提供了一种基于生成式大模型的内部交互问答辅助系统,所述系统包括:
26、数据接收模块,被配置用于接收用户输入的查询语句;所述查询语句为人类自然语言;
27、向量转换模块,被配置用于将所述查询语句转变为1536维度的向量;
28、相似度计算模块,被配置用于计算所述1536维度的向量与向量数据库中存储的文本向量的余弦相似度;以及,
29、选取所述向量数据库中与所述查询语句转变的1536维度的向量余弦相似度最接近的预设数量文本向量的文本片段;
30、文本合成模块,被配置用于基于格式化模板字符串拼接方式将所述文本片段和所述查询语句拼接生成新的查询语句;
31、匹配模块,被配置用于将所述新的查询语句送入大模型进行处理,生成答案,并将所述答案推送给用户。
32、根据本公开实施例的一种具体实现方式,所述系统还包括:
33、向量数据库模块,被配置用于将所有输入的媒体内容转化为纯文本;
34、对所述纯文本进行分割,每段的最大长度设为500个字符;
35、按照向量长度500token对分割后的所述纯文本再次进行切割;
36、将所述再次切割的文本转变为1536维度的向量;以及,
37、将分割并向量化后的纯文本以及其对应的向量存储至向量数据库中。
38、第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
39、至少一个处理器;以及,
40、与所述至少一个处理器通信连接的存储器;其中,
41、所述存储器存储有能够被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器前述第一方面或第一方面的任一实现方式中的任一项所述的基于生成式大模型的内部交互问答辅助方法。
42、第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令当由至少一个处理器执行时使所述至少一个处理器执行前述第一方面或第一方面的任一实现方式中的基于生成式大模型的内部交互问答辅助方法。
43、第五方面,本公开实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的基于生成式大模型的内部交互问答辅助方法。
44、本公开实施例中的基于生成式大模型的内部交互问答辅助方法,能够高效地搜索和解析公司内部的多格式文档,通过调用自定义函数或使用自动化agent与其他系统交互,扩展了大模型的能力,可以回答更全面和精确的问题,并确保数据安全,从而显著提升工作效率并改善工作流程。
本文档来自技高网...【技术保护点】
1.一种基于生成式大模型的内部交互问答辅助方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的基于生成式大模型的内部交互问答辅助方法,其特征在于,所述方法还包括以下步骤:
3.根据权利要求1所述的基于生成式大模型的内部交互问答辅助方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的基于生成式大模型的内部交互问答辅助方法,其特征在于,所述余弦相似度的夹角越小,匹配越准确。
5.根据权利要求1所述的基于生成式大模型的内部交互问答辅助方法,其特征在于,选择PostgreSQL作为向量数据库管理系统。
6.根据权利要求1所述的基于生成式大模型的内部交互问答辅助方法,其特征在于,所述方法还包括:将数据的检索行为以函数形式存储在数据库中。
7.一种基于生成式大模型的内部交互问答辅助系统,其特征在于,所述系统包括:
8.根据权利要求7所述的基于生成式大模型的内部交互问答辅助系统,其特征在于,所述系统还包括:
9.一种电子设备,其特征在于,该电子设备包括:
【技术特征摘要】
1.一种基于生成式大模型的内部交互问答辅助方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的基于生成式大模型的内部交互问答辅助方法,其特征在于,所述方法还包括以下步骤:
3.根据权利要求1所述的基于生成式大模型的内部交互问答辅助方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的基于生成式大模型的内部交互问答辅助方法,其特征在于,所述余弦相似度的夹角越小,匹配越准确。
5.根据权利要求1所述的基于生成式大模型的...
【专利技术属性】
技术研发人员:曹悦,李帅,李松,
申请(专利权)人:艺龙网信息技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。