System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于ai自动回复领域,具体是基于大模型与知识库的客服机器人自动回复系统。
技术介绍
1、在当今数字化时代,随着互联网技术的快速发展和大数据的应用普及,企业和组织越来越依赖于高效的客户服务系统来满足用户的需求;大规模预训练语言模型(如bert、gpt系列等)的出现极大地推动了自然语言处理(nlp)领域的发展。这些模型通过在海量文本数据上进行无监督预训练,能够学习到丰富的语言结构和语义信息,为后续的任务提供了强大的基础。这些模型可以用于各种下游任务,包括但不限于问答、文本生成、情感分析等,它们在提高对话质量和效率方面展现出了巨大潜力;尽管大模型能够在一定程度上理解上下文并生成连贯的回答,但在实际应用中,特别是在需要精确信息的场景下,仅依靠模型本身的知识往往是不够的。因此,构建和维护一个结构化的知识库变得至关重要。
2、申请号为cn2024104446509的专利技术专利公开了一种基于用户画像的机器人客服自动回复方法及系统,该专利技术通过获取用户画像的文本资料库,并构建自动回复模型,自动回复模型包括生成式自然语言分析器、检索式对话管理器和自然语言生成器,接收用户输入的问题文本,利用自然语言生成器计算与问题文本相似对话与其他相似对话的累积一致性值;输出最大的累积一致性值对应的相似对话;回复所述相似对话中所述用户输入问题对应的答案至用户;该专利技术在获取回复用户的回复文本时,通过对用户画像的文本资料库和问题文本分析得到相似对话对应的答案,得到的答案较为单一,若用户在询问当前问题前询问了其他相关资料,则无法结合用户的需
3、本专利技术提供了基于大模型与知识库的客服机器人自动回复系统,以解决以上技术问题。
技术实现思路
1、本专利技术旨在至少解决现有技术中存在的技术问题之一;为此,本专利技术提出了基于大模型与知识库的客服机器人自动回复系统,用于解决现有技术中当用户询问了其他相关知识时,因只考虑了问题本身,没有结合用户的询问记录进行回复的技术问题。
2、为实现上述目的,本专利技术的第一方面提供了基于大模型与知识库的客服机器人自动回复系统,包括:数据收集模块、知识库构建模块、问题优化模块和对话管理模块;
3、数据收集模块:用于收集用户发送的问题文本,提取综合数据;
4、知识库构建模块:用于根据综合数据构建知识库,知识库中包含储存有用户信息的历史用户数据;
5、问题优化模块:用于对问题文本进行优化处理得到标准问题文本,将标准问题文本输入知识库中匹配对应的匹配回答文本;
6、对话管理模块:用于基于匹配回答文本向用户进行回复并记录对话记录。
7、优选的,所述根据综合数据构建知识库,包括:
8、提取综合数据,所述综合数据包括历史问题文本、对应历史回答文本、相关搜索数据与各用户的历史对话记录;
9、构建初始知识库,并在初始知识库中设置独立用户数据单元;对综合数据进行预处理得到标准数据,将标准数据中的历史问题文本、历史回答文本和相关搜索数据输入初始知识库中,将历史对话记录存储在独立用户数据单元中,得到知识库。
10、优选的,所述对问题文本进行优化处理得到标准问题文本,包括:
11、提取问题文本;
12、通过自然语言处理工具对问题文本进行规范化处理,检测并修正问题文本中的错别字和语法错误,得到标准问题文本。
13、优选的,所述将标准问题文本输入知识库中匹配对应的匹配回答文本,包括:
14、提取标准问题文本;
15、识别标准问题文本中的问题关键词,匹配知识库中包含问题关键词的历史问题文本,将包含问题关键词的历史问题文本标记为匹配问题文本;通过embedding模型将标准问题文本转换为标准问题向量,将匹配问题文本转换为匹配问题向量;计算标准问题向量与匹配问题向量的向量相似度;根据向量相似度将匹配问题文本从大到小进行排序,将向量相似度最大的匹配问题文本标记为回答问题文本,将回答问题文本对应的历史回答文本标记为匹配回答文本。
16、优选的,所述计算标准问题向量与匹配问题向量的向量相似度,包括:
17、提取标准问题向量和匹配问题向量;
18、将标准问题向量标记为a,将匹配问题向量标记为b;通过余弦相似度公式abs=(a×b)/(|a||b|)计算得到向量a和向量b的向量相似度abs。
19、优选的,所述基于匹配回答文本向用户进行回复并记录对话记录,包括:
20、提取匹配回答文本;
21、通过自然语言处理工具对独立用户数据单元中的历史对话记录进行分析,获取历史对话记录的关键要素,将关键要素与匹配回答文本进行结合生成用户回复文本,在对话框中回复用户回复文本。
22、与现有技术相比,本专利技术的有益效果是:
23、1.本专利技术通过收集用户的问题文本与企业的综合数据,对综合数据进行预处理后用于构建知识库,并在知识库中设计独立用户数据单元用于存储用户的历史对话记录,系统能够更好地理解用户的偏好和需求,从而提供更加个性化的服务和建议,可以帮助系统更快地识别问题的性质,减少重复询问,提高问题解决的速度和效率;在对话框中得到用户发送的问题文本后,检测并修正问题文本中的错别字和语法错误,对问题文本进行优化,得到标准问题文本,可以确保系统正确理解用户的意图,避免因误解而导致的错误回答,有助于系统更准确地匹配合适的问题和答案,从而提供更高质量的回答;识别提取标准问题文本中的问题关键词,并在知识库中匹配包含问题关键词的匹配问题文本,并从中筛选得到回答问题文本,将回答问题文本对应的历史回答文本标记为匹配回答文本,系统能够更准确地理解用户的问题,从而提供更加相关和准确的回答,可以缩短寻找答案的时间,加速问题的解决过程,提高了互动的效率和满意度;对独立用户数据单元中的历史对话记录进行分析,提取其中的关键要素,并将关键要素与匹配回答文本进行结合生成用于回复用户的用户回复文本,可以帮助系统了解用户的偏好和需求,从而生成更加贴合用户需求的回复,能够提升用户体验。
24、2.本专利技术通过将标准问题文本与匹配问题文本转换成文本向量,并通过余弦相似度公式计算标准问题向量与匹配问题向量的向量相似度,根据向量相似度筛选得到知识库中最符合标准问题文本的回答问题文本,并将对应的历史回答文本标记为匹配回答文本,得到标准问题文本的标准答案,可以更准确地找到与用户问题最接近的回答,从而提高回答的准确性和相关性,有助于构建更加结构化和高效的数据库。
本文档来自技高网...【技术保护点】
1.基于大模型与知识库的客服机器人自动回复系统,其特征在于,包括:数据收集模块、知识库构建模块、问题优化模块和对话管理模块;
2.根据权利要求1所述的基于大模型与知识库的客服机器人自动回复系统,其特征在于,所述根据综合数据构建知识库,包括:
3.根据权利要求1所述的基于大模型与知识库的客服机器人自动回复系统,其特征在于,所述对问题文本进行优化处理得到标准问题文本,包括:
4.根据权利要求1所述的基于大模型与知识库的客服机器人自动回复系统,其特征在于,所述将标准问题文本输入知识库中匹配对应的匹配回答文本,包括:
5.根据权利要求4所述的基于大模型与知识库的客服机器人自动回复系统,其特征在于,所述计算标准问题向量与匹配问题向量的向量相似度,包括:
6.根据权利要求1所述的基于大模型与知识库的客服机器人自动回复系统,其特征在于,所述基于匹配回答文本向用户进行回复并记录对话记录,包括:
【技术特征摘要】
1.基于大模型与知识库的客服机器人自动回复系统,其特征在于,包括:数据收集模块、知识库构建模块、问题优化模块和对话管理模块;
2.根据权利要求1所述的基于大模型与知识库的客服机器人自动回复系统,其特征在于,所述根据综合数据构建知识库,包括:
3.根据权利要求1所述的基于大模型与知识库的客服机器人自动回复系统,其特征在于,所述对问题文本进行优化处理得到标准问题文本,包括:
4.根据权利要...
【专利技术属性】
技术研发人员:朱国正,马冰,马升,徐寒,
申请(专利权)人:合肥马道信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。