System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术之基于检索式增强大模型的政务领域问答系统及其使用方法属于人工智能。
技术介绍
1、大模型具有大规模的参数量,并使用海量数据进行训练,具备广泛的通用领域知识,表现出强大的上下文内容理解、文本生成能力,在长文本总结、智能对话等应用领域中表现出色。不足在于大模型具有“幻觉”问题,虽然大语言模型几乎能够回答任何问题,但不保证完全准确,有时会给出错误的回答,此外,模型参数量巨大,也意味着使用专业领域数据进行微调的成本高昂,进而导致知识很难实时更新。以上的问题导致将大模型应用在知识密集型场景中表现不佳,尤其是政务问答场景。有别于日常聊天,政务问答场景涉及政策、办事流程的咨询,更需要大模型能针对相关政策给出准确的回答,同时因为政策文件经常更新,对模型知识的实时更新能力的要求更高。
2、针对政务问答场景,广泛使用的方法是检索式增强技术,即先使用检索器根据用户提问内容检索相关的政策文件,再将用户提问和相关的政策文件一起提供给生成器,利用大模型的上下文理解能力,结合相关文件内容给出准确答案,弥补了大模型在专业领域知识不足的缺陷,有效避免了“幻觉”问题和知识实时性更新的问题。现有专利申请cn118093844a(公布日:2024年5月28日)公开了一种基于人工智能大模型的政务智能客服实现方法,首先对政务文本数据进行标记,之后将政务数据向量化存储,完成政务数据准备。在问答阶段,首先将接收到的用户请求转化为查询向量,再通过与政务数据向量计算相似度的方式,选取出相关的政务数据,同用户请求一起组合为提示词,最后提供给大模型作出回答。现有
3、上述方案虽然通过检索式增强技术扩展了大模型在政务领域的应用,避免了使用政务数据微调,达到了节约计算资源的目的。但未考虑问题相关的地区或行政区划信息,忽略了不同省市、行政区划之间政策文件的差别,可能会根据不同地区或行政区划的相似政策给出错误回答。此外,政策咨询场景中容易出现某些热点问题被多个用户提问的情况,如果可以有效利用历史生成的回答,可以不调用大模型进行处理而直接给出有效回答,从而进一步节约计算资源。针对此问题亟待进一步研究。
技术实现思路
1、针对现有技术的不足,为了避免不同地区或行政区划之间的相关政策文件的差异,会给出错误回答,以及对提问较多的热点问题采用历史生成的模式进行回答等问题,现提出基于检索式增强大模型的政务领域问答系统及其使用方法。
2、基于检索式增强大模型的政务领域问答系统,包括数据库模块、历史记录匹配模块、第一大模型模块、政策查询模块、第二大模型模块;
3、所述数据库模块,包括语义缓存库、政策数据库和关系映射数据库;
4、所述数据库模块,用于存储政策文件数据、缓存历史问答记录、关联历史问答记录和相关政策文件;
5、所述历史记录匹配模块,用于将用户提问转换为文本形式;
6、所述第一大模型模块,具有较少参数的预训练大模型,用于构造关于问题是否需要地区或行政区划信息和政策文件的提示词,并提供给第一大模型根据提示词生成结果,结合问题和地区或行政区划信息构造关于查找涉及政策数据库的提示词,引导大模型生成政策数据库查询语句;
7、所述政策查询模块,用于使用第一大模型模块根据问题信息生成的政策数据库查询语句,从政策数据库中查找政策文件;
8、所述第二大模型模块,具有较多参数的预训练大模型,用于根据用户问题、第一大模型模块关于是否涉及地区或行政区划信息的结果、政策查询模块关于是否查找到政策文件的结果构造提示词,使第二大模型模块结合地区或行政区划信息和相关政策文件,引导大模型生成针对用户问题的回答内容。
9、所述语义缓存库,用于缓存语言模型的历史响应记录,其包括与全部用户的历史问答记录的向量数据和元数据;所述的语义缓存库中每一行表示一条历史响应记录,其中每一行记录的历史响应包括:语义缓存库行标识、历史问题的向量表示、问题的原始文本内容、针对此问题回答的向量表示、回答的原始文本内容、问答相关的政策数据库行标识。
10、所述的政策数据库,用于存储政策文件的向量数据和元数据,其包括一个或多个类型政策数据库,均使用向量数据来实现;所述政策数据库中每一行表示一项政策文件数据信息,其中每一行的政策文件数据信息包括:政策数据库行标识、政策文档的向量表示、政策文件原始文本内容。
11、所述的政策数据库中存储的政策文件能够实时更新,同时在政策文件更新后,与原政策文件相关的历史问答记录将被删除。
12、所述的类型政策数据库包括:动态信息、政府公开、行政处罚、政府合同、信息公开、办公厅解读文件、部门信息、政策解读、交易公告、政府中标、政府采购、国有挂牌、中标结果、合同公示、采购公告。
13、所述的关系映射数据库,用于表示语义缓存库和政策数据库之间的关系,实现语义缓存库和政策数据库的信息同步;所述的关系映射数据库中每一行表示一项政策文件和语义缓存库的对应关系,其每一行的对应关系包括:政策数据库编号、政策数据库行标识、语义缓存库行标识。
14、基于检索式增强大模型的政务领域问答系统的使用方法,具体包括以下步骤:
15、s1、创建政策数据库,对政策文件文本进行向量化处理,将向量数据添加到政策数据库中,同时将原始的政策文件文本内容作为元数据一并添加,新建语义缓存库和关系映射数据库。
16、s2、接收用户提问后,将用户提问内容进行向量化处理,历史记录匹配模块根据向量化处理后的问题,在语义缓存库中进行检索,如果检索到相关的历史问答记录,将记录中的答案作为结果直接返回给用户,结束针对此问题的处理流程;如果未检索到相关的历史记录,将问题发送给第一大模型模块。
17、s3、第一大模型模块首先构造关于问题是否需要地区或行政区划信息、政策文件的提示词,引导大模型判断是否需要地区或行政区划信息,以及是否需要政策文件;
18、如果需要提供地区或行政区划信息,向用户询问针对问题的地区或行政区划信息,获得地区或行政区划信息后,执行步骤s2的匹配历史问题记录流程,如果未检索到相关的历史记录,结合问题和获得的地区或行政区划信息构造关于查找涉及政策数据库的提示词,引导大模型生成政策数据库查询语句,根据查询语句,政策查询模块从政策数据库中查询对应的政策文件,将问题、地区或行政区划信息和政策数据库查询结果发送至第二大本文档来自技高网...
【技术保护点】
1.基于检索式增强大模型的政务领域问答系统,其特征在于,包括数据库模块、历史记录匹配模块、第一大模型模块、政策查询模块、第二大模型模块;
2.根据权利要求1所述的基于检索式增强大模型的政务领域问答系统,其特征在于,所述语义缓存库,用于缓存语言模型的历史响应记录,其包括与全部用户的历史问答记录的向量数据和元数据;所述的语义缓存库中每一行表示一条历史响应记录,其中每一行记录的历史响应包括:语义缓存库行标识、历史问题的向量表示、问题的原始文本内容、针对此问题回答的向量表示、回答的原始文本内容、问答相关的政策数据库行标识。
3.根据权利要求1所述的基于检索式增强大模型的政务领域问答系统,其特征在于,所述的政策数据库,用于存储政策文件的向量数据和元数据,其包括一个或多个类型政策数据库,均使用向量数据来实现;所述政策数据库中每一行表示一项政策文件数据信息,其中每一行的政策文件数据信息包括:政策数据库行标识、政策文档的向量表示、政策文件原始文本内容。
4.根据权利要求3所述的基于检索式增强大模型的政务领域问答系统,其特征在于,所述的政策数据库中存储的政策文件
5.根据权利要求3所述的基于检索式增强大模型的政务领域问答系统,其特征在于,所述的类型政策数据库包括:动态信息、政府公开、行政处罚、政府合同、信息公开、办公厅解读文件、部门信息、政策解读、交易公告、政府中标、政府采购、国有挂牌、中标结果、合同公示、采购公告。
6.根据权利要求1所述的基于检索式增强大模型的政务领域问答系统,其特征在于,所述的关系映射数据库,用于表示语义缓存库和政策数据库之间的关系,实现语义缓存库和政策数据库的信息同步;所述的关系映射数据库中每一行表示一项政策文件和语义缓存库的对应关系,其每一行的对应关系包括:政策数据库编号、政策数据库行标识、语义缓存库行标识。
7.基于检索式增强大模型的政务领域问答系统的使用方法,其特征在于,具体包括以下步骤:
...【技术特征摘要】
1.基于检索式增强大模型的政务领域问答系统,其特征在于,包括数据库模块、历史记录匹配模块、第一大模型模块、政策查询模块、第二大模型模块;
2.根据权利要求1所述的基于检索式增强大模型的政务领域问答系统,其特征在于,所述语义缓存库,用于缓存语言模型的历史响应记录,其包括与全部用户的历史问答记录的向量数据和元数据;所述的语义缓存库中每一行表示一条历史响应记录,其中每一行记录的历史响应包括:语义缓存库行标识、历史问题的向量表示、问题的原始文本内容、针对此问题回答的向量表示、回答的原始文本内容、问答相关的政策数据库行标识。
3.根据权利要求1所述的基于检索式增强大模型的政务领域问答系统,其特征在于,所述的政策数据库,用于存储政策文件的向量数据和元数据,其包括一个或多个类型政策数据库,均使用向量数据来实现;所述政策数据库中每一行表示一项政策文件数据信息,其中每一行的政策文件数据信息包括:政策数据库行标识、政策文档的向量表示、政策文件原始文本内容。
4...
【专利技术属性】
技术研发人员:贺亮,宋进,张巍元,王洪智,杜宛泽,林禹全,岳驰涛,柴源,康诗奇,
申请(专利权)人:吉林省吉林祥云信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。