System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于可信大模型的政务数据问答生成方法及系统技术方案_技高网

基于可信大模型的政务数据问答生成方法及系统技术方案

技术编号:43507537 阅读:11 留言:0更新日期:2024-11-29 17:10
本申请提供一种基于可信大模型的政务数据问答生成方法及系统,采用政务知识文本进行嵌入得到文本隐式表示集合,进行多次文本信息构建,以基于末尾一次文本信息构建得到的X段文本信息生成政务应答文本。每完成一次文本信息构建生成X段文本信息,可获取引导当下生成的X段文本信息中的任一前后两段文本信息之间的误差的段落间误差集合,以及通过段落间误差集合适应性更新文本隐式表示集合中的一个或多个文本隐式表示,同时将适应性更新后的文本隐式表示集合加载到政务可信大模型进行后一次文本信息构建,增加了模型的文本生成效果。基于适应性更新文本隐式表示集合,可以杜绝生成的文本同质化和重复化,政务应答文本的生成效果更佳。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种基于可信大模型的政务数据问答生成方法及系统


技术介绍

1、随着信息技术的飞速发展,政务数据的管理与应用在现代社会治理中扮演着日益重要的角色。政务部门需要处理大量的信息查询、政策解答等工作,传统的人工应答方式效率较低,难以满足日益增长的政务服务需求。近年来,大模型技术取得了显著的进展,为政务数据的智能化处理提供了新的思路。然而,现有的基于大模型的政务数据问答生成技术仍存在诸多问题。一方面,大模型在生成政务应答文本时,容易出现文本同质化和重复化的现象。这不仅影响了政务应答的质量,降低了政务服务的专业性和可信度,也无法满足用户多样化的需求。另一方面,在构建政务应答文本时,缺乏有效的机制来准确引导文本信息的生成,导致生成的文本可能与政务知识的关联性不强,无法准确回答政务相关的问题。为了提高政务数据问答生成的质量,改善政务服务的效率和效果,迫切需要一种新的政务数据问答生成方法,以克服现有技术中的上述缺陷。


技术实现思路

1、有鉴于此,本申请实施例至少提供一种基于可信大模型的政务数据问答生成方法及系统。本申请的技术方案是这样实现的:

2、一方面,本申请提供一种基于可信大模型的政务数据问答生成方法,包括:获取政务知识文本,所述政务知识文本用以引导拟生成的政务应答文本中的文本信息,所述政务应答文本包括x个文本段落,x≥2;根据所述政务知识文本嵌入得到文本隐式表示集合,所述文本隐式表示集合包括x个文本隐式表示,每个所述文本隐式表示都用以表征所述政务知识文本;所述文本隐式表示集合中的第x个文本隐式表示用以引导构建所述政务应答文本中的第x个文本段落,x为不大于x的正整数;根据所述文本隐式表示集合和政务可信大模型进行多次文本信息构建,每一次文本信息构建都构建得到x段文本信息,第x段文本信息对应所述第x个文本段落;其中,执行所述多次文本信息构建时,每完成一次文本信息构建得到x段文本信息,都获取当下的x段文本信息对应的段落间误差集合,以及根据所述段落间误差集合适应性更新所述文本隐式表示集合中的一个或多个文本隐式表示,同时将适应性更新后的文本隐式表示集合加载到所述政务可信大模型进行后一次文本信息构建;所述段落间误差集合用以表征相应的x段文本信息中的任一前后两段文本信息之间的误差;基于所述多次文本信息构建中的末尾一次文本信息构建得到的x段文本信息,生成得到所述政务应答文本。

3、另一方面,本申请提供一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上所述方法中的步骤。

4、本申请的有益效果为:本申请采用对用以引导拟生成的政务应答文本中的文本信息的政务知识文本进行嵌入得到文本隐式表示集合,以及通过文本隐式表示集合和政务可信大模型进行多次文本信息构建,以基于末尾一次文本信息构建得到的x段文本信息生成政务应答文本。其中,每完成一次文本信息构建生成x段文本信息,可获取引导当下生成的x段文本信息中的任一前后两段文本信息之间的误差的段落间误差集合,以及通过段落间误差集合适应性更新文本隐式表示集合中的一个或多个文本隐式表示,同时将适应性更新后的文本隐式表示集合加载到政务可信大模型进行后一次文本信息构建,令政务可信大模型在后一次文本信息构建时,可以依据适应性更新后的文本隐式表示集合确定当下的文本构建信息,以确定政务应答文本的构建情况,增加模型的文本生成效果。进一步地,基于适应性更新文本隐式表示集合,可以杜绝政务可信大模型应答生成的文本同质化和重复化,政务应答文本的生成效果更佳。

本文档来自技高网...

【技术保护点】

1.一种基于可信大模型的政务数据问答生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每一段文本信息包括多个文本元素的文本表示,所述获取当下的X段文本信息对应的段落间误差集合,包括:

3.根据权利要求2所述的方法,其特征在于,在进行所述文本处理之前,每一段文本信息中的任一文本元素的文本表示表征相应文本元素的文本语义信息;

4.根据权利要求3所述的方法,其特征在于,所述归纳分析包括平均值确定,所述获取所述第a个文本元素的文本表示调节变量,包括:

5.根据权利要求3所述的方法,其特征在于,当所述多个文本元素都完成游走时,所述对当下的X段文本信息进行文本处理,还包括:

6.根据权利要求2所述的方法,其特征在于,如果所述文本处理包括对每一段文本信息中的各个文本元素的文本表示进行滤波,则所述对当下的X段文本信息进行文本处理,包括:

7.根据权利要求1所述的方法,其特征在于,所述段落间误差集合包括一个或多个段落间误差值数组,一个段落间误差值数组对应一段文本信息,任一段落间误差值数组表示相应段文本信息与相邻一段文本信息的误差;

8.根据权利要求7所述的方法,其特征在于,所述基于当下游走到的段落间误差值数组对所述目标文本隐式表示进行适应性更新,获得适应性更新后的目标文本隐式表示,包括:

9.根据权利要求1所述的方法,其特征在于,所述根据所述文本隐式表示集合和政务可信大模型进行多次文本信息构建,包括:

10.一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至9任一项所述方法中的步骤。

...

【技术特征摘要】

1.一种基于可信大模型的政务数据问答生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每一段文本信息包括多个文本元素的文本表示,所述获取当下的x段文本信息对应的段落间误差集合,包括:

3.根据权利要求2所述的方法,其特征在于,在进行所述文本处理之前,每一段文本信息中的任一文本元素的文本表示表征相应文本元素的文本语义信息;

4.根据权利要求3所述的方法,其特征在于,所述归纳分析包括平均值确定,所述获取所述第a个文本元素的文本表示调节变量,包括:

5.根据权利要求3所述的方法,其特征在于,当所述多个文本元素都完成游走时,所述对当下的x段文本信息进行文本处理,还包括:

6.根据权利要求2所述的方法,其特征在于,如果所述文本处理包括对每一段文本信息中的各个文本元素的文...

【专利技术属性】
技术研发人员:杨挺樊继刚郭东升
申请(专利权)人:贵州华谊联盛科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1