System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,特别是涉及一种对话数据处理方法、系统和计算机设备。
技术介绍
1、人工智能
中的大模型在语言理解、交互和推理方面表现出的非凡能力,广泛应用于对话、信息支持和决策帮助、代码生成等自然语言处理领域。因此,关于增强大模型生成内容的准确性已经成为尤为重要的问题之一。
2、现有的大模型问答系统大部分都是进行普遍的优化,在提高泛化推理能力的同时,在各个特定专业领域上的表现却难以满足基准需要。如进行具有数字经济、科技创新、金融分析等相关背景知识的问答场景,往往需要在问答时输入大量前置信息才能提高回答的准确度,这导致了使用体验和对话效果的下降。并且大模型训练时间成本较高,大模型知识的实时信息水准受限于预训练模型的知识新颖度,这导致遇到用户的实时性要求时,存在难以抽取和搜索不准确或者单次搜索结果不可靠的问题。
技术实现思路
1、基于此,本申请目的在于提供了一种确保更精确回答质量的对话数据处理方法、装置和计算机设备,来解决上述
技术介绍
中提及的技术问题。
2、第一方面,本申请提供了一种对话数据处理方法。包括:
3、获取用户的对话数据和确定的分析模式,所述分析模式关联模型控制参数;
4、通过目标大模型和所述模型控制参数对所述对话数据进行初步识别,得到初始结果;所述初始结果包括与需求实时性相关的内容指标;
5、基于所述内容指标从向量数据库获取关联数据,并通过目标大模型对所述关联数据进行再次识别,得到目标结果。
7、在一个实施例中,通过所述当前语料数据集对初始大模型进行训练,得到当前大模型,包括:对所述当前语料数据集进行预处理;所述预处理包括语料批处理、语料归类结构化和清洗中的至少一种;确定所述初始专家大模型的训练参数;所述训练参数包括学习率、采样参数和网络参数中的至少一种;通过预处理后的当前语料数据集对所述训练参数进行更新,直到达到训练停止条件时停止,得到训练好的当前大模型。
8、在一个实施例中,对所述当前语料数据集进行预处理,包括:若所述当前语料数据集中的数据为复杂文本,将所述复杂文本转换成初始文本,并利用本地大模型对初始文本进行补充,得到有效文本;根据领域重点和语料特征,将所述有效文本进行语料归类结构化。
9、在一个实施例中,上述方法还包括:确定所述当前语料数据集对应的轮次数;当所述轮次数大于预设值时,确定所述初始大模型进行所述轮次数训练时分别对应的子模型;从多个所述子模型中筛选出当前大模型。
10、在一个实施例中,内容指标包括内容词组和相关性指标;向量数据库包括多个集合;所述基于所述内容指标从向量数据库获取关联数据,包括:当相关性指标大于预设值时,根据所述内容词组从向量数据库的集合中查询关联数据。
11、在一个实施例中,上述方法还包括:当相关性指标大于目标值或从向量数据库的集合中查询的关联数据为空时,触发对向量数据库的更新操作;更新后的向量数据库用于获取新的关联数据。
12、在一个实施例中,向量数据库基于本地大模型进行了初始化;训练目标大模型中的最高层级的语料数据集为向量数据库的初始语料;触发对所述向量数据库的更新操作,包括:确定对所述内容词组进行分词处理后的关键词;根据关键词进行联网搜索,并基于预设权重名单确定更新数据;生成所述更新数据关联的交互指令,以使所述更新数据存入所述向量数据库相应的集合中。
13、在一个实施例中,初始结果还包括初始回答;上述方法还包括:当所述相关性指标小于预设值时,将所述初始回答进行格式解析,并调用渲染器进行用户界面展示。
14、第二方面,本申请还提供了一种对话数据处理系统,所述系统包括前端、目标大模型、向量数据库和后端,其中:
15、前端,用于获取用户的对话数据和确定的分析模式,所述分析模式关联模型控制参数;
16、目标大模型,用于基于所述模型控制参数对所述对话数据进行初步识别,得到初始结果;所述初始结果包括与需求实时性相关的内容指标;
17、后端,用于基于所述初始结果进行接口调用,以触发对所述向量数据库的查询指令或更新指令;
18、向量数据库,用于响应于查询指令并根据所述内容指标确定关联数据;
19、目标大模型,还用于对所述关联数据进行再次识别,得到目标结果。
20、第三方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以上对话数据处理方法的步骤。
21、第四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现以上对话数据处理方法的步骤。
22、上述对话数据处理方法、系统、计算机设备和可读存储介质,通过两阶段的识别过程,首先使用目标大模型进行初步识别,然后基于实时性相关的内容指标进行数据筛选和向量数据库查询,最后回送目标大模型进行再次识别,可以更精细准确地获取目标结果。并且识别过程从自训练的目标大模型的定位出发,在专业领域补充专家知识外挂的向量数据库基础上,能在用户对话的过程逐步更新数据,补齐了实时性不足的短板。
本文档来自技高网...【技术保护点】
1.一种对话数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标大模型通过多种语料数据集预先训练得到;不同语料数据集之间存在层级关系;层级关系通过数据所表征的特征程度来体现;所述目标大模型的训练过程包括:
3.根据权利要求2所述的方法,其特征在于,所述通过所述当前语料数据集对初始大模型进行训练,得到当前大模型,包括:
4.根据权利要求3所述的方法,其特征在于,所述对所述当前语料数据集进行预处理,包括:
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述内容指标包括内容词组和相关性指标;所述向量数据库包括多个集合;所述基于所述内容指标从向量数据库获取关联数据,包括:
7.根据权利要求6所述的方法,其特征在于,所述向量数据库基于本地大模型进行了初始化;训练所述目标大模型中的最高层级的语料数据集为所述向量数据库的初始语料;所述触发对所述向量数据库的更新操作,包括:
8.根据权利要求6所述的方法,其特征在于,所
9.一种对话数据处理系统,其特征在于,所述系统包括前端、目标大模型、向量数据库和后端,其中:
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种对话数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述目标大模型通过多种语料数据集预先训练得到;不同语料数据集之间存在层级关系;层级关系通过数据所表征的特征程度来体现;所述目标大模型的训练过程包括:
3.根据权利要求2所述的方法,其特征在于,所述通过所述当前语料数据集对初始大模型进行训练,得到当前大模型,包括:
4.根据权利要求3所述的方法,其特征在于,所述对所述当前语料数据集进行预处理,包括:
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述内容指标包括内容词组和相关性指标;所述向量数据库包括多个集合;所述基于所述内容指标从向量数据库获取关联数据,包括:
7.根据权利要求6所述的方法,其特征...
【专利技术属性】
技术研发人员:班亚光,张琛,张跃甲,周鼎,张晓冬,黎梦娜,赵凯章,刘莎,于雯婷,罗雅,
申请(专利权)人:北京大学长沙计算与数字经济研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。