System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于数据混合器和模型适配器的垂直领域大模型协同系统技术方案_技高网

基于数据混合器和模型适配器的垂直领域大模型协同系统技术方案

技术编号:43207690 阅读:2 留言:0更新日期:2024-11-01 20:25
本发明专利技术公开了基于数据混合器和模型适配器的垂直领域大模型协同系统,包括:数据资源库,用于存储垂直领域的专有数据、通用的预处理数据和客户数据;训练模块,用于通过专有数据和通用的预处理数据对基础大模型进行训练,以得到垂直领域大模型,通过客户数据训练客户模型;输入模块,用于接收用户或系统的输入;协同处理模块,用于通过垂直领域大模型和客户模型进行协同,以获得与输入内容相匹配的内容;输出生成模块,用于将输出的广泛的知识基础结果和针对特定垂直领域定制化的结果进行整合,生成并输出综合结果;结果呈现模块,用于将综合结果以适合用户或应用场景的形式进行呈现。提升了模型对特定垂直行业的理解和响应能力。

【技术实现步骤摘要】

本专利技术涉及基于数据混合器和模型适配器的垂直领域大模型协同系统


技术介绍

1、在为垂直行业客户提供大模型解决方案时,现行方法主要依赖于垂直行业的数据(例如文档、问答、百科和知识图谱),通过构建基于检索增强文本生成(rag)系统,将垂直专业知识整合至大模型中。这种做法通过特定提示(prompt)引导模型生成响应。

2、然而,这一方法面临着一个核心挑战:传统的大型模型在预训练过程中并未融合特定垂直行业的知识,因此它们往往依赖已有的广泛训练数据来解读问题,有时会陷入“知识幻觉”现象。传统的解决方案,如基于垂直领域的数据微调,虽然能提升特定领域的效果,但这往往牺牲了模型的广泛适用性。

3、因此,提供一种基于数据混合器和模型适配器的垂直领域大模型协同系统。


技术实现思路

1、本专利技术的目的在于克服现有的缺陷而提供的基于数据混合器和模型适配器的垂直领域大模型协同系统,提升了模型对特定垂直行业的理解和响应能力,同时还保留了大型模型的广泛适应性。

2、实现上述目的的技术方案是:

3、基于数据混合器和模型适配器的垂直领域大模型协同系统,包括:

4、数据资源库,用于存储有关垂直领域的专有数据、通用的预处理数据和客户数据;

5、训练模块,用于通过专有数据和通用的预处理数据对基础大模型进行训练,以得到垂直领域大模型,并通过客户数据训练客户模型;

6、输入模块,用于接收用户或系统的输入;

7、协同处理模块,用于通过垂直领域大模型和客户模型进行协同,以获得与输入内容相匹配的内容;

8、输出生成模块,用于将输出的广泛的知识基础结果和针对特定垂直领域定制化的结果进行整合,生成并输出综合结果;

9、结果呈现模块,用于将综合结果以适合用户或应用场景的形式进行呈现。

10、优选的,所述训练模块包括:

11、融合单元,用于数据混合器将专有数据和通用的预处理数据进行混合;

12、微调单元,用于使用模型适配器通过peft(peft:parameter-efficient fine-tuning,轻量化微调)技术对预训练的大模型进行定制,以获得垂直领域大模型。

13、优选的,所述训练模块还包括:

14、预训练单元,用于通过模型适配器在预训练阶段将客户数据通过multiplexer(多路复用器)训练至客户模型中。

15、优选的,所述输入模块中,输入的内容包括但不限于查询、指令或其他形式的数据输入。

16、优选的,所述协同处理模块中,通过垂直领域大模型提供广泛的知识基础结果,通过客户模型提供针对特定垂直领域定制化的结果。

17、优选的,所述结果呈现模块中,呈现形式包括但不限于文本回答、生成的报告和执行的动作。

18、本专利技术的有益效果是:本专利技术通过数据混合器将专有数据和通用的预处理数据进行混合和压缩,从而在垂直领域中获取相应的推理、逻辑、规划能力,在预训练阶段整合垂直行业数据,不仅能够将垂直场景数据转化为客户定制化的模型权重,而且还能与大模型协同工作,从而提高在特定领域的推理能力,具有高度的数据安全性,能够在文档级别上保证预训练数据和客户数据安全;本专利技术通过使用垂直领域大模型系统,可以获得既具垂直领域深度也有广泛泛化能力的大模型,这对于企业来说意味着能够以更快的速度、更低的成本和更高的准确性解决行业特定的问题。

本文档来自技高网...

【技术保护点】

1.基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,包括:

2.根据权利要求1所述的一种基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,所述训练模块包括:

3.根据权利要求2所述的一种基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,所述训练模块还包括:

4.根据权利要求1所述的一种基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,所述输入模块中,输入的内容包括但不限于查询、指令或其他形式的数据输入。

5.根据权利要求3所述的一种基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,所述协同处理模块中,通过垂直领域大模型提供广泛的知识基础结果,通过客户模型提供针对特定垂直领域定制化的结果。

6.根据权利要求1所述的一种基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,所述结果呈现模块中,呈现形式包括但不限于文本回答、生成的报告和执行的动作。

【技术特征摘要】

1.基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,包括:

2.根据权利要求1所述的一种基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,所述训练模块包括:

3.根据权利要求2所述的一种基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,所述训练模块还包括:

4.根据权利要求1所述的一种基于数据混合器和模型适配器的垂直领域大模型协同系统,其特征在于,所述输入模块中,输...

【专利技术属性】
技术研发人员:周亮张璐刘军
申请(专利权)人:瑞因凡上海智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1