System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于金酒知识问答的大语言模型训练方法技术_技高网

一种用于金酒知识问答的大语言模型训练方法技术

技术编号:44697321 阅读:1 留言:0更新日期:2025-03-19 20:47
本申请设计的一种用于金酒知识问答的大语言模型训练方法,其中,本申请设计了一种简化的预训练大语言模型,用来提供基础的文本补全以及逻辑对话能力,大幅度的降低了训练成本,并构建金酒知识重要性深度学习模型,实现了无需人工评审金酒专业知识,大幅度的降低时间成本。通过上述设计,本申请设计的一种用于金酒知识问答的大语言模型训练方法,能够实现动态调整训练数据的权重,有效的实现模型参数微调,进而提高金酒问题的问答准确率。

【技术实现步骤摘要】

本专利技术属于数据处理领域,具体涉及一种用于金酒知识问答的大语言模型训练方法


技术介绍

1、大语言模型(large language model,llm)是一种基于深度学习的人工智能模型,通常使用大量的文本数据进行训练,以生成自然语言文本、回答问题、翻译语言等。大语言模型的代表包括openai的gpt系列、google的bert、t5等。这些模型通过学习海量的文本数据,能够理解和生成类似人类的语言。

2、尽管大语言模型已经展示出了一定的通用性能,但是在一些垂直细分领域的表现任然存在不足。例如,在金酒专业知识的相关领域,很多专业知识数据来自于金酒制造企业内部,通常并不会对外公开。这使得大语言模型在预训练的过程中无法真正的了解更多的专业知识。另一方面,随着时间的发展,金酒领域的知识也会随之扩充,如果同步更新预训练大语言模型的参数需要花费大量的时间及金钱,无法达到实时更新的目的。因此,预训练大语言模型在金酒专业领域知识的问答效果表现一般,只停留在一般公开知识层面,难以形成深入的理解。

3、为了解决以上两个层面的问题,行业内通常的解决方案是对已有的预训练大语言模型进行少量的参数微调或者使用金酒的知识库进行检索。然而,模型微调时对于金酒专业知识无法进行重要性区分,人工数据清晰耗时,效率低;并且金酒专业数据在模型微调阶段的权重依赖于经验调整,超参数调节效率低。因此针对金酒领域专业知识的大语言模型微调在实际应用中仍然无法满足生产的使用标准的问题,需要进一步的提高问题回答的准确率。


技术实现思路

1、为了解决上述问题,本专利技术通过提出一种用于金酒知识问答的大语言模型训练方法,一方面简化了预训练大语言模型的参数规模,另一方面通过引入金酒知识重要性深度学习模型来动态调整训练数据的比重,进而提升最终的大语言模型的整体性能。

2、一种用于金酒知识问答的大语言模型训练方法,包括以下步骤:

3、步骤s1、构建预训练大语言模型,并对预训练大语言模型进行训练;

4、步骤s2、构建金酒知识重要性深度学习模型;

5、步骤s3、将预训练大语言模型作为基座模型,并冻结所有的参数值;使用低秩分解模型在基座模型的基础上添加额外的可训练模型参数,得到混合模型;

6、步骤s4、选取训练数据,作为输入传入金酒知识重要性深度学习模型中,得到每个参数的重要性权重参数;

7、步骤s5、将训练数据传入混合模型中,获取损失函数值;将损失函数值乘以对应的重要性权重参数,并将获得的数值传递给低秩分解模型做动态调整;

8、步骤s6、重复步骤s4至步骤s5的过程,直至训练收敛,获得最终的大语言模型。

9、优选地,所述预训练大语言模型的构建方法包括:

10、步骤s101、将现有大语言模型的层数固定为16;

11、步骤s102、将大语言模型的位置编码修改为rope相对位置编码;

12、步骤s103、将大语言模型的归一化法修改为层后归一化法。

13、优选地,所述预训练大语言模型的前馈网络层包括:两个线性变换和一个非线性激活函数。

14、优选地,所述激活函数使用swiglu函数。

15、优选地,所属注意力机制网络的定义为:

16、

17、其中,q=wq*f,k=wk*f,v=wv*f,f表示文本经过词嵌入后的隐空间状态,wq为查询参数矩阵,wk为键参数矩阵,wv为值参数矩阵,d为特征向量维度的大小,q为查询向量,k为键向量,v为值向量。

18、优选地,所述预训练大语言模型的训练方法包括:

19、步骤s111、对于给定一个词元序列u={ut,...,ut},语言建模任务的目标定义为词元的预测任务:

20、步骤s112、基于序列中当前位置之前的词元序列u<t,采用自回归的方式对于目标词元ut进行预测;

21、步骤s113、在训练过程中,模型通常根据公式(2)的似然函数进行优化:

22、

23、其中,p(ut|u<t)表示在给定输入文本词元序列u<t下,输出下一个词元ut的概率,log表示对数运算,表示对一段输入长度为t的词元序列分解为t段,将每一段的词元输出概率取对数后进行叠加,得到最终的损失函数l(u);

24、步骤s114、将训练数据以每批次数量大小为256传入模型,最后通过adamw优化器进行迭代优化更新网络模型参数。

25、优选地,所述金酒知识重要性深度学习模型的构建方法包括:

26、步骤s21、将输入数据文本输入至编码器中,所述编码器将输入数据文本转变为词向量,并将词向量和输入数据文本对应的专业数据向量一起输入至交叉注意力机制网络;

27、步骤s22、所述交叉注意力机制网络对词向量以及专业数据向量一起进行融合处理,获取融合后的特征向量,并将获取融合后的特征向量传输至全连接网络中;

28、步骤s23、所述全连接网络将融合后的特征向量进行处理,得到的重要性得分值q;

29、步骤s24、得到的重要性得分值q与人工标注的重要性分值q’一起构成均方误差损失函数:

30、l(q,q′)=e[(q-q′)2]

31、其中,e表示数据集的期望;最后通过adam优化器进行迭代优化更新网络模型参数。

32、本申请的优点和效果如下:

33、本申请设计的一种用于金酒知识问答的大语言模型训练方法,包括:步骤s1、构建预训练大语言模型,并对预训练大语言模型进行训练;步骤s2、构建金酒知识重要性深度学习模型;步骤s3、将预训练大语言模型作为基座模型,并冻结所有的参数值;使用低秩分解模型在基座模型的基础上添加额外的可训练模型参数,得到混合模型;步骤s4、选取训练数据,作为输入传入金酒知识重要性深度学习模型中,得到每个参数的重要性权重参数;步骤s5、将训练数据传入混合模型中,获取损失函数值;将损失函数值乘以对应的重要性权重参数,并将获得的数值传递给低秩分解模型做动态调整;步骤s6、重复步骤s4至步骤s5的过程,直至训练收敛,获得最终的大语言模型。本申请设计了一种简化的预训练大语言模型,用来提供基础的文本补全以及逻辑对话能力,大幅度的降低了训练成本,并构建金酒知识重要性深度学习模型,实现了无需人工评审金酒专业知识,大幅度的降低时间成本。通过上述设计,本申请设计的一种用于金酒知识问答的大语言模型训练方法,能够实现动态调整训练数据的权重,有效的实现模型参数微调,进而提高金酒问题的问答准确率。

34、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,从而可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下以本申请的较佳实施例并配合附图详细说明如后。

35、根据下文结合附图对本申请具体实施例的详细描述,本领域技术人员将会更加本文档来自技高网...

【技术保护点】

1.一种用于金酒知识问答的大语言模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种用于金酒知识问答的大语言模型训练方法,其特征在于,所述预训练大语言模型的构建方法包括:

3.根据权利要求2所述的一种用于金酒知识问答的大语言模型训练方法,其特征在于,所述预训练大语言模型的前馈网络层包括:两个线性变换和一个非线性激活函数。

4.根据权利要求2所述的一种用于金酒知识问答的大语言模型训练方法,其特征在于,所述激活函数使用SwiGLU函数。

5.根据权利要求2所述的一种用于金酒知识问答的大语言模型训练方法,其特征在于,所属注意力机制网络的定义为:

6.根据权利要求2所述的一种用于金酒知识问答的大语言模型训练方法,其特征在于,所述预训练大语言模型的训练方法包括:

7.根据权利要求2所述的一种用于金酒知识问答的大语言模型训练方法,其特征在于,所述金酒知识重要性深度学习模型的构建方法包括:

【技术特征摘要】

1.一种用于金酒知识问答的大语言模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种用于金酒知识问答的大语言模型训练方法,其特征在于,所述预训练大语言模型的构建方法包括:

3.根据权利要求2所述的一种用于金酒知识问答的大语言模型训练方法,其特征在于,所述预训练大语言模型的前馈网络层包括:两个线性变换和一个非线性激活函数。

4.根据权利要求2所述的一种用于金酒知识问答的大语言模型训练...

【专利技术属性】
技术研发人员:张雪泽张艺浩徐修信刘岩鑫
申请(专利权)人:生花智能科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1