System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种信息生成模型训练方法和信息生成方法技术_技高网
当前位置: 首页 > 专利查询>之江实验室专利>正文

一种信息生成模型训练方法和信息生成方法技术

技术编号:43962665 阅读:13 留言:0更新日期:2025-01-07 21:47
本说明书公开了一种信息生成模型训练方法和信息生成方法。所述信息生成模型的训练方法包括:获取针对基础生成模型的样本数据,并基于所述样本数据构建训练指令,并将样本数据以及训练指令输入基础生成模型,得到测试结果,并根据测试结果对训练指令进行调整,得到目标训练指令,以及,对基础生成模型的模型参数进行压缩处理,得到待训练的信息生成模型;将目标训练指令以及样本数据并输入信息生成模型,确定预测结果;根据预测结果对信息生成模型进行训练。本方案可以在少量训练样本的基础上训练出具有较高性能的信息生成模型,显著降低了模型性能对样本数量的需求,有效提高了模型的准确性。

【技术实现步骤摘要】

本说明书涉及计算机,尤其涉及一种信息生成模型训练方法和信息生成方法


技术介绍

1、随着材料科学和计算技术的快速发展,材料结构胞元(即材料的基本结构单元)的生成在材料设计、性能优化等领域具有重要意义。传统的材料设计方法往往依赖于大量的实验和经验,周期长、成本高,随着近年来人工智能技术的发展,大模型的应用为材料设计提供了新的思路。

2、然而,现有应用于材料领域的模型往往需要通过大量的数据资源进行全量训练,但是材料科学领域的数据相对有限,基于有限的数据难以使模型达到理想的性能。

3、因此,如何在有限的样本数据下保证模型的推理性能,是一个亟待解决的问题。


技术实现思路

1、本说明书提供一种信息生成模型训练方法和信息生成方法,以部分的解决现有技术存在的上述问题。

2、本说明书采用下述技术方案:

3、本说明书提供了一种信息生成模型训练方法,包括:

4、获取针对基础生成模型的样本数据,并基于所述样本数据构建训练指令,所述样本数据中包含有不同属性信息的材料结构数据,所述训练指令用于引导所述基础生成模型生成具有指定属性的材料结构数据,或引导所述基础生成模型生成指定材料结构数据的属性信息;

5、将所述训练指令以及所述样本数据输入所述基础生成模型,得到第一预测结果;

6、根据所述第一预测结果与所述样本数据对应的实际标签,确定测试结果,并根据所述测试结果对所述训练指令进行调整,得到目标训练指令,以及,对所述基础生成模型的模型参数进行压缩处理,得到待训练的信息生成模型;

7、将所述目标训练指令以及所述样本数据输入所述信息生成模型,以通过所述信息生成模型,确定第二预测结果;

8、根据所述第二预测结果与所述样本数据对应的实际标签,确定所述信息生成模型的损失值,并根据所述损失值对所述信息生成模型进行训练。

9、可选地,根据所述测试结果对所述训练指令进行调整,得到目标训练指令,具体包括:

10、根据所述第一预测结果与所述样本数据对应的实际标签之间的偏差,确定所述预测结果中不满足预设条件的信息,作为调整参考信息;

11、根据所述调整参考信息,对所述训练指令进行调整,得到所述目标训练指令。

12、可选地,对所述基础生成模型的模型参数进行压缩处理,得到待训练的信息生成模型,具体包括:

13、对所述基础生成模型的权重矩阵进行低秩分解,并基于低秩分解后得到的权重矩阵对所述基础生成模型进行调整,得到所述信息生成模型。

14、可选地,根据所述预测结果与所述样本数据对应的实际标签,确定所述信息生成模型的损失值,并根据所述损失值对所述信息生成模型进行训练,具体包括:

15、根据所述预测结果与所述样本数据对应的实际标签,确定所述信息生成模型的损失值,并根据所述损失值对所述信息生成模型预训练,得到经过预训练的信息生成模型;

16、对所述经过预训练的信息生成模型的目标训练指令进行调整,并通过调整后的目标训练指令对所述经过预训练的信息生成模型进行训练。

17、可选地,在将所述目标训练指令以及所述样本数据输入所述信息生成模型之前,所述方法还包括:

18、根据所述目标训练指令的复杂程度,确定是否满足预设的信息接入条件;

19、若是,则获取预设的推理引导数据,所述推理引导数据中包含有若干个推理步骤对应的步骤描述信息,用于对所述信息生成模型在确定所述预测结果的过程中所执行的推理步骤进行引导;

20、将所述目标训练指令以及所述样本数据输入所述信息生成模型,以通过所述信息生成模型,确定第二预测结果,具体包括:

21、将所述目标训练指令、所述样本数据以及所述推理引导数据输入所述信息生成模型,以通过所述信息生成模型,在所述推理引导数据所包含的各步骤描述信息的引导下,执行各推理步骤,得到所述预测结果。

22、可选地,在将所述目标训练指令以及所述样本数据输入所述信息生成模型之前,所述方法还包括:

23、根据目标训练指令的复杂程度,确定是否满足预设的信息接入条件;

24、若是,则根据所述目标训练指令,确定所述信息生成模型所生成的材料结构数据对应的属性信息,并在预设的知识库中查询与所述属性信息相匹配的信息,作为描述增强信息;

25、将所述描述增强信息对所述目标训练指令进行更新。

26、本说明书提供了一种信息生成方法,包括:

27、接收信息生成指令,其中,所述信息生成指令用于指示预先训练的信息生成模型生成具有指定属性信息的材料结构数据,或根据指定材料结构数据生成属性信息,所述信息生成模型是通过上述方法训练得到的;

28、将所述生成指令输入所述信息生成模型,以通过所述信息生成模型,生成材料信息。

29、本说明书提供了一种信息生成模型训练装置,包括:

30、接收模块,用于获取针对基础生成模型的样本数据,并基于所述样本数据构建训练指令,所述样本数据中包含有不同属性信息的材料结构数据,所述训练指令用于引导所述基础生成模型生成具有指定属性的材料结构数据,或引导所述基础生成模型生成指定材料结构数据的属性信息;

31、第一预测模块,用于将所述训练指令以及所述样本数据输入所述基础生成模型,得到第一预测结果;

32、调整模块,用于根据所述第一预测结果与所述样本数据对应的实际标签,确定测试结果,并根据所述测试结果对所述训练指令进行调整,得到目标训练指令,以及,对所述基础生成模型的模型参数进行压缩处理,得到待训练的信息生成模型;

33、第二预测模块,用于将所述目标训练指令以及所述样本数据输入所述信息生成模型,以通过所述信息生成模型,确定第二预测结果;

34、训练模块,用于根据所述第二预测结果与所述样本数据对应的实际标签,确定所述信息生成模型的损失值,并根据所述损失值对所述信息生成模型进行训练。

35、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息生成模型训练方法和信息生成方法。

36、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述信息生成模型训练方法和信息生成方法。

37、本说明书采用的上述至少一个技术方案能够达到以下有益效果:

38、在本说明书提供的信息生成模型训练方法中,获取针对基础生成模型的样本数据,并基于所述样本数据构建训练指令,并将样本数据以及训练指令输入基础生成模型,得到测试结果,并根据测试结果对训练指令进行调整,得到目标训练指令,以及,对基础生成模型的模型参数进行压缩处理,得到待训练的信息生成模型;将目标训练指令以及样本数据并输入信息生成模型,确定预测结果;根据预测结果对信息生成模型进行训练。

本文档来自技高网...

【技术保护点】

1.一种信息生成模型训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,根据所述测试结果对所述训练指令进行调整,得到目标训练指令,具体包括:

3.如权利要求1所述的方法,其特征在于,对所述基础生成模型的模型参数进行压缩处理,得到待训练的信息生成模型,具体包括:

4.如权利要求3所述的方法,其特征在于,根据所述预测结果与所述样本数据对应的实际标签,确定所述信息生成模型的损失值,并根据所述损失值对所述信息生成模型进行训练,具体包括:

5.如权利要求1所述的方法,其特征在于,在将所述目标训练指令以及所述样本数据输入所述信息生成模型之前,所述方法还包括:

6.如权利要求1所述的方法,其特征在于,在将所述目标训练指令以及所述样本数据输入所述信息生成模型之前,所述方法还包括:

7.一种信息生成方法,其特征在于,包括:

8.一种信息生成模型训练装置,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。

10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。

...

【技术特征摘要】

1.一种信息生成模型训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,根据所述测试结果对所述训练指令进行调整,得到目标训练指令,具体包括:

3.如权利要求1所述的方法,其特征在于,对所述基础生成模型的模型参数进行压缩处理,得到待训练的信息生成模型,具体包括:

4.如权利要求3所述的方法,其特征在于,根据所述预测结果与所述样本数据对应的实际标签,确定所述信息生成模型的损失值,并根据所述损失值对所述信息生成模型进行训练,具体包括:

5.如权利要求1所述的方法,其特征在于,在将所述目标训练指令以及所述样本数据输入所述信息生成模型之...

【专利技术属性】
技术研发人员:徐黎李志宁沈盼马雪郭凯聂元清杨娟娟
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1