System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 有机分子回答模型的训练方法、训练装置、设备及介质制造方法及图纸_技高网
当前位置: 首页 > 专利查询>季华实验室专利>正文

有机分子回答模型的训练方法、训练装置、设备及介质制造方法及图纸

技术编号:42150354 阅读:15 留言:0更新日期:2024-07-27 00:04
本发明专利技术公开了一种有机分子回答模型的训练方法、训练装置、设备及介质,涉及人工智能技术领域,通过将获取的通用文本编码、样本图像编码和样本组合编码输入待训练的大语言模型,对待训练的大语言模型进行训练,得到预训练后的大语言模型,其中,预训练后的大语言模型用于对输入的目标有机分子图例中的目标文本数据和目标有机分子结构进行识别;获取预设指令跟随数据集,基于预设指令跟随数据集调用预训练后的大语言模型进行训练,得到有机分子回答模型,其中,有机分子回答模型用于依据输入的待回答信息生成针对目标有机分子图例的分子性质分析信息,克服大语言模型无法对有机分子图例进行有效分析并准确输出相关问答内容的缺陷。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种有机分子回答模型的训练方法、训练装置、设备及介质


技术介绍

1、大语言模型(llm,large language model)是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译等。

2、相关技术中,通过大语言模型进行有机分子的相关回答生成处理,在应用阶段,大语言模型无法直接获取有机分子图例中记载的有机分子的准确结构,而化学材料领域的知识库中最重要的分子结构通常又以图例的形式进行表示,所以现有的大语言模型只能对有机分子图例进行简单的分析,得到简单的有机分子信息,而不能得到确切的分子结构编码信息。因此目前缺乏对有机分子图例进行有效分析并准确输出相关问答内容的大语言模型。


技术实现思路

1、本专利技术的主要目地在于提供一种有机分子回答模型的训练方法、训练装置、设备及介质,旨在解决目前缺乏对有机分子图例进行有效分析并准确输出相关问答内容的大语言模型的技术问题。

2、为实现上述目地,本专利技术提供一种有机分子回答模型的训练方法,所述有机分子回答模型的训练方法包括以下步骤:

3、将获取的通用文本编码、样本图像编码和样本组合编码输入待训练的大语言模型,对所述待训练的大语言模型进行训练,得到预训练后的大语言模型,其中,所述预训练后的大语言模型用于对输入的目标有机分子图例中的目标文本数据和目标有机分子结构进行识别;

4、获取预设指令跟随数据集,基于所述预设指令跟随数据集调用所述预训练后的大语言模型进行训练,得到有机分子回答模型,其中,所述有机分子回答模型用于依据输入的待回答信息生成针对所述目标有机分子图例的分子性质分析信息。

5、可选地,所述将获取的通用文本编码、样本图像编码和样本组合编码输入待训练的大语言模型,对所述待训练的大语言模型进行训练,得到预训练后的大语言模型的步骤之前,所述训练方法还包括:

6、确定样本有机分子图例,提取所述样本有机分子图例中的样本文本数据输入替换模型中,对所述样本文本数据中的分子结构描述进行抓取,将抓取得到的所述分子结构描述替换为预设系统命名后,输出所述通用文本编码;以及,将所述样本有机分子图例输入图像特征提取头模块中,输出得到所述样本图像编码;以及,将所述样本有机分子图例输入有机分子信息提取模块中,输出得到所述样本组合编码。

7、可选地,所述有机分子信息提取模块包括有机分子结构提取单元和有机分子信息生成单元,所述将所述样本有机分子图例输入有机分子信息提取模块中,输出得到所述样本组合编码的步骤,包括:

8、将所述样本有机分子图例输入所述有机分子结构提取单元中,输出与所述样本有机分子图例相关的样本分子位置信息和样本分子系统命名;

9、将所述样本分子位置信息和所述样本分子系统命名输入所述有机分子信息生成单元中,输出得到所述样本组合编码。

10、可选地,所述有机分子结构提取单元包括第一识别模型和第二识别模型,所述将所述样本有机分子图例输入所述有机分子结构提取单元中,输出与所述样本有机分子图例相关的样本分子位置信息和样本分子系统命名的步骤,包括:

11、将所述样本有机分子图例输入所述第一识别模型中,输出得到所述样本有机分子图例所包括的样本有机分子结构的原子元素信息和原子位置信息;

12、通过第二识别模型,基于所述原子位置信息对原子连接关系进行识别,输出得到所述样本有机分子图例所对应的化学键,并基于所述原子元素信息和所述化学键,生成所述样本分子系统命名;以及,基于所述原子位置信息计算得到所述样本分子位置信息。

13、可选地,所述有机分子信息生成单元包括位置编码模型和系统命名处理模型,所述将所述样本分子位置信息和所述样本分子系统命名输入所述有机分子信息生成单元中,输出得到所述样本组合编码的步骤,包括:

14、基于所述位置编码模型,将所述样本分子位置信息转换为具有token长度的位置编码信息,以及,基于所述系统命名处理模型,将所述样本分子系统命名转换为文本编码信息;

15、依据所述位置编码信息和所述文本编码信息,生成所述样本组合编码。

16、可选地,所述获取预设指令跟随数据集的步骤之前,所述训练方法还包括:

17、基于所述样本分子系统命名和所述样本有机分子图例构建所述预设指令跟随数据集。

18、可选地,所述得到有机分子回答模型的步骤之后,所述训练方法还包括:

19、将目标有机分子图例和待回答信息输入所述有机分子回答模型;

20、通过所述有机分子回答模型,提取所述目标有机分子图例中的所述目标文本数据和所述目标有机分子结构;

21、依据所述目标文本数据和所述目标有机分子结构,输出与所述待回答信息相关的回答内容。

22、本申请还提供一种有机分子回答模型的训练装置,所述有机分子回答模型的训练装置包括:

23、预训练模块,用于将获取的通用文本编码、样本图像编码和样本组合编码输入待训练的大语言模型,对所述待训练的大语言模型进行训练,得到预训练后的大语言模型,其中,所述预训练后的大语言模型用于对输入的目标有机分子图例中的目标文本数据和目标有机分子结构进行识别;

24、模型输出模块,用于获取预设指令跟随数据集,基于所述预设指令跟随数据集调用所述预训练后的大语言模型进行训练,得到有机分子回答模型,其中,所述有机分子回答模型用于依据输入的待回答信息生成针对所述目标有机分子图例的分子性质分析信息。

25、此外,为实现上述目地,本专利技术还提供一种电子设备,所述电子设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机处理程序,所述计算机处理程序被所述处理器执行时实现如上所述的有机分子回答模型的训练方法的步骤。

26、此外,为实现上述目地,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机处理程序,所述计算机处理程序被处理器执行时实现如上所述的有机分子回答模型的训练方法的步骤。

27、本专利技术提出一种有机分子回答模型的训练方法、训练装置、设备及介质,通过将获取的通用文本编码、样本图像编码和样本组合编码输入待训练的大语言模型,对待训练的大语言模型进行训练,得到预训练后的大语言模型,其中,因为样本图像编码和样本组合编码为有机分子结构的相关信息,因此预训练后的大语言模型能够对输入的目标有机分子图例中的目标文本数据和目标有机分子结构进行识别分析;获取预设指令跟随数据集,基于预设指令跟随数据集调用预训练后的大语言模型进行训练,使得生成的有机分子回答模型能够具备问答能力,提升有机分子回答模型理解用户输入的待回答信息的能力,进而使得所输出的回答内容更符合需求,进而克服大语言模型无法对有机分子图例进行有效分析并准确输出相关问答内容的缺陷。

本文档来自技高网...

【技术保护点】

1.一种有机分子回答模型的训练方法,其特征在于,所述有机分子回答模型的训练方法包括以下步骤:

2.如权利要求1所述的有机分子回答模型的训练方法,其特征在于,所述将获取的通用文本编码、样本图像编码和样本组合编码输入待训练的大语言模型,对所述待训练的大语言模型进行训练,得到预训练后的大语言模型的步骤之前,所述训练方法还包括:

3.如权利要求2所述的有机分子回答模型的训练方法,其特征在于,所述有机分子信息提取模块包括有机分子结构提取单元和有机分子信息生成单元,所述将所述样本有机分子图例输入有机分子信息提取模块中,输出得到所述样本组合编码的步骤,包括:

4.如权利要求3所述的有机分子回答模型的训练方法,其特征在于,所述有机分子结构提取单元包括第一识别模型和第二识别模型,所述将所述样本有机分子图例输入所述有机分子结构提取单元中,输出与所述样本有机分子图例相关的样本分子位置信息和样本分子系统命名的步骤,包括:

5.如权利要求4所述的有机分子回答模型的训练方法,其特征在于,所述有机分子信息生成单元包括位置编码模型和系统命名处理模型,所述将所述样本分子位置信息和所述样本分子系统命名输入所述有机分子信息生成单元中,输出得到所述样本组合编码的步骤,包括:

6.如权利要求4所述的有机分子回答模型的训练方法,其特征在于,所述获取预设指令跟随数据集的步骤之前,所述训练方法还包括:

7.如权利要求1所述的有机分子回答模型的训练方法,其特征在于,所述得到有机分子回答模型的步骤之后,所述训练方法还包括:

8.一种有机分子回答模型的训练装置,其特征在于,所述有机分子回答模型的训练装置包括:

9.一种电子设备,其特征在于,所述电子设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机处理程序,所述计算机处理程序被所述处理器执行时实现如权利要求1至7中任一项所述的有机分子回答模型的训练方法的步骤。

10.一种可读存储介质,其特征在于,所述可读存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有计算机处理程序,所述计算机处理程序被处理器执行以实现如权利要求1至7中任一项所述的有机分子回答模型的训练方法的步骤。

...

【技术特征摘要】

1.一种有机分子回答模型的训练方法,其特征在于,所述有机分子回答模型的训练方法包括以下步骤:

2.如权利要求1所述的有机分子回答模型的训练方法,其特征在于,所述将获取的通用文本编码、样本图像编码和样本组合编码输入待训练的大语言模型,对所述待训练的大语言模型进行训练,得到预训练后的大语言模型的步骤之前,所述训练方法还包括:

3.如权利要求2所述的有机分子回答模型的训练方法,其特征在于,所述有机分子信息提取模块包括有机分子结构提取单元和有机分子信息生成单元,所述将所述样本有机分子图例输入有机分子信息提取模块中,输出得到所述样本组合编码的步骤,包括:

4.如权利要求3所述的有机分子回答模型的训练方法,其特征在于,所述有机分子结构提取单元包括第一识别模型和第二识别模型,所述将所述样本有机分子图例输入所述有机分子结构提取单元中,输出与所述样本有机分子图例相关的样本分子位置信息和样本分子系统命名的步骤,包括:

5.如权利要求4所述的有机分子回答模型的训练方法,其特征在于,所述有机分子信息生成单元包括位置编码模型和系统命...

【专利技术属性】
技术研发人员:何兆铭毕海王悦张赫铭
申请(专利权)人:季华实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1