System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种模型训练方法、业务执行方法、装置以及存储介质制造方法及图纸_技高网

一种模型训练方法、业务执行方法、装置以及存储介质制造方法及图纸

技术编号:43864273 阅读:6 留言:0更新日期:2024-12-31 18:51
本说明书提供的一种模型训练方法、业务执行方法、装置以及存储介质,可以首先获取文本数据,将文本数据输入到预设的大语言模型中,以使大语言模型对文本数据进行语义分析,以确定出文本数据所对应的各文本要素信息,并根据各文本要素信息,生成用于对文本数据从至少部分角度进行总结的总结文本,以将总结文本与文本数据进行匹配,得到总结文本与文本数据之间的匹配结果,作为实际匹配结果,将文本数据以及总结文本输入到待训练的语言模型中,以使语言模型生成文本数据与总结文本之间的匹配结果,作为待验证匹配结果,根据待验证匹配结果和实际匹配结果之间的偏差,确定损失值,并根据损失值,对待训练的语言模型进行训练。

【技术实现步骤摘要】

本说明书涉及计算机,尤其涉及一种模型训练方法、业务执行方法、装置以及存储介质


技术介绍

1、近年来,随着计算机技术以及人工智能技术的发展,语言模型的应用逐渐广泛。语言模型可以根据用户提供的个人数据来执行相关的问答业务。例如,用户可以向语言模型输入文本(如:一篇新闻)和问题语句(如:该文本是否描述了a地区近期经济数据的变化?),进而语言模型可以对接收到的文本和问题语句进行分析与处理,并将结果返回给用户。

2、目前,为了使得语言模型在实际应用过程中能够对用户所输入的内容进行准确的分析并得出结果,可以在前期对语言模型进行训练的过程中采用人为的方式设置不同的问题语句来引导语言模型给出相应的回答,以使语言模型学习到对不同的问题语句进行分析与处理的能力。例如,在对语言模型进行训练的过程中,当语言模型的输入是一篇新闻时,问题语句可以是“该文章是否为财经类的新闻?”,以此来引导语言模型对该文章是否属于财经类的新闻进行判断。或者,问题语句也可以是“该文章是否描述了近期股市行情的变动?”,以此来引导语言模型对该文章中是否存在对近期股市行情的变动的内容进行判断。

3、但是,采用人为设置多个问题语句的方式耗时较长,从而导致训练效率较低。


技术实现思路

1、本说明书提供了一种模型训练方法、业务执行方法、装置以及存储介质,以部分的解决现有技术存在的上述问题。

2、本说明书采用下述技术方案:

3、本说明书提供了一种模型训练方法,包括:

4、获取文本数据;

5、将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述各文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本,以将所述总结文本与所述文本数据进行匹配,得到所述总结文本与所述文本数据之间的匹配结果,作为实际匹配结果,其中,文本要素信息用于表征所述文本数据的语句成分、所述文本数据对应文本内容所表达的情感类型、所述文本数据对应文本内容的描述风格;

6、将所述文本数据以及所述总结文本输入到待训练的语言模型中,以使所述语言模型生成所述文本数据与所述总结文本之间的匹配结果,作为待验证匹配结果;

7、根据所述待验证匹配结果和所述实际匹配结果之间的偏差,确定损失值,并根据所述损失值,对所述待训练的语言模型进行训练,其中,所述偏差与所述损失值之间呈正相关关系。

8、可选地,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述各文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本,具体包括:

9、将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,以将选取出的至少一个目标要素信息进行组合,得到组合文本要素信息,并根据所述组合文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本。

10、可选地,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

11、将所述文本数据输入到预设的大语言模型中,以使所述大语言模型确定所述文本数据对应的文本特征,根据所述文本特征,对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述文本特征,从所述各文本要素信息中确定出重要要素信息,作为选取出的至少一个目标要素信息。

12、可选地,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

13、将所述文本数据以及获取到的任务需求信息输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述任务需求信息,从所述各文本要素信息中确定出与所述任务需求信息相匹配的文本要素信息,作为选取出的至少一个目标要素信息。

14、可选地,将所述文本数据以及所述总结文本输入到待训练的语言模型中,以使所述语言模型生成所述文本数据与所述总结文本之间的匹配结果,作为待验证匹配结果,具体包括:

15、将所述文本数据、所述总结文本以及输出规定信息输入到待训练的语言模型中,以使所述语言模型按照所述输出规定信息所要求的信息输出类型,输出所述文本数据与所述总结文本之间的匹配结果,作为待验证匹配结果。

16、本说明书提供了一种业务执行方法,包括:

17、获取待匹配数据,所述待匹配数据中包含有待匹配文本数据以及待匹配总结文本;

18、将所述待匹配数据输入到预先训练好的语言模型中,以使所述语言模型生成所述待匹配文本数据与所述待匹配总结文本之间的匹配结果,所述语言模型是通过如上述模型训练方法训练得到的;

19、根据所述匹配结果,进行业务执行。

20、本说明书提供了一种模型训练装置,包括:

21、获取模块:用于获取文本数据;

22、第一匹配模块:用于将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述各文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本,以将所述总结文本与所述文本数据进行匹配,得到所述总结文本与所述文本数据之间的匹配结果,作为实际匹配结果,其中,文本要素信息用于表征所述文本数据的语句成分、所述文本数据对应文本内容所表达的情感类型、所述文本数据对应文本内容的描述风格;

23、第二匹配模块:用于将所述文本数据以及所述总结文本输入到待训练的语言模型中,以使所述语言模型生成所述文本数据与所述总结文本之间的匹配结果,作为待验证匹配结果;

24、训练模块:用于根据所述待验证匹配结果和所述实际匹配结果之间的偏差,确定损失值,并根据所述损失值,对所述待训练的语言模型进行训练,其中,所述偏差与所述损失值之间呈正相关关系。

25、可选地,所述第一匹配模块具体用于:

26、将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,以将选取出的至少一个目标要素信息进行组合,得到组合文本要素信息,并根据所述组合文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本。

27、可选地,所述第一匹配模块具体用于:<本文档来自技高网...

【技术保护点】

1.一种模型训练方法,包括:

2.如权利要求1所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述各文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本,具体包括:

3.如权利要求2所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

4.如权利要求2所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

5.如权利要求1所述的方法,将所述文本数据以及所述总结文本输入到待训练的语言模型中,以使所述语言模型生成所述文本数据与所述总结文本之间的匹配结果,作为待验证匹配结果,具体包括:

6.一种业务执行方法,包括:>

7.一种模型训练装置,包括:

8.如权利要求7所述的装置,所述第一匹配模块具体用于:

9.如权利要求8所述的装置,所述第一匹配模块具体用于:

10.如权利要求8所述的装置,所述第一匹配模块具体用于:

11.如权利要求7所述的装置,所述第二匹配模块具体用于:

12.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~6任一项所述的方法。

13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~6任一项所述的方法。

...

【技术特征摘要】

1.一种模型训练方法,包括:

2.如权利要求1所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述各文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本,具体包括:

3.如权利要求2所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

4.如权利要求2所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

5.如权利要求1所述的方法,将所述文本数据...

【专利技术属性】
技术研发人员:周书恒祝慧佳
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1