信息生成模型的训练方法、信息生成方法和装置制造方法及图纸

技术编号:37268177 阅读:15 留言:0更新日期:2023-04-20 23:38
本公开提供了一种信息生成模型的训练方法、信息生成方法和装置,涉及人工智能领域,具体为自然语言处理、深度学习等领域。具体实现方案为:获取第一训练文本,第一训练文本包括初始训练语句以及初始训练语句对应的词槽标签;基于第一训练文本中的初始训练语句,确定与初始训练语句相关联的参考语句信息;根据第一训练文本和参考语句信息,确定第二训练文本;以及利用第二训练文本对深度学习模型进行训练,得到初始信息生成模型。得到初始信息生成模型。得到初始信息生成模型。

【技术实现步骤摘要】
信息生成模型的训练方法、信息生成方法和装置


[0001]本公开涉及计算机
,具体为自然语言处理、深度学习等人工智能
,具体涉及一种信息生成模型的训练方法和装置、一种信息生成方法和装置、电子设备、存储介质和计算机程序产品。

技术介绍

[0002]随着人工智能技术的发展,在许多场景下会采用对话式的人机交互方式,以提升用户的体验,例如订票、订酒店等。目前通常采用对话意图信息和词槽信息来表示用户对话的语义信息。基于深度学习模型可以通过进行分类和序列标注任务,实现对话语句中的对话意图信息和词槽信息的识别。
[0003]但是,相关技术中需要通过人工方式来大量标注词槽名或者词槽描述,才能使模型能够较好地识别某个对话的词槽信息。上述方式不仅人工成本较高、训练效率低,而且模型的效果也会受到词槽标注质量的影响。

技术实现思路

[0004]本公开提供了一种信息生成模型的训练方法和装置、一种信息生成方法和装置、电子设备、存储介质和计算机程序产品。
[0005]根据本公开的一方面,提供了一种信息生成模型的训练方法,包括:获取第一训练文本,第一训练文本包括初始训练语句以及初始训练语句对应的词槽标签;基于第一训练文本中的初始训练语句,确定与初始训练语句相关联的参考语句信息;根据第一训练文本和参考语句信息,确定第二训练文本;以及利用第二训练文本对深度学习模型进行训练,得到初始信息生成模型。
[0006]根据本公开的另一方面,提供了一种信息生成方法,包括:获取待识别语句;基于待识别语句,确定与待识别语句相关联的参考语句信息;基于待识别语句和参考语句信息,确定第一目标识别语句;以及将第一目标识别语句输入目标信息生成模型,生成针对待识别语句的词槽信息;其中,目标信息生成模型是根据以上所述的信息生成模型的训练方法训练得到的。
[0007]根据本公开的另一方面,提供了一种信息生成模型的训练装置,包括:第一获取模块,用于获取第一训练文本,第一训练文本包括初始训练语句以及初始训练语句对应的词槽标签;第一确定模块,用于基于第一训练文本中的初始训练语句,确定与初始训练语句相关联的参考语句信息;第二确定模块,用于根据第一训练文本和参考语句信息,确定第二训练文本;以及第一训练模块,用于利用第二训练文本对深度学习模型进行训练,得到初始信息生成模型。
[0008]根据本公开的另一方面,提供了一种信息生成装置,包括:第二获取模块,用于获取待识别语句;第四确定模块,用于基于待识别语句,确定与待识别语句相关联的参考语句信息;第五确定模块,用于基于待识别语句和参考语句信息,确定第一目标识别语句;以及
第一生成模块,用于将第一目标识别语句输入目标信息生成模型,生成针对待识别语句的词槽信息;其中,目标信息生成模型是根据以上所述的信息生成模型的训练装置训练得到的。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开提供的方法。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开实施例的可以应用信息生成模型的训练方法和装置、信息生成方法和装置的示例性系统架构示意图;
[0015]图2是根据本公开实施例的信息生成模型的训练方法的流程图;
[0016]图3是根据本公开实施例的信息生成模型的训练方法的示意图;
[0017]图4是根据本公开实施例的信息生成方法的流程图;
[0018]图5是根据本公开实施例的信息生成模型的训练装置的框图;
[0019]图6是根据本公开实施例的信息生成装置的框图;以及
[0020]图7是用来实现本公开实施例的信息生成模型的训练方法和信息生成方法的电子设备的框图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]图1是根据本公开的实施例的可以应用信息生成模型的训练方法和装置、信息生成方法和装置的示例性系统架构示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
[0023]如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
[0024]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用。例如,知识阅读类应用、网
页浏览器应用、搜索类应用、即时通信工具、邮箱客户端或社交平台软件等(仅为示例)。
[0025]终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0026]服务器105可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或分布式系统,还可以是提供云服务、云计算、网络服务、中间件服务等基础云计算服务的云服务器。
[0027]服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的各种应用提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
[0028]例如,服务器105可以通过网络104获取来自终端设备101、102、103的第一训练文本,第一训练文本包括初始训练语句以及与初始训练语句对应的词槽标签。之后,基于第一训练文本中的初始训练语句,确定与初始训练语句相关联的参考语句信息,并根据第一训练文本和参考语句信息,确定第二训练文本。然后,利本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息生成模型的训练方法,包括:获取第一训练文本,所述第一训练文本包括初始训练语句以及所述初始训练语句对应的词槽标签;基于所述第一训练文本中的初始训练语句,确定与所述初始训练语句相关联的参考语句信息;根据所述第一训练文本和所述参考语句信息,确定第二训练文本;以及利用所述第二训练文本对深度学习模型进行训练,得到初始信息生成模型。2.根据权利要求1所述的方法,其中,所述参考语句信息包括第一对话类型标识、多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识;所述根据所述第一训练文本和所述参考语句信息,确定第二训练文本包括:根据所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一训练文本中的初始训练语句,确定第一目标训练语句;以及根据所述第一目标训练语句和所述词槽标签,确定所述第二训练文本。3.根据权利要求2所述的方法,其中,所述根据所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一训练文本中的初始训练语句,确定第一目标训练语句包括:对所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一训练文本中的初始训练语句执行拼接操作,得到所述第一目标训练语句。4.根据权利要求2至3中任一项所述的方法,其中,所述基于所述第一训练文本中的初始训练语句,确定与所述初始训练语句相关联的参考语句信息包括:基于所述第一训练文本中的初始训练语句,确定所述初始训练语句所属的目标领域;根据所述目标领域,确定与所述初始训练语句相关联的多个参考语句;针对所述多个参考语句中的每一个,根据所述参考语句,确定与该参考语句对应的参考词槽信息和参考词槽标识;以及根据所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一对话类型标识,确定所述参考语句信息。5.根据权利要求4所述的方法,其中,所述根据所述参考语句,确定与该参考语句对应的参考词槽信息和参考词槽标识包括:响应于根据所述参考语句,未得到与该参考语句对应的参考词槽信息和参考词槽标识,接收用户输入的配置信息;以及根据所述配置信息,确定与所述参考语句对应的参考词槽信息和参考词槽标识。6.根据权利要求2至5中任一项所述的方法,其中,所述利用所述第二训练文本对深度学习模型进行训练,得到初始信息生成模型包括:将所述第一目标训练语句输入所述深度学习模型,得到针对所述初始训练语句的词槽识别结果;根据所述词槽识别结果和所述词槽标签,确定第一损失值;以及根据所述第一损失值调整所述深度学习模型的参数,得到所述初始信息生成模型。
7.根据权利要求1至6中任一项所述的方法,还包括:根据所述初始训练语句和第二对话类型标识,确定第二目标训练语句;以及根据所述第二目标训练语句和所述初始训练语句对应的对话意图标签来训练所述初始信息生成模型,得到目标信息生成模型。8.根据权利要求7所述的方法,其中,所述根据所述第二目标训练语句和所述初始训练语句对应的对话意图标签来训练所述初始信息生成模型,得到目标信息生成模型包括:将所述第二目标训练语句输入所述初始信息生成模型,得到针对所述初始训练语句的对话意图识别结果;根据所述对话意图标签和所述对话意图识别结果,确定第二损失值;以及根据所述第二损失值调整所述初始信息生成模型的参数,得到所述目标信息生成模型。9.一种信息生成方法,包括:获取待识别语句;基于所述待识别语句,确定与所述待识别语句相关联的参考语句信息;基于所述待识别语句和所述参考语句信息,确定第一目标识别语句;以及将所述第一目标识别语句输入目标信息生成模型,生成针对所述待识别语句的词槽信息;其中,所述目标信息生成模型是根据权利要求7或8所述的方法训练得到的。10.根据权利要求9所述的方法,其中,所述参考语句信息包括第一对话类型标识、多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识;所述基于所述待识别语句和所述参考语句信息,确定第一目标识别语句包括:根据所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述待识别语句,确定第一目标识别语句。11.根据权利要求10所述的方法,其中,根据所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述待识别语句,确定第一目标识别语句包括:对所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述待识别语句执行拼接操作,得到所述第一目标识别语句。12.根据权利要求10至11中任一项所述的方法,其中,基于所述待识别语句,确定与所述待识别语句相关联的参考语句信息包括:基于所述待识别语句,确定所述待识别语句所属的目标领域;根据所述目标领域,确定与所述待识别语句相关联的多个参考语句;针对所述多个参考语句中的每一个,根据所述参考语句,确定与该参考语句对应的参考词槽信息和参考词槽标识;以及根据所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一对话类型标识,确定所述参考语句信息。13.根据权利要求9至12中任一项所述的方法,还包括:根据所述待识别语句和第二对话类型标识,确定第二目标识别语句;以及将所述第二目标识别语句输入所述目标信息生成模型,生成针对所述待识别语句的对
话意图信息。14.一种信息生成模型的训练装置,包括:第一获取模块,用于获取第一训练文本,所述第一训练文本包括初始训练语句以及所述初始训练语句对应的词槽标签;第一确定模块,用于基于所述第一训练文本中的初始训练语句,确定与所述初始训练语句相关联的参考语句信息;第...

【专利技术属性】
技术研发人员:张红阳焦振宇孙叔琦常月
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1