【技术实现步骤摘要】
信息生成模型的训练方法、信息生成方法和装置
[0001]本公开涉及计算机
,具体为自然语言处理、深度学习等人工智能
,具体涉及一种信息生成模型的训练方法和装置、一种信息生成方法和装置、电子设备、存储介质和计算机程序产品。
技术介绍
[0002]随着人工智能技术的发展,在许多场景下会采用对话式的人机交互方式,以提升用户的体验,例如订票、订酒店等。目前通常采用对话意图信息和词槽信息来表示用户对话的语义信息。基于深度学习模型可以通过进行分类和序列标注任务,实现对话语句中的对话意图信息和词槽信息的识别。
[0003]但是,相关技术中需要通过人工方式来大量标注词槽名或者词槽描述,才能使模型能够较好地识别某个对话的词槽信息。上述方式不仅人工成本较高、训练效率低,而且模型的效果也会受到词槽标注质量的影响。
技术实现思路
[0004]本公开提供了一种信息生成模型的训练方法和装置、一种信息生成方法和装置、电子设备、存储介质和计算机程序产品。
[0005]根据本公开的一方面,提供了一种信息生成模型的训练方法,包括:获取第一训练文本,第一训练文本包括初始训练语句以及初始训练语句对应的词槽标签;基于第一训练文本中的初始训练语句,确定与初始训练语句相关联的参考语句信息;根据第一训练文本和参考语句信息,确定第二训练文本;以及利用第二训练文本对深度学习模型进行训练,得到初始信息生成模型。
[0006]根据本公开的另一方面,提供了一种信息生成方法,包括:获取待识别语句;基于待识别语句,确定与待识别 ...
【技术保护点】
【技术特征摘要】
1.一种信息生成模型的训练方法,包括:获取第一训练文本,所述第一训练文本包括初始训练语句以及所述初始训练语句对应的词槽标签;基于所述第一训练文本中的初始训练语句,确定与所述初始训练语句相关联的参考语句信息;根据所述第一训练文本和所述参考语句信息,确定第二训练文本;以及利用所述第二训练文本对深度学习模型进行训练,得到初始信息生成模型。2.根据权利要求1所述的方法,其中,所述参考语句信息包括第一对话类型标识、多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识;所述根据所述第一训练文本和所述参考语句信息,确定第二训练文本包括:根据所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一训练文本中的初始训练语句,确定第一目标训练语句;以及根据所述第一目标训练语句和所述词槽标签,确定所述第二训练文本。3.根据权利要求2所述的方法,其中,所述根据所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一训练文本中的初始训练语句,确定第一目标训练语句包括:对所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一训练文本中的初始训练语句执行拼接操作,得到所述第一目标训练语句。4.根据权利要求2至3中任一项所述的方法,其中,所述基于所述第一训练文本中的初始训练语句,确定与所述初始训练语句相关联的参考语句信息包括:基于所述第一训练文本中的初始训练语句,确定所述初始训练语句所属的目标领域;根据所述目标领域,确定与所述初始训练语句相关联的多个参考语句;针对所述多个参考语句中的每一个,根据所述参考语句,确定与该参考语句对应的参考词槽信息和参考词槽标识;以及根据所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一对话类型标识,确定所述参考语句信息。5.根据权利要求4所述的方法,其中,所述根据所述参考语句,确定与该参考语句对应的参考词槽信息和参考词槽标识包括:响应于根据所述参考语句,未得到与该参考语句对应的参考词槽信息和参考词槽标识,接收用户输入的配置信息;以及根据所述配置信息,确定与所述参考语句对应的参考词槽信息和参考词槽标识。6.根据权利要求2至5中任一项所述的方法,其中,所述利用所述第二训练文本对深度学习模型进行训练,得到初始信息生成模型包括:将所述第一目标训练语句输入所述深度学习模型,得到针对所述初始训练语句的词槽识别结果;根据所述词槽识别结果和所述词槽标签,确定第一损失值;以及根据所述第一损失值调整所述深度学习模型的参数,得到所述初始信息生成模型。
7.根据权利要求1至6中任一项所述的方法,还包括:根据所述初始训练语句和第二对话类型标识,确定第二目标训练语句;以及根据所述第二目标训练语句和所述初始训练语句对应的对话意图标签来训练所述初始信息生成模型,得到目标信息生成模型。8.根据权利要求7所述的方法,其中,所述根据所述第二目标训练语句和所述初始训练语句对应的对话意图标签来训练所述初始信息生成模型,得到目标信息生成模型包括:将所述第二目标训练语句输入所述初始信息生成模型,得到针对所述初始训练语句的对话意图识别结果;根据所述对话意图标签和所述对话意图识别结果,确定第二损失值;以及根据所述第二损失值调整所述初始信息生成模型的参数,得到所述目标信息生成模型。9.一种信息生成方法,包括:获取待识别语句;基于所述待识别语句,确定与所述待识别语句相关联的参考语句信息;基于所述待识别语句和所述参考语句信息,确定第一目标识别语句;以及将所述第一目标识别语句输入目标信息生成模型,生成针对所述待识别语句的词槽信息;其中,所述目标信息生成模型是根据权利要求7或8所述的方法训练得到的。10.根据权利要求9所述的方法,其中,所述参考语句信息包括第一对话类型标识、多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识;所述基于所述待识别语句和所述参考语句信息,确定第一目标识别语句包括:根据所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述待识别语句,确定第一目标识别语句。11.根据权利要求10所述的方法,其中,根据所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述待识别语句,确定第一目标识别语句包括:对所述第一对话类型标识、所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述待识别语句执行拼接操作,得到所述第一目标识别语句。12.根据权利要求10至11中任一项所述的方法,其中,基于所述待识别语句,确定与所述待识别语句相关联的参考语句信息包括:基于所述待识别语句,确定所述待识别语句所属的目标领域;根据所述目标领域,确定与所述待识别语句相关联的多个参考语句;针对所述多个参考语句中的每一个,根据所述参考语句,确定与该参考语句对应的参考词槽信息和参考词槽标识;以及根据所述多个参考语句、与多个参考语句分别对应的参考词槽信息和参考词槽标识以及所述第一对话类型标识,确定所述参考语句信息。13.根据权利要求9至12中任一项所述的方法,还包括:根据所述待识别语句和第二对话类型标识,确定第二目标识别语句;以及将所述第二目标识别语句输入所述目标信息生成模型,生成针对所述待识别语句的对
话意图信息。14.一种信息生成模型的训练装置,包括:第一获取模块,用于获取第一训练文本,所述第一训练文本包括初始训练语句以及所述初始训练语句对应的词槽标签;第一确定模块,用于基于所述第一训练文本中的初始训练语句,确定与所述初始训练语句相关联的参考语句信息;第...
【专利技术属性】
技术研发人员:张红阳,焦振宇,孙叔琦,常月,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。