【技术实现步骤摘要】
用于确定响应语句的方法、设备、装置和介质
[0001]本公开的示例实施例总体涉及计算机领域,特别地涉及用于确定响应语句的方法、设备、装置和计算机可读存储介质。
技术介绍
[0002]在自然语言处理(NLP)领域中,基于人工智能的各种对话处理技术已经得到显著发展,并且具有广泛应用。自然语言处理可以应用于多种不同的对话处理系统和应用。例如,对话处理技术可以应用于能够与用户进行交互的智能对话系统,以协助用户执行具体的任务。针对这些对话处理系统,通常需要利用诸如语言理解模型等的模型来确定准确的响应语句。所确定的响应语句的准确性影响着对话处理任务的准确性。因此,期望用于确定响应语句的模型具有良好的处理能力和准确性。
技术实现思路
[0003]根据本公开的示例实施例,提供了一种用于确定响应语句的方案。
[0004]在本公开的第一方面,提供了一种的方法。该方法包括基于源语句序列和候选响应语句,根据响应确定模型,确定候选响应语句与对应于源语句序列的正确响应语句之间的匹配得分。该方法还包括基于匹配得分和候选响应语句的标注信息来确定第一损失。第一损失表示匹配得分与标注信息之间的相似程度。标注信息表示候选响应语句是否是正确响应语句。该方法还包括基于源对话序列、正样本对话序列和负样本对话序列来确定第二损失。源对话序列包括源语句序列和候选响应语句。正样本对话序列至少包括正确响应语句。负样本对话序列包括源语句序列和针对源语句序列的错误响应语句。第二损失表示相比负样本对话序列,正样本对话序列与源对话序列之间的相似程度。该方 ...
【技术保护点】
【技术特征摘要】
1.一种用于确定响应语句的方法,包括:基于源语句序列和候选响应语句,根据响应确定模型,确定所述候选响应语句与对应于所述源语句序列的正确响应语句之间的匹配得分;基于所述匹配得分和所述候选响应语句的标注信息来确定第一损失,所述第一损失表示所述匹配得分与所述标注信息之间的相似程度,所述标注信息表示所述候选响应语句是否是所述正确响应语句;基于源对话序列、正样本对话序列和负样本对话序列来确定第二损失,所述源对话序列包括所述源语句序列和所述候选响应语句,所述正样本对话序列至少包括所述正确响应语句,所述负样本对话序列包括所述源语句序列和针对所述源语句序列的错误响应语句,所述第二损失表示相比所述负样本对话序列,所述正样本对话序列与所述源对话序列之间的相似程度;以及基于所述第一损失和所述第二损失的值,训练所述响应确定模型。2.根据权利要求1所述的方法,还包括:基于所述源语句序列和所述正确响应语句来确定所述正样本对话序列。3.根据权利要求2所述的方法,其中确定所述正样本对话序列包括:交换所述源语句序列中的第一语句和第二语句的顺序,所述第一语句和所述第二语句不是所述源语句序列中的最后语句;以及基于经交换语句顺序的所述源语句序列和所述正确响应语句,确定所述正样本对话序列。4.根据权利要求2所述的方法,其中确定所述正样本对话序列包括:改变所述源语句序列中的第三语句中的词语的顺序,所述第三语句不是所述源语句序列中的最后语句;以及基于经改变词语顺序的所述源语句序列和所述正确响应语句,确定所述正样本对话序列。5.根据权利要求1所述的方法,其中所述响应确定模型包括预训练的语言模型。6.根据权利要求5所述的方法,其中确定所述第二损失包括:基于所述源对话序列、所述正样本对话序列和所述负样本对话序列,根据所述预训练的语言模型,分别确定源对话标记序列、正样本对话标记序列和负样本对话标记序列;以及基于所述源对话标记序列与所述正样本对话标记序列之间的相似程度以及所述源对话标记序列与所述负样本对话标记序列之间的相似程度,确定所述第二损失。7.根据权利要求5所述的方法,其中所述响应确定模型还包括预训练的分类器;并且其中确定所述匹配得分包括:基于所述源语句序列和所述候选响应语句,根据所述预训练的语言模型,确定源对话分类标记;以及基于所述源对话分类标记,根据所述预训练的分类器,确定所述匹配得分。8.根据权利要求7所述的方法,其中训练所述响应确定模型包括:通过最小化所述第一损失与所述第二损失的和,调整所述预训练的分类器和所述预训练的语言模型各自的参数,以获得经训练的所述响应确定模型。9.一种电子设备,包括:
至少一个处理单元;以及至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令在由所述至少一个处理单元执行时使所述电子设备执行以下动作:基于第一参考图像,根据第一模型,生成所述第一参考图像的第一特征表示;基于源语句序列和候选响应语句,根据响应确定模型,确定所述候选响应语句与对应于所述源语句序列的正确响应语句之间的匹配得分;基于所述匹配得分和所述候选响应语句的标注信息来确定第一损失,所述第一损失表示所述匹配得分与所述标注信息之间的相似程度,所述标注信息表示所述候选响应语句是否是所述正确响应语句;基于源对话序列、正样本对话序列和负样本对话序列来...
【专利技术属性】
技术研发人员:徐爽,黄浩然,李航,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。