一种基于全局-局部对比学习的跨语言自然语言理解方法技术

技术编号：37809581 阅读：10 留言：0更新日期：2023-06-09 09:39

本发明专利技术涉及一种基于全局

全部详细技术资料下载

【技术实现步骤摘要】
一种基于全局
‑
局部对比学习的跨语言自然语言理解方法

[0001]本专利技术属于自然语言处理
，涉及一种基于全局
‑
局部对比学习的跨语言自然语言理解方法。

技术介绍

[0002]目前，语言依旧是人流交流信息的第一载体，是一种最为有效、便捷的方式，语音交互作为人机通信中最自然、直接的交互方式，具有天然的优势。作为其中的一项关键技术，自然语言理解通常包含意图检测和槽位填充两个子任务。为了使自然语言理解模型能够更好的应用于缺乏大量标记数据的低资源语言，许多研究都聚焦于使用零样本学习构建网络，零样本学习的方法可以利用高资源语言中的标记数据来训练模型，并将其转移到目标低资源语言上得以应用。
[0003]虽然零样本学习能大大减少人工标记数据的工作量，并且也在领域内实现了很好的效果，但是该方法仅依赖于共享参数，并且只能执行跨语言的隐式对齐。这种机制带来了两个问题，其一，这种隐式对齐的过程在目前看来还是一个黑箱，不仅严重影响对齐表示，而且难以分析其对齐机制；其二，许多研究工作并没有充分考虑到两个子任务的不同细粒度层级，例如：意图检测是句子级的，而槽位填充是字符级的，这会导致意图和槽位之间无法相互接收一些来自不同粒度层级的迁移信息，影响了模型的预测性能。因此，现在的工作在于弥补现有基于零样本学习的自然语言理解模型在对齐机制和子任务交互方面存在的缺陷。

技术实现思路

[0004]有鉴于此，本专利技术的目的在于提供一种基于全局
‑
局部对比学习的跨语言自然语...

【技术保护点】

【技术特征摘要】
1.一种基于全局
‑
局部对比学习的跨语言自然语言理解方法，其特征在于：该方法包括以下步骤：S1、生成原始话语序列，根据跨语言字典将原始话语序列翻译为正样本，将正样本输入到跨语言预训练模型中得到对应的编码表示；S2、根据经过编码的原始话语序列、正样本以及前一时刻的负样本生成负样本队列，将负样本队列输入到跨语言预训练模型中得到对应的编码表示；S3、通过建立损失函数来构建局部句子级意图对比学习模块，实现跨语言句子表示对齐；S4、通过建立损失函数来构建局部字符级槽位对比学习模块，实现跨语言字符表示对齐；S5、通过建立损失函数来构建全局语义级意图
‑
槽位对比学习模块，实现意图和槽位的表示对齐，完成跨语言理解。2.根据权利要求1所述的跨语言自然语言理解方法，其特征在于：在步骤S1中，对于原始话语序列中的每个字符，在跨语言字典中随机选择相应的翻译字符进行替换以生成正样本；将正样本输入到预训练模型中，通过其中的双向循环神经网络生成隐层状态表示h
i
＝BiLSTM(θ
emb
(x
i
),h
i
‑1,h
i+1
)，其中θ
emb
表示向量化函数，最终可得到针对正样本的编码表示为：式中，分别表示正样本开始标志位的向量表示和结束标志位的向量表示，表示正样本中各字符被编码后形成的向量表示。3.根据权利要求1所述的跨语言自然语言理解方法，其特征在于：在步骤S2中，将负样本输入到预训练模型中得到的编码表示为：式中，K表示负样本队列的最大容量，表示负样本队列开始标志位的向量表示，表示负样本队列中各字符被编码后形成的向量表示。4.根据权利要求1所述的跨语言自然语言理解方法，其特征在于：在步骤S3中，通过设计损失函数来构建局部句子级意图对比学习模块，损失函数如下式：式中，s([],[])表示点积操作，h
CLS
表示原始话语序列开始标志位的向量表示，表示正样本中开始标志位的向量表示，表示负样本队列中开始标志位的向量表示，K表示负样本队列的最大容量。5.根据权利要求1所述的跨语言...

【专利技术属性】
技术研发人员：李鹏华，黄子恒，张奕辉，谢潇，刘学超，唐培渊，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人