机器翻译方法、装置及电子设备制造方法及图纸

技术编号：38986485 阅读：10 留言：0更新日期：2023-10-07 10:17

本发明专利技术提供了一种机器翻译方法、装置及电子设备，涉及于自然语言处理及转换技术领域，包括：获取待翻译文本；将待翻译文本输入至第一模型中，输出待翻译文本的第一上下文表示以及第一上下文表示对应的第一概率分布；从第一数据库中检索与第一上下文表示最近邻的第一键值对；基于第一键值对生成第二概率分布；基于第一概率分布和第二概率分布生成待翻译文本的翻译结果，提高了翻译的准确性。通过基于第一模型、第一模型对应的第一训练语料、第二模型和第二模型对应的第二训练语料进行跨语言迁移学习，提高了第二模型的利用率，利用第二模型对第一模型可以使用最近邻检索的性能进一步增强，以及增强了第一模型使用最近邻检索方法的实用性。索方法的实用性。索方法的实用性。

全部详细技术资料下载

【技术实现步骤摘要】
机器翻译方法、装置及电子设备

[0001]本专利技术涉及自然语言处理及转换
，尤其是涉及一种机器翻译方法、装置及电子设备。

技术介绍

[0002]机器翻译是指运用计算机技术将一种自然语言自动转换为另一种自然语言的过程。随着深度学习技术的发展，神经机器翻译已经成为目前机器翻译的主流方法，在高资源翻译场景已达到相对优越的性能。但神经机器翻译在低资源翻译场景中，性能会发生大幅下降，所以如何通过低资源模型开发过程中进行全面的跨语言迁移学习，进而提高低资源模型的性能和实用性，是当前亟待解决的问题。

技术实现思路

[0003]有鉴于此，本专利技术的目的在于提供一种机器翻译方法、装置及电子设备。
[0004]第一方面，本专利技术实施例提供了一种机器翻译方法，包括：获取待翻译文本；将待翻译文本输入至第一模型中，输出待翻译文本的第一上下文表示以及第一上下文表示对应的第一概率分布；第一模型用于第一语言与第二语言的互译；从第一数据库中检索与第一上下文表示最近邻的第一键值对；第一数据库基于第一模型、第一模型对应的第一训练语料、第二模型和第二模型对应的第二训练语料进行跨语言迁移学习的过程中获得，第二模型用于第三语言与第二语言的互译，键值对包括上下文表示和上下文表示对应的词元；基于第一键值对生成第二概率分布；基于第一概率分布和第二概率分布生成待翻译文本的翻译结果。
[0005]在本专利技术较佳的实施例中，上述第一模型、第一模型对应的第一训练语料、第二模型和第二模型对应的第二训练语料进行跨语言迁移学习得到第一...

【技术保护点】

【技术特征摘要】
1.一种机器翻译方法，其特征在于，包括：获取待翻译文本；将所述待翻译文本输入至第一模型中，输出所述待翻译文本的第一上下文表示以及所述第一上下文表示对应的第一概率分布；所述第一模型用于第一语言与第二语言的互译；从第一数据库中检索与所述第一上下文表示最近邻的第一键值对；所述第一数据库基于所述第一模型、所述第一模型对应的第一训练语料、第二模型和所述第二模型对应的第二训练语料进行跨语言迁移学习的过程中获得，所述第二模型用于第三语言与所述第二语言的互译，键值对包括上下文表示和所述上下文表示对应的词元；基于所述第一键值对生成第二概率分布；基于所述第一概率分布和所述第二概率分布生成所述待翻译文本的翻译结果。2.根据权利要求1所述的方法，其特征在于，基于所述第一模型、所述第一模型对应的第一训练语料、第二模型和所述第二模型对应的第二训练语料进行跨语言迁移学习得到所述第一数据库，包括：将所述第一训练语料包括的目标端句子输入至所述第二模型，输出平行语料；基于所述第二模型生成所述第二训练语料包括的词元的第二上下文表示；基于所述词元和所述第二上下文表示构成第二数据库；基于所述第二模型对所述平行语料进行推理得到第三上下文表示；从所述第二数据库中提取与所述第三上下文表示对应的第二键值对；基于所述第二键值对构成所述第一数据库。3.根据权利要求2所述的方法，其特征在于，所述将所述第一训练语料包括的目标端句子输入至所述第二模型，输出平行语料，包括：将所述目标端句子输入至所述第二模型，输出对应所述目标端句子的伪源端句子；合成所述伪源端句子、所述目标端句子和所述第一训练语料包括的源端句子，得到所述平行语料。4.根据权利要求2所述的方法，其特征在于，在所述将所述第二训练语料包括的目标端句子输入至所述第二模型，输出平行语料之后，所述方法包括：初始化所述第一模型；基于第一训练语料和所述平行语料训练初始化后的第一模型。5.根据权利要求4所述的方法，其特征在于，所述初始化所述第一模型，包括：将所述第二模型的嵌入层以外的参数复制到所述第一模型中；对比所述第二模型的第一词表和所述第一模型的第二词表；词表用于示出源端句子的词元和目标端句子的词元的对应关系；若所述第一词表中的第一词元和所述第二词表中的第二词元相同，将与所述第一词元对应的词元复制到所述第一模型中；将所述第二词表中的没有被初始化的其余词元基于正态分布随机初始化。6.根据权利要求4所述的方法，其特征在于，所述基于第一训练语料和所述平行语...

【专利技术属性】
技术研发人员：黄辉，刘树东，李昭聪，刘学博，
申请(专利权)人：澳门大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人