一种机器翻译方法及装置制造方法及图纸

技术编号:22167284 阅读:28 留言:0更新日期:2019-09-21 10:44
本申请提供一种机器翻译方法及装置。所述机器翻译方法,包括:获取待翻译语句;获取预先通过编码单元处理得到的背景知识向量集;将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量;将所述第一编码向量输入至解码器中进行处理,得到所述待翻译语句的翻译语句。本申请提供的机器翻译方法及装置,通过将待翻译语句与背景知识相结合,以避免在翻译的过程中由于文化等差异带来的影响,提高翻译结果的准确性和贴合度。

A Machine Translation Method and Device

【技术实现步骤摘要】
一种机器翻译方法及装置
本申请涉及计算机
,特别涉及一种机器翻译方法、装置、计算设备、计算机可读存储介质及芯片。
技术介绍
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。目前,机器翻译通常采用编码器-解码器框架,编码器负责将源语言句子压缩为语义空间中的一个向量,期望该向量包含源语言句子的主要信息;解码器将编码器提供的语义向量,作为输入,不断迭代,产生在语义上等价的目标端句子,即机器翻译结果。在机器翻译过程中,如何确定与源语言对应更为准确的目标语言是机器翻译一直需要解决的问题。
技术实现思路
有鉴于此,本申请实施例提供了一种机器翻译方法、装置、计算设备、计算机可读存储介质及芯片,以解决现有技术中存在的技术缺陷。本申请实施例公开了一种机器翻译方法,包括:获取待翻译语句;获取预先通过编码单元处理得到的背景知识向量集;将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量;将所述第一编码向量输入至解码器中进行处理,得到所述待翻译语句的翻译语句。进一步地,在获取待翻译语句之前,还包括:获取背景知识,并将所述背景知识输入至编码单元进行处理,得到背景知识向量集。进一步地,所述编码单元包括知识嵌入层和卷积神经网络层,所述将所述背景知识输入至编码单元进行处理,得到背景知识向量集,包括:将所述背景知识输入至所述知识嵌入层进行处理,得到知识嵌入层的输出向量集;将所述知识嵌入层的输出向量集输入至所述卷积神经网络层进行处理,得到所述背景知识向量集。进一步地,所述编码器包括n个顺次连接的翻译编码层,其中,n≥1,且n为整数;所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量,包括:S11、将所述待翻译语句转换为语句向量,并将所述语句向量输入至第1个翻译编码层进行处理,得到第1个翻译编码层的输出向量;S12、判断第i个翻译编码层的输出向量是否与所述背景知识向量集进行融合处理以及i是否等于n,其中,1≤i≤n,且i为整数;S13、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i等于n的情况下,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量作为第一编码向量;S14、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i小于n的情况下,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量输入至第i+1层,并将i+1赋值给i,执行步骤S12;S15、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i等于n的情况下,将所述第i个翻译编码层的输出向量作为第一编码向量;S16、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i小于n的情况下,将所述第i个翻译编码层的输出向量输入至第i+1层,并将i+1赋值给i,执行上述判断步骤S12。进一步地,所述编码器还包括源嵌入层,所述翻译编码层包括自注意力层和前馈神经网络层,所述将所述待翻译语句转换为语句向量,并将所述语句向量输入至第1个翻译编码层进行处理,得到第1个翻译编码层的输出向量,包括:将所述待翻译语句输入至所述源嵌入层进行处理,得到所述语句向量;将所述语句向量输入至所述自注意力层进行处理,得到所述自注意力层的输出向量;将所述自注意力层的输出向量输入至所述前馈神经网络层进行处理,得到所述第1个翻译编码层的输出向量。进一步地,所述背景知识向量集包括至少一个背景知识向量,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理,得到融合向量,包括:计算所述第i个翻译编码层的输出向量和所述背景知识向量集中的每一个所述背景知识向量之间的相关度;基于所述相关度为每一个所述背景知识向量配置相关度权重;基于所述背景知识向量的相关度权重,将所述第i个翻译编码层的输出向量与所述背景知识向量融合,得到所述融合向量。进一步地,所述编码器包括编码单元以及一个编码层;所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量,包括:将所述待翻译语句转换为语句向量;将所述语句向量与所述背景知识向量集输入至所述编码层中进行处理,得到所述第一编码向量。进一步地,所述编码层包括自注意力层、知识注意力层和前馈神经网络层,所述将所述语句向量与所述背景知识向量集输入至所述编码层中进行处理,得到所述第一编码向量,包括:将所述语句向量输入至所述编码层的自注意力层中进行处理,得到自注意力层的输出向量;将所述背景知识向量集与所述自注意力层的输出向量输入至所述知识注意力层中进行融合处理,得到知识注意力层的输出向量;将所述知识注意力层的输出向量输入至所述前馈神经网络层中进行处理,得到所述第一编码向量。进一步地,所述编码器包括编码单元以及m个顺次连接的编码层,其中,m>1,且m为整数;所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量,包括:S21、将所述待翻译语句转换为语句向量,并输入至第1个编码层中进行处理,得到第1个编码层的输出向量;S22、将第p个编码层的输出向量与所述背景知识向量集输入至第p+1个编码层中进行融合处理,得到第p+1个编码层的输出向量,其中,1≤p<m,且p为整数;S23、判断p+1是否等于m,若是,则执行步骤S24,若否,则执行步骤S25;S24、将所述第p+1个编码层的输出向量作为第一编码向量;S25、将p+1赋值给p,执行步骤S22。进一步地,所述编码层包括自注意力层、知识注意力层和前馈神经网络层,所述将背景知识向量集与第p个编码层的输出向量输入至第p+1个编码层中进行融合处理,得到第p+1个编码层的输出向量,包括:将所述第p个编码层的输出向量输入至第p+1个编码层的自注意力层中进行处理,得到自注意力层的输出向量;将所述背景知识向量集与所述自注意力层的输出向量输入至所述知识注意力层中进行融合处理,得到知识注意力层的输出向量;将所述知识注意力层的输出向量输入至所述前馈神经网络层中进行处理,得到所述第p+1个编码层的输出向量。进一步地,所述背景知识向量集包括至少一个背景知识向量,所述将所述背景知识向量集与所述自注意力层的输出向量输入至所述知识注意力层中进行融合处理,得到知识注意力层的输出向量,包括:计算所述自注意力层的输出向量与所述背景知识向量集中的每一个所述背景知识向量之间的相关度;判断所述自注意力层的输出向量与所述背景知识向量之间的相关度是否大于目标阈值;若是,基于所述相关度为所述背景知识向量配置权重,并基于所述背景知识向量的权重与所述自注意力层的输出向量进行融合处理,得到融合向量;若否,将所述自注意力层的输出向量作为融合向量。进一步地,所述解码器包括至少一个解码层,所述将所述第一编码向量输入至解码器中进行处理,得到所述待翻译语句的翻译语句,包括:将所述第一编码向量分别输入至所述解码器中的每一个所述解码层中进行处理,并根据所述解码层的输出向量得到所述待翻译语句的翻译语句。一种机器翻译装置,包括:第一获取模块,被配置为获取待翻译语句。第二获取模块,被配置为获取预先通过编码单元处理得到的背景知识向量集。编码模块,被本文档来自技高网...

【技术保护点】
1.一种机器翻译方法,其特征在于,包括:获取待翻译语句;获取预先通过编码单元处理得到的背景知识向量集;将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量;将所述第一编码向量输入至解码器中进行处理,得到所述待翻译语句的翻译语句。

【技术特征摘要】
1.一种机器翻译方法,其特征在于,包括:获取待翻译语句;获取预先通过编码单元处理得到的背景知识向量集;将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量;将所述第一编码向量输入至解码器中进行处理,得到所述待翻译语句的翻译语句。2.根据权利要求1所述的机器翻译方法,其特征在于,在获取待翻译语句之前,还包括:获取背景知识,并将所述背景知识输入至编码单元进行处理,得到背景知识向量集。3.根据权利要求2所述的机器翻译方法,其特征在于,所述编码单元包括知识嵌入层和卷积神经网络层,所述将所述背景知识输入至编码单元进行处理,得到背景知识向量集,包括:将所述背景知识输入至所述知识嵌入层进行处理,得到知识嵌入层的输出向量集;将所述知识嵌入层的输出向量集输入至所述卷积神经网络层进行处理,得到所述背景知识向量集。4.根据权利要求1所述的机器翻译方法,其特征在于,所述编码器包括n个顺次连接的翻译编码层,其中,n≥1,且n为整数;所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量,包括:S11、将所述待翻译语句转换为语句向量,并将所述语句向量输入至第1个翻译编码层进行处理,得到第1个翻译编码层的输出向量;S12、判断第i个翻译编码层的输出向量是否与所述背景知识向量集进行融合处理以及i是否等于n,其中,1≤i≤n,且i为整数;S13、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i等于n的情况下,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量作为第一编码向量;S14、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i小于n的情况下,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量输入至第i+1层,并将i+1赋值给i,执行步骤S12;S15、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i等于n的情况下,将所述第i个翻译编码层的输出向量作为第一编码向量;S16、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i小于n的情况下,将所述第i个翻译编码层的输出向量输入至第i+1层,并将i+1赋值给i,执行上述判断步骤S12。5.根据权利要求4所述的机器翻译方法,其特征在于,所述编码器还包括源嵌入层,所述翻译编码层包括自注意力层和前馈神经网络层,所述将所述待翻译语句转换为语句向量,并将所述语句向量输入至第1个翻译编码层进行处理,得到第1个翻译编码层的输出向量,包括:将所述待翻译语句输入至所述源嵌入层进行处理,得到所述语句向量;将所述语句向量输入至所述自注意力层进行处理,得到所述自注意力层的输出向量;将所述自注意力层的输出向量输入至所述前馈神经网络层进行处理,得到所述第1个翻译编码层的输出向量。6.根据权利要求4所述的机器翻译方法,其特征在于,所述背景知识向量集包括至少一个背景知识向量,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理,得到融合向量,包括:计算所述第i个翻译编码层的输出向量和所述背景知识向量集中的每一个所述背景知识向量之间的相关度;基于所述相关度为每一个所述背景知识向量配置相关度权重;基于所述背景知识向量的相关度权重,将所述第i个翻译编码层的输出向量与所述背景知识向量融合,得到所述融合向量。7.根据权利要求1所述的机器翻译方法,其特征在于,所述编码器包括所述编码单元以及一个编码层;所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量,包括:将所述待翻译语句转换为语句向量;将所述语句向量与所述背景知识向量集输入至所述编码层中进行处理,得到所述第一编码向量。8.根据权利要求7所述的机器翻译方法,其特征在于,所述编码层包括...

【专利技术属性】
技术研发人员:李长亮郭馨泽唐剑波王怡然
申请(专利权)人:北京金山数字娱乐科技有限公司成都金山数字娱乐科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1