一种机器翻译方法及装置制造方法及图纸

技术编号：22167284 阅读：28 留言：0更新日期：2019-09-21 10:44

本申请提供一种机器翻译方法及装置。所述机器翻译方法，包括：获取待翻译语句；获取预先通过编码单元处理得到的背景知识向量集；将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理，得到第一编码向量；将所述第一编码向量输入至解码器中进行处理，得到所述待翻译语句的翻译语句。本申请提供的机器翻译方法及装置，通过将待翻译语句与背景知识相结合，以避免在翻译的过程中由于文化等差异带来的影响，提高翻译结果的准确性和贴合度。

A Machine Translation Method and Device

全部详细技术资料下载

【技术实现步骤摘要】
一种机器翻译方法及装置
本申请涉及计算机
，特别涉及一种机器翻译方法、装置、计算设备、计算机可读存储介质及芯片。
技术介绍
机器翻译，又称为自动翻译，是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。目前，机器翻译通常采用编码器-解码器框架，编码器负责将源语言句子压缩为语义空间中的一个向量，期望该向量包含源语言句子的主要信息；解码器将编码器提供的语义向量，作为输入，不断迭代，产生在语义上等价的目标端句子，即机器翻译结果。在机器翻译过程中，如何确定与源语言对应更为准确的目标语言是机器翻译一直需要解决的问题。
技术实现思路
有鉴于此，本申请实施例提供了一种机器翻译方法、装置、计算设备、计算机可读存储介质及芯片，以解决现有技术中存在的技术缺陷。本申请实施例公开了一种机器翻译方法，包括：获取待翻译语句；获取预先通过编码单元处理得到的背景知识向量集；将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理，得到第一编码向量；将所述第一编码向量输入至解码器中进行处理，得到所述待翻译语句的翻译语句。进一步地，在获取待翻译语句之前，还包括：获取背景知识，并将所述背景知识输入至编码单元进行处理，得到背景知识向量集。进一步地，所述编码单元包括知识嵌入层和卷积神经网络层，所述将所述背景知识输入至编码单元进行处理，得到背景知识向量集，包括：将所述背景知识输入至所述知识嵌入层进行处理，得到知识嵌入层的输出向量集；将所述知识嵌入层的输出向量集输入至所述卷积神经网络层进行处理，得到所述背景知识向量集。进一步地，所述编码器包括n个顺次连接的翻译编码层，其中，...

【技术保护点】
1.一种机器翻译方法，其特征在于，包括：获取待翻译语句；获取预先通过编码单元处理得到的背景知识向量集；将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理，得到第一编码向量；将所述第一编码向量输入至解码器中进行处理，得到所述待翻译语句的翻译语句。

【技术特征摘要】
1.一种机器翻译方法，其特征在于，包括：获取待翻译语句；获取预先通过编码单元处理得到的背景知识向量集；将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理，得到第一编码向量；将所述第一编码向量输入至解码器中进行处理，得到所述待翻译语句的翻译语句。2.根据权利要求1所述的机器翻译方法，其特征在于，在获取待翻译语句之前，还包括：获取背景知识，并将所述背景知识输入至编码单元进行处理，得到背景知识向量集。3.根据权利要求2所述的机器翻译方法，其特征在于，所述编码单元包括知识嵌入层和卷积神经网络层，所述将所述背景知识输入至编码单元进行处理，得到背景知识向量集，包括：将所述背景知识输入至所述知识嵌入层进行处理，得到知识嵌入层的输出向量集；将所述知识嵌入层的输出向量集输入至所述卷积神经网络层进行处理，得到所述背景知识向量集。4.根据权利要求1所述的机器翻译方法，其特征在于，所述编码器包括n个顺次连接的翻译编码层，其中，n≥1，且n为整数；所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理，得到第一编码向量，包括：S11、将所述待翻译语句转换为语句向量，并将所述语句向量输入至第1个翻译编码层进行处理，得到第1个翻译编码层的输出向量；S12、判断第i个翻译编码层的输出向量是否与所述背景知识向量集进行融合处理以及i是否等于n，其中，1≤i≤n，且i为整数；S13、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i等于n的情况下，将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量作为第一编码向量；S14、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i小于n的情况下，将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量输入至第i+1层，并将i+1赋值给i，执行步骤S12；S15、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i等于n的情况下，将所述第i个翻译编码层的输出向量作为第一编码向量；S16、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i小于n的情况下，将所述第i个翻译编码层的输出向量输入至第i+1层，并将i+1赋值给i，执行上述判断步骤S12。5.根据权利要求4所述的机器翻译方法，其特征在于，所述编码器还包括源嵌入层，所述翻译编码层包括自注意力层和前馈神经网络层，所述将所述待翻译语句转换为语句向量，并将所述语句向量输入至第1个翻译编码层进行处理，得到第1个翻译编码层的输出向量，包括：将所述待翻译语句输入至所述源嵌入层进行处理，得到所述语句向量；将所述语句向量输入至所述自注意力层进行处理，得到所述自注意力层的输出向量；将所述自注意力层的输出向量输入至所述前馈神经网络层进行处理，得到所述第1个翻译编码层的输出向量。6.根据权利要求4所述的机器翻译方法，其特征在于，所述背景知识向量集包括至少一个背景知识向量，将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理，得到融合向量，包括：计算所述第i个翻译编码层的输出向量和所述背景知识向量集中的每一个所述背景知识向量之间的相关度；基于所述相关度为每一个所述背景知识向量配置相关度权重；基于所述背景知识向量的相关度权重，将所述第i个翻译编码层的输出向量与所述背景知识向量融合，得到所述融合向量。7.根据权利要求1所述的机器翻译方法，其特征在于，所述编码器包括所述编码单元以及一个编码层；所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理，得到第一编码向量，包括：将所述待翻译语句转换为语句向量；将所述语句向量与所述背景知识向量集输入至所述编码层中进行处理，得到所述第一编码向量。8.根据权利要求7所述的机器翻译方法，其特征在于，所述编码层包括...

【专利技术属性】
技术研发人员：李长亮，郭馨泽，唐剑波，王怡然，
申请(专利权)人：北京金山数字娱乐科技有限公司，成都金山数字娱乐科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人