机器翻译方法、机器翻译模型训练方法、装置及存储介质制造方法及图纸

技术编号：28375448 阅读：30 留言：0更新日期：2021-05-08 00:02

本申请公开了人工智能领域中的一种机器翻译方法、机器翻译模型训练方法、装置及存储介质。其中，该机器翻译方法包括：获取待翻译文本，并从该待翻译文本中获取当前语句的扩展语句，接下来对扩展语句进行编码处理，以得到编码输出；并对扩展语句进行关注偏向分析，以得到扩展语句的关注偏向信息；最后再根据扩展语句的关注偏向信息对编码输出进行解码处理，从而得到当前语句的翻译结果。通过扩展语句的关注偏向信息能够提高在解码过程中更多的关注当前语句以及与当前语句相关的上下文语句的词，可以提高机器翻译的效果。

全部详细技术资料下载

【技术实现步骤摘要】
机器翻译方法、机器翻译模型训练方法、装置及存储介质
本申请涉及自然语言处理领域，特别涉及一种机器翻译方法、机器翻译模型训练方法、装置及存储介质。
技术介绍
人工智能(artificialintelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。随着人工智能技术的不断发展，让人机之间能够通过自然语言进行交互的自然语言人机交互系统变的越来越重要。人机之间能够通过自然语言进行交互，就需要系统能够识别出人类自然语言的具体含义。通常，系统通过采用对自然语言的句子进行关键信息提取来识别句子的具体含义。传统的机器翻译方法为了能够更好地对篇章语句的翻译，在对当前语句进行翻译时，是将当前语句和上下文合并在一起得到扩展语句，然后将该扩展语句输入到翻译模型中进行翻译，以得到当前语句的翻译语句。
技术实现思路
本申请提供一种机器翻译方法、机器翻译模型训练方法、装置及存储介质，以提高机器翻译的效果。第一方面，提供了一种机器翻译方法，该机器翻译方法包括：获取待翻译文本；获取当前语句的扩展语句，该扩展语句包括当前语句和当前语句的上下文语句；对扩展语句进行编码处理，得到编码输出；对扩展语句进行...

【技术保护点】
1.一种机器翻译方法，其特征在于，包括：/n获取待翻译文本，所述待翻译文本由一段或者多段语句构成，所述待翻译文本包括当前语句以及所述当前语句的上下文语句，所述当前语句是当前需要进行翻译的语句；/n获取所述当前语句的扩展语句，所述扩展语句包括所述当前语句和所述当前语句的上下文语句；/n对所述扩展语句进行编码处理，得到编码输出；/n对所述扩展语句进行关注偏向分析，得到所述扩展语句的关注偏向信息，所述扩展语句的关注偏向信息包括后续对所述编码输出进行解码处理时对所述扩展语句中的每个词的关注偏向值；/n根据所述扩展语句的关注偏向信息对所述编码输出进行解码处理，得到所述当前语句的翻译结果。/n

【技术特征摘要】
1.一种机器翻译方法，其特征在于，包括：
获取待翻译文本，所述待翻译文本由一段或者多段语句构成，所述待翻译文本包括当前语句以及所述当前语句的上下文语句，所述当前语句是当前需要进行翻译的语句；
获取所述当前语句的扩展语句，所述扩展语句包括所述当前语句和所述当前语句的上下文语句；
对所述扩展语句进行编码处理，得到编码输出；
对所述扩展语句进行关注偏向分析，得到所述扩展语句的关注偏向信息，所述扩展语句的关注偏向信息包括后续对所述编码输出进行解码处理时对所述扩展语句中的每个词的关注偏向值；
根据所述扩展语句的关注偏向信息对所述编码输出进行解码处理，得到所述当前语句的翻译结果。

2.如权利要求1所述的机器翻译方法，其特征在于，所述上下文语句的中的任意一个词的关注偏向值小于所述当前语句中任意一个词的关注偏向值。

3.如权利要求1或2所述的机器翻译方法，其特征在于，在所述上下文语句中，与所述当前语句不存在关联关系的任意一个词的关注偏向值小于与所述当前语句存在关联关系的任意一个词的关注偏向值。

4.如权利要求3所述的机器翻译方法，其特征在于，所述上下文语句中的词与所述当前语句是否存在关联关系是根据预设的知识库来确定的，所述预设的知识库中保存有存在关联关系的词。

5.如权利要求3所述的机器翻译方法，其特征在于，所述上下文语句中的词与所述当前语句是否存在关联关系是采用神经网络模型对所述上下文语句中的词和所述当前语句中的词进行语义分析确定的。

6.如权利要求1-5中任一项所述的机器翻译方法，其特征在于，所述对所述扩展语句进行编码处理，得到编码输出，包括：
对所述扩展语句进行词汇编码，得到所述扩展语句的词汇编码序列；
对所述扩展语句进行反向位置编码，得到所述扩展语句的反向位置编码序列，其中，在所述扩展语句的反向位置编码序列中，所述当前语句中的任意一个词的位置序号小于所述上下文语句中的任意一个词的位置序号；
对所述扩展语句的词汇编码序列和所述扩展语句的反向位置编码序列进行编码，得到所述编码输出。

7.如权利要求1-5中任一项所述的机器翻译方法，其特征在于，所述对所述扩展语句进行编码处理，得到编码输出，包括：
对所述扩展语句进行词汇编码，得到所述扩展语句的词汇编码序列；
对所述扩展语句进行输入类型编码，得到所述扩展语句的输入类型编码序列，所述扩展语句的输入类型编码序列用于指示所述扩展语句中的每个词的输入类型为当前语句或者上下文语句；
对所述扩展语句的词汇编码序列和所述扩展语句的输入类型编码序列进行编码，得到所述编码输出。

8.一种机器翻译模型的训练方法，其特征在于，包括：
获取训练语句，所述训练语句包括扩展语句，所述扩展语句包括当前语句以及所述当前语句的上下文语句，所述当前语句是当前需要进行翻译的语句，所述训练语句还包括所述当前语句的目标译文；
对所述扩展语句进行关注偏向分析，得到所述扩展语句的关注偏向信息，所述扩展语句的关注偏向信息包括后续对所述编码输出进行解码处理时对所述扩展语句中的每个词的关注偏向值；
根据所述训练语句和所述扩展语句的关注度偏向信息，对机器翻译模型进行训练，以得到满足预设要求的所述机器翻译模型。

9.如权利要求8所述的训练方法，其特征在于，所述上下文语句的中的任意一个词的关注偏向值小于所述当前语句中任意一个词的关注偏向值。

10.如权利要求8或9所述的训练方法，其特征在于，在所述上下文语句中，与所述当前语句不存在关联关系的任意一个词的关注偏向值小于与所述当前语句存在关联关系的任意一个词的关注偏向值。

11.如权利要求10所述的训练方法，其特征在于，所述上下文语句中的词与所述当前语句是否存在关联关系是根据预设的知识库来确定的，所述预设的知识库中保存有存在关联关系的词。

12.如权利要求10所述的训练方法，其特征在于，所述上下文语句中的词与所述当前语句是否存在关联关系是采用神经网络模型对所述上下文语句中的词和所述当前语句中的词进行语义分析确定的。

13.如权利要求8-12中任一项所述的训练方法，其特征在于，所述根据所述训练语句和所述扩展语句的关注度偏向信息，对机器翻译模型进行训练，以得到满足预设要求的所述机器翻译模型，包括：
采用所述机器翻译模型中的编码器对所述扩展语句进行编码处理，得到编码输出；
采用所述机器翻译模型中的解码器对所述编码输出和所述扩展语句的关注度偏向信息进行解码处理，得到所述当前语句的翻译结果；
根据所述当前语句的翻译结果和所述当前语句的目标译文，确定所述机器翻译模型的预测损失；
根据所述机器翻译模型的预测损失对所述机器翻译模型的模型参数进行更新，以得到满足预设要求的所述机器翻译模型。

14.如权利要求13所述的训练方法，其特征在于，所述采用所述机器翻译模型中的编码器对所述扩展语句进行编码处理，得到编码输出，包括：
对所述扩展语句进行词汇编码，得到所述扩展语句的词汇编码序列；
对所述扩展语句进行反向位置编码，得到所述扩展语句的反向位置编码序列，其中，在所述扩展语句的反向位置编码序列中，所述当前语句中的任意一个词的位置序号小于所述上下文语句中的任意一个词的位置序号；
对所述扩展语句的词汇编码序列和所述扩展语句的反向位置编码序列进行编码，得到所述编码输出。

15.如权利要求13所述的训练方法，其特征在于，所述采用所述机器翻译模型中的编码器对所述扩展语句进行编码处理，得到编码输出，包括：
对所述扩展语句进行词汇编码，得到所述扩展语句的词汇编码序列；
对所述扩展语句进行输入类型编码，得到所述扩展语句的输入类型编码序列，所述扩展语句的输入类型编码序列用于指示所述扩展语句中的每个词的输入类型为当前语句或者上下文语句；
对所述扩展语句的词汇编码序列和所述扩展语句的输入类型编码序列进行编码，得到所述编码输出。

16.如权利要求8-12中任一项所述的训练方法，其特征在于，所述根据所述训练语句和所述扩展语句的关注度偏向信息，对机器翻译模型进行训练，以得到满足预设要求的所述机器翻译模型，包括：
采用所述机器翻译模型中的编码器对所述扩展语句进行编码处理，得到编码输出；
采用所述机器翻译模型中的解码器对所述编码输出和所述扩展语句的关注度偏向信息进行解码处理，得到所述当前语句的翻译结果；
根据所述当前语句的翻译结果和所述当前语句的目标译文，确定所述机器翻译模型的预测损失；
确定所述机器翻译模型的编码损失；
根据所述机器翻译模型的编码损失和所述机器翻译模型的预测损失，对所述机器翻译模型的模型参数进行更新。

17.如权利要求16所述的训练方法，其特征在于，所述确定所述机器翻译模型的编码损失，包括：
对所述扩展语句中的至少一个词进行替换处理，得到替换处理后的扩展语句，所述替换处理后的扩展语句包括至少一个替换符号；
对所述替换处理后的扩展语句进行编码处理，得到所述替换处理后的扩展语句对应的编码输出；
根据所述替换处理后的扩展语句对应的编码输出获得所述至少一个替换符号对应的向量；
根据所述至少一个替换符号对应的向量进行预测，得到所述至少一个替换符号的预测结果，所述至少一个替换符号的预测结果用于预测被所述至少一个替换符号替换掉的真实词；
根据所述至少一个替换符号的预测结果与被所述至少一个替换符号替换掉的真实词的差异，确定所述机器翻译模型的编码损失。

18.如权利要求16所述的训练方法，其特征在于，所述确定所述机器翻译模型的编码损失，包括：
采用所述机器翻译模型中的编码器对所述编码输入进行处理，得到所述扩展语句的编码输出；
根据所述编码输出进行预测，得到所述扩展语句的预测结果，所述扩展语句的预测结果用于预测所述扩展语句包含的词；
根据所述当前扩展语句的预测结果与所述扩展语句包含的词的差异，确定所述编码损失。

19.一种机器翻译装置，其特征在于，包括：
获取单元，用于获取待翻...

【专利技术属性】
技术研发人员：李良友，蒋欣，刘群，钱莉，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人