基于机器学习的翻译方法、装置、设备及存储介质制造方法及图纸

技术编号:23363548 阅读:27 留言:0更新日期:2020-02-18 17:29
本申请公开了一种基于机器学习的翻译方法、装置、设备及存储介质,涉及人工智能领域,该方法包括:获取第一语种类型的句子;采用不同的分词器将所述句子划分为至少两个分词序列;根据所述至少两个分词序列生成所述句子的词图结构;调用编码器将所述词图结构转换为所述句子的中间向量表示;调用解码器将所述中间向量表示转换为第二语种类型的句子。由于该词图表示覆盖了句子的多种分词可能性,因此能够解决分词产生错误划分,本申请解决分词产生错误划分,导致句子产生错误的语义或歧义,从而对句子的语义造成不可修复的破坏的问题,提高机器翻译模型的翻译准确度。

Translation methods, devices, devices and storage media based on machine learning

【技术实现步骤摘要】
基于机器学习的翻译方法、装置、设备及存储介质
本申请实施例涉及人工智能领域,特别涉及一种基于机器学习的翻译方法、装置、设备及存储介质。
技术介绍
基于机器学习的翻译系统是目前主流的翻译系统。典型的,基于机器学习的翻译系统所使用的神经网络模型包括:编码器和解码器。在使用神经网络模型进行翻译时,由用户输入第一语种的句子,通过分词将句子表示成词序列,编码器将词序列转换为中间向量,解码器将中间向量转换为第二语种的句子。但是由于分词可能会产生错误划分,导致句子产生错误的语义或歧义,从而对句子的语义造成不可修复的破坏,最终的翻译结果较差。
技术实现思路
本申请实施例提供了一种基于机器学习的翻译方法、装置、设备及存储介质,可以解决分词产生错误划分,导致句子产生错误的语义或歧义,从而对句子的语义造成不可修复的破坏,翻译效果较差的问题。所述技术方案如下:一方面,提供了一种基于机器学习的翻译方法,该方法包括:获取第一语种类型的句子;采用不同的分词器将句子划分为至少两个分词序列;根据至少两个分词序列生成句子的词图结构,词图结构中的词图边对应候选分词,词图结构中的节点对应相邻候选分词之间的边界;调用编码器将词图结构基于与词图边垂直的维度转换为句子的中间向量表示;调用解码器将中间向量表示转换为第二语种类型的句子。另一方面,提供了一种基于机器学习的翻译装置,该装置包括:获取模块、分词模块、生成模块、编码模块和解码模块;获取模块,被配置为获取第一语种类型的句子;分词模块,被配置为采用不同的分词器将句子划分为至少两个分词序列;生成模块,被配置为根据至少两个分词序列生成句子的词图结构,词图结构中的词图边对应候选分词,词图结构中的节点对应相邻候选分词之间的边界;编码模块,被配置为调用编码器将词图结构基于与词图边垂直的维度转换为句子的中间向量表示;解码模块,被配置为调用解码器将中间向量表示转换为第二语种类型的句子。另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中提供的基于机器学习的翻译方法。另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中提供的基于机器学习的翻译方法。另一方面,提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如上述本申请实施例中提供的基于机器学习的翻译方法。本申请实施例提供的技术方案带来的有益效果至少包括:通过构建句子的词图表示,调用编码器将对源端语言生成的词图结构进行编码,将词图结构转换为句子的中间向量表示;由于该词图表示覆盖了句子的多种分词可能性,因此能够解决分词产生错误划分,导致句子产生错误的语义或歧义,从而对句子的语义造成不可修复的破坏的问题,提高机器翻译模型的翻译准确度。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是相关技术中的门控循环单元(GatedRecurrentUnit,GRU)的示意图;图2是相关技术中的机器翻译模型的结构框图;图3是本申请一个示例性实施例提供的机器翻译模型的结构框图;图4是本申请一个示例性实施例提供的基于机器学习的翻译方法的流程图;图5是本申请一个示例性实施例提供的翻译的示意图;图6是本申请一个示例性实施例提供的基于机器学习的翻译方法的流程图;图7是本申请一个示例性实施例提供的生成句子的词图结构的示意图;图8是本申请一个示例性实施例提供的基于机器学习的翻译方法的流程图;图9是本申请一个示例性实施例提供的基于机器学习的翻译方法的流程图;图10是本申请一个示例性实施例提供的对词图状态进行编码的示意图;图11是本申请一个示例性实施例提供的对词图状态进行编码的示意图;图12是本申请一个示例性实施例提供的对词图状态进行编码的示意图;图13是本申请一个示例性实施例提供的基于机器学习的翻译方法的流程图;图14是本申请一个示例性实施例提供的基于机器学习的翻译装置的框图;图15是本申请一个示例性实施例提供的服务器的结构框图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。首先,对本申请实施例中涉及的名词进行简单介绍:机器翻译:是指通过计算机将一种自然语言的句子翻译成另一种自然语言的句子的翻译方式。通常,该机器翻译是通过训练好的机器翻译模型对句子进行翻译,示意性的,通过大量的翻译语料样本对机器翻译模型进行训练,该翻译语料样本中包括多组第一自然语言的语料和第二自然语言的语料之间的对应关系,每个第一自然语言的语料对应一个第二自然语言的语料作为翻译结果,训练完成后,用户将第一自然语言的源端句子输入该机器翻译模型后,输出得到第二自然语言的目标端句子。示意性的,将中文句子翻译为英文句子,中文句子即为源端句子,英文句子即为目标端句子;比如,机器翻译模型将句子“我必须解决这个问题。”翻译为句子“Imustsolvetheproblem.”,则句子“我必须解决这个问题。”是源端句子,句子“Imustsolvetheproblem.”是目标端句子。循环神经网络(RecurrentNeuralNetwork,RNN):是一类人工神经网络,其可以通过为网络添加额外的权重来在网络图(networkgraph)中创建循环,以便维持一个内部状态。RNN应用于输入数据具有依赖性且是序列模式时的场景,即前一个输入和后一个输入是有关系的。RNN的隐藏层是循环的,这表明隐藏层的值不仅取决于当前的输入值,还取决于前一时刻隐藏层的值。具体的表现形式是RNN记住前面的信息并将其应用于计算当前输出的,这使得隐藏层之间的节点是有连接的。GRU:是长短期记忆网络(LongShort-TermMemory,LSTM)的一种变体。GRU的结构与LSTM很相似,LSTM有三个门,而GRU只有两个门且没有细胞状态,简化了LSTM的结构。结合参考图1,GRU的两个门是更新门z和重置门r,“更新门”的作用是控制前一时刻的单元状态有多少信息数能被带入到当前状态中,“重置门”的作用是控制前一状态能被写入到当前状态的信息数。示意性的,图2是相关技术中提供的机器翻译模型的结构框图,如图2所示,该机器翻译模型100通过注意力机本文档来自技高网...

【技术保护点】
1.一种基于机器学习的翻译方法,其特征在于,所述方法包括:/n获取第一语种类型的句子;/n采用不同的分词器将所述句子划分为至少两个分词序列;/n根据所述至少两个分词序列生成所述句子的词图结构,所述词图结构中的词图边对应候选分词,所述词图结构中的节点对应相邻候选分词之间的边界;/n调用编码器将所述词图结构基于与所述词图边垂直的维度转换为所述句子的中间向量表示;/n调用解码器将所述中间向量表示转换为第二语种类型的句子。/n

【技术特征摘要】
1.一种基于机器学习的翻译方法,其特征在于,所述方法包括:
获取第一语种类型的句子;
采用不同的分词器将所述句子划分为至少两个分词序列;
根据所述至少两个分词序列生成所述句子的词图结构,所述词图结构中的词图边对应候选分词,所述词图结构中的节点对应相邻候选分词之间的边界;
调用编码器将所述词图结构基于与所述词图边垂直的维度转换为所述句子的中间向量表示;
调用解码器将所述中间向量表示转换为第二语种类型的句子。


2.根据权利要求1所述的方法,其特征在于,所述采用不同的分词器将所述句子划分为至少两个分词序列,包括:
采用至少两个不同的分词器对所述句子分别进行分词处理,得到至少两个分词序列。


3.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个分词序列生成所述句子的词图结构,包括:
将所述至少两个分词序列分别进行图转换处理,得到至少两个图结构;
将所述至少两个图结构进行合并,得到所述句子的词图结构。


4.根据权利要求1至3任一所述的方法,其特征在于,所述调用编码器将所述词图结构基于与所述词图边垂直的维度转换为所述句子的中间向量表示,包括:
调用基于词图状态的编码器模型将所述词图结构基于与所述词图边垂直的维度转换为所述句子的中间向量表示;
其中,所述词图状态包括所述词图结构中的所有节点的状态集合和全局状态。


5.根据权利要求4所述的方法,其特征在于,所述基于词图状态的编码器模型是基于词图状态的循环神经网络;
所述调用基于词图结构的编码器模型基于与所述词图边垂直的维度将所述词图结构转换为所述句子的中间向量表示,包括:
调用所述基于词图状态的循环神经网络,将所述词图结构对应的词图状态进行T次迭代更新;
根据所述T次迭代更新的词图状态确定所述句子的中间向量表示。


6.根据权利要求5所述的方法,其特征在于,所述调用所述基于词图状态的编码器模型,将所述词图结构对应的词图状态进行T次迭代更新,包括:
在调用所述基于词图状态的编码器进行第t次迭代更新时,根据所述词图结构中的第i个节点vi在上一次迭代更新后的隐状态、所述第i个节点vi的邻接节点相关的状态信息和上一次迭代更新后的全局状态,更新得到所述第i个节点vi在本次迭代更新后的隐状态;
根据所有节点在本次迭代更新后的隐状态,更新得到本次迭代更新后的全局状态;
在所述t不等于T时,将所述t加一后重复上述两个步骤。


7.根据权利要求6所述的方法,其特征在于,所述邻接节点相关的状态信息,包括:入度边的融合信息、出度边的融合信息、入度节点的融合信息和出度节点的融合信息;
根据第一注意力机制将所述第i个节点在本次迭代更新中的入度边对应的候选词向量以及所述第i个节点的位置嵌入进行融合,得到所述入度边的融合信...

【专利技术属性】
技术研发人员:张祥文谢军
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1