基于机器学习的翻译方法、装置、设备及存储介质制造方法及图纸

技术编号：23363548 阅读：27 留言：0更新日期：2020-02-18 17:29

本申请公开了一种基于机器学习的翻译方法、装置、设备及存储介质，涉及人工智能领域，该方法包括：获取第一语种类型的句子；采用不同的分词器将所述句子划分为至少两个分词序列；根据所述至少两个分词序列生成所述句子的词图结构；调用编码器将所述词图结构转换为所述句子的中间向量表示；调用解码器将所述中间向量表示转换为第二语种类型的句子。由于该词图表示覆盖了句子的多种分词可能性，因此能够解决分词产生错误划分，本申请解决分词产生错误划分，导致句子产生错误的语义或歧义，从而对句子的语义造成不可修复的破坏的问题，提高机器翻译模型的翻译准确度。

Translation methods, devices, devices and storage media based on machine learning

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习的翻译方法、装置、设备及存储介质
本申请实施例涉及人工智能领域，特别涉及一种基于机器学习的翻译方法、装置、设备及存储介质。
技术介绍
基于机器学习的翻译系统是目前主流的翻译系统。典型的，基于机器学习的翻译系统所使用的神经网络模型包括：编码器和解码器。在使用神经网络模型进行翻译时，由用户输入第一语种的句子，通过分词将句子表示成词序列，编码器将词序列转换为中间向量，解码器将中间向量转换为第二语种的句子。但是由于分词可能会产生错误划分，导致句子产生错误的语义或歧义，从而对句子的语义造成不可修复的破坏，最终的翻译结果较差。
技术实现思路
本申请实施例提供了一种基于机器学习的翻译方法、装置、设备及存储介质，可以解决分词产生错误划分，导致句子产生错误的语义或歧义，从而对句子的语义造成不可修复的破坏，翻译效果较差的问题。所述技术方案如下：一方面，提供了一种基于机器学习的翻译方法，该方法包括：获取第一语种类型的句子；采用不同的分词器将句子划分为至少两个分词序列；根据至少两个分词序列生成句子的词图结构，词图结构中的词图边对应候选分词，词图结构中的节点对应相邻候选分词之间的边界；调用编码器将词图结构基于与词图边垂直的维度转换为句子的中间向量表示；调用解码器将中间向量表示转换为第二语种类型的句子。另一方面，提供了一种基于机器学习的翻译装置，该装置包括：获取模块、分词模块、生成模块、编码模块和解码模块；获取模块，被配置为获取第一语...

【技术保护点】
1.一种基于机器学习的翻译方法，其特征在于，所述方法包括：/n获取第一语种类型的句子；/n采用不同的分词器将所述句子划分为至少两个分词序列；/n根据所述至少两个分词序列生成所述句子的词图结构，所述词图结构中的词图边对应候选分词，所述词图结构中的节点对应相邻候选分词之间的边界；/n调用编码器将所述词图结构基于与所述词图边垂直的维度转换为所述句子的中间向量表示；/n调用解码器将所述中间向量表示转换为第二语种类型的句子。/n

【技术特征摘要】
1.一种基于机器学习的翻译方法，其特征在于，所述方法包括：
获取第一语种类型的句子；
采用不同的分词器将所述句子划分为至少两个分词序列；
根据所述至少两个分词序列生成所述句子的词图结构，所述词图结构中的词图边对应候选分词，所述词图结构中的节点对应相邻候选分词之间的边界；
调用编码器将所述词图结构基于与所述词图边垂直的维度转换为所述句子的中间向量表示；
调用解码器将所述中间向量表示转换为第二语种类型的句子。

2.根据权利要求1所述的方法，其特征在于，所述采用不同的分词器将所述句子划分为至少两个分词序列，包括：
采用至少两个不同的分词器对所述句子分别进行分词处理，得到至少两个分词序列。

3.根据权利要求1所述的方法，其特征在于，所述根据所述至少两个分词序列生成所述句子的词图结构，包括：
将所述至少两个分词序列分别进行图转换处理，得到至少两个图结构；
将所述至少两个图结构进行合并，得到所述句子的词图结构。

4.根据权利要求1至3任一所述的方法，其特征在于，所述调用编码器将所述词图结构基于与所述词图边垂直的维度转换为所述句子的中间向量表示，包括：
调用基于词图状态的编码器模型将所述词图结构基于与所述词图边垂直的维度转换为所述句子的中间向量表示；
其中，所述词图状态包括所述词图结构中的所有节点的状态集合和全局状态。

5.根据权利要求4所述的方法，其特征在于，所述基于词图状态的编码器模型是基于词图状态的循环神经网络；
所述调用基于词图结构的编码器模型基于与所述词图边垂直的维度将所述词图结构转换为所述句子的中间向量表示，包括：
调用所述基于词图状态的循环神经网络，将所述词图结构对应的词图状态进行T次迭代更新；
根据所述T次迭代更新的词图状态确定所述句子的中间向量表示。

6.根据权利要求5所述的方法，其特征在于，所述调用所述基于词图状态的编码器模型，将所述词图结构对应的词图状态进行T次迭代更新，包括：
在调用所述基于词图状态的编码器进行第t次迭代更新时，根据所述词图结构中的第i个节点vi在上一次迭代更新后的隐状态、所述第i个节点vi的邻接节点相关的状态信息和上一次迭代更新后的全局状态，更新得到所述第i个节点vi在本次迭代更新后的隐状态；
根据所有节点在本次迭代更新后的隐状态，更新得到本次迭代更新后的全局状态；
在所述t不等于T时，将所述t加一后重复上述两个步骤。

7.根据权利要求6所述的方法，其特征在于，所述邻接节点相关的状态信息，包括：入度边的融合信息、出度边的融合信息、入度节点的融合信息和出度节点的融合信息；
根据第一注意力机制将所述第i个节点在本次迭代更新中的入度边对应的候选词向量以及所述第i个节点的位置嵌入进行融合，得到所述入度边的融合信...

【专利技术属性】
技术研发人员：张祥文，谢军，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人