一种融合推敲网络和字符编码的神经机器翻译方法技术

技术编号：30049032 阅读：15 留言：0更新日期：2021-09-15 10:50

本发明专利技术提供了一种融合推敲网络和字符编码的神经机器翻译方法，属于数据处理技术领域，采用了预先训练词向量和推敲网络中的预先模型的方法，以Transformer为基础预先训练一个基础的翻译模型，通过拼接的多表征融合的词向量表示，作为一个基础模型架构，在此的基础之上，加入推敲网络结构，对基础模型的解码器部分和编码器部分分别进行相关的注意力计算，获取解码语句的全局信息，为推敲解码部分提供更加丰富的语义信息和全局信息，使得翻译可以更加精准。同时采用了波束搜索的方法，提高了生成词语的更多的可能性，得到更加逼近全局最优的翻译答案。优的翻译答案。优的翻译答案。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合推敲网络和字符编码的神经机器翻译方法

[0001]本专利技术属于数据处理
，尤其涉及一种融合推敲网络和字符编码的神经机器翻译方法。

技术介绍

[0002]随着人工智能的领域研究的深入，神经机器翻译领域被各类新模型不断的刷新翻译效果，目前在深度学习的各项任务中，都少不了其结构的身影。从机器翻译被提出到现在的几十年间，所有的机器翻译都无法逃避去思考翻译过程中。对于以深度学习为基础的机器翻译，最早使用的是以词作为网络的基本单位。相比句子而言，单词更加符合本专利技术的第一感觉，且使用词作为模型建模的基本单位需要的资源更少，模型的可解释更高。然而随着词向量的研究不断的深入，许多问题也渐渐地浮现了出来。社会的发展造成了词表不停地有新词出现，词表过大等问题，齐夫定律表示词出现次数的排名和其出现的次数成反比。而目前的机器翻译模型，从向量空间的角度就是建立一个从源序列到目标序列的完美词映射。但是根据齐夫定律可知，很多的词在文本中出现的次数不高，这严重的拖慢了模型训练的速度。一些罕见的词汇导致翻译的质量降低很多，为了解决上述的问题，研究者们提出了字词的概念，在基于CNN和RNN网络结构中都获得了显著的效果。通过对词进一步的划分，在不影响整个模型的效果的同时，在大多数情况下缓解了罕见词的问题，研究人员发现将字词融入网络，可以缓解齐夫定律带来的不良影响。
[0003]随着神经机器翻译的探索不断加深，几乎所有的翻译模型都是以编码器解码器框架为基础的，虽然其结构取得不错的效果，但是所有的翻译都是从左到右一次性的翻译结束。相...

【技术保护点】

【技术特征摘要】
1.一种融合推敲网络和字符编码的神经机器翻译方法，其特征在于，包括以下步骤：S1、以Transformer模型为基础训练模型架构，并通过拼接多表征融合的词向量表示得到翻译模型；S2、利用推敲网络，对翻译模型的解码部分和编码部分分别进行相关的注意力计算得到解码语句的全局信息；S3、根据所述解码语句的全局信号，利用波束搜索方法得到全局最优翻译，完成融合推敲网络和字符编码的神经机器翻译。2.根据权利要求1所述的融合推敲网络和字符编码的神经机器翻译方法，其特征在于，所述步骤S1包括以下步骤：S101、以Transformer模型为基础训练模型架构，对输入序列分别进行词级和字符级的编码，并通过拼接方式作为文本的最后特征向量；S102、训练词向量的编码，并利用文本的最后特征向量对Transformer模型进行训练，得到翻译模型。3.根据权利要求2所述的融合推敲网络和字符编码的神经机器翻译方法，其特征在于，所述步骤S101中字符级编码具体为：将输入序列经过卷积和GLU网络进行信息补充。4.根据权利要求1所述的融合推敲网络和字符编码的神经机器翻译方法，其特征在于，所述...

【专利技术属性】
技术研发人员：李建平，李天凯，贺喜，蒋涛，陈强强，王青松，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人