当前位置: 首页 > 专利查询>何灏专利>正文

同步交互式翻译方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:28296290 阅读:32 留言:0更新日期:2021-04-30 16:20
本申请公开了一种同步交互式翻译方法及装置、存储介质、计算机设备,该方法包括:获取待翻译的源语言目标文本以及目标语言;对源语言目标文本进行编码处理生成与所述源语言目标文本对应的源语言文本序列;对源语言文本序列向目标语言进行正向翻译确定源语言文本序列中正向第一个目标词对应的第一翻译假设,并同步地对源语言文本序列进行反向翻译确定第二翻译假设;继续逐词的对源语言文本序列向目标语言同时进行正向翻译和反向翻译,更新第一翻译假设以及第二翻译假设,直至将源语言文本序列翻译结束,确定至少一个第三翻译假设以及至少一个第四翻译假设;基于第三翻译假设以及第四翻译假设,确定源语言目标文本对应的目标语言翻译文本。

【技术实现步骤摘要】
同步交互式翻译方法及装置、存储介质、计算机设备
本申请涉及计算机
,尤其是涉及到一种同步交互式翻译方法及装置、存储介质、计算机设备。
技术介绍
现有技术中,在对源语言文本进行翻译时,一般是一对一的翻译,即将文本从一种源语言翻译为另一种目标语言,并且翻译过程一般是依据源语言文本词的顺序依次逐词的进行翻译,即对于一句话来说从第一个词逐个翻译到最后一个词,从而得到目标语言翻译文本。但是在多语言翻译中,这种翻译方式无法在解码过程中充分利用语种内和语种间的各类信息,如何提高翻译质量,是多语言翻译领域中的一个重要问题。
技术实现思路
有鉴于此,本申请提供了一种同步交互式翻译方法及装置、存储介质、计算机设备。根据本申请的一个方面,提供了一种同步交互式翻译方法,所述方法包括:获取待翻译的源语言目标文本以及与所述源语言目标文本对应的至少一种目标语言,其中,所述源语言目标文本包括至少两个目标词;对所述源语言目标文本进行编码处理,生成与所述源语言目标文本对应的源语言文本序列;对所述源语言文本序列向各目标语言进行正向翻译,确定所述源语言文本序列中正向第一个目标词对应的至少一个第一翻译假设,同时,同步地对所述源语言文本序列向各目标语言进行反向翻译,确定所述源语言文本序列中反向第一个目标词对应的至少一个第二翻译假设;依据所述源语言文本序列以及所述各目标语言的第一翻译假设以及所述各目标语言的第二翻译假设,对所述源语言文本序列向所述目标语言同时进行正向翻译和反向翻译,更新所述第一翻译假设以及所述第二翻译假设,直至将所述源语言文本序列翻译结束,确定对所述源语言文本序列正向翻译结束后得到的至少一个第三翻译假设以及对所述源语言文本序列反向翻译结束后得到的至少一个第四翻译假设;基于所述第三翻译假设以及所述第四翻译假设,确定所述源语言目标文本对应的各目标语言翻译文本。可选地,所述对所述源语言文本序列向各目标语言进行正向翻译,确定所述源语言文本序列中正向第一个目标词对应的至少一个第一翻译假设,同时,同步地对所述源语言文本序列向各目标语言进行反向翻译,确定所述源语言文本序列中反向第一个目标词对应的至少一个第二翻译假设,具体包括:根据预设翻译假设数量以及所述目标语言的数量,设置柱搜索算法中的柱大小;利用柱搜索算法,对所述源语言文本序列向各目标语言进行正向翻译,获取扩展概率较高的所述预设翻译假设数量的第一翻译假设,同时,同步地对所述源语言文本序列向各目标语言进行反向翻译,获取扩展概率较高的所述预设翻译假设数量的第二翻译假设。可选地,所述依据所述源语言文本序列以及所述各目标语言的第一翻译假设以及所述各目标语言的第二翻译假设,对所述源语言文本序列向所述目标语言同时进行正向翻译和反向翻译,更新所述第一翻译假设以及所述第二翻译假设,直至将所述源语言文本序列翻译结束,确定对所述源语言文本序列正向翻译结束后得到的至少一个第三翻译假设以及对所述源语言文本序列反向翻译结束后得到的至少一个第四翻译假设,具体包括:根据所述源语言文本序列以及第一预设权重矩阵,确定第一查询矩阵、第一键矩阵以及第一值矩阵,执行注意力计算确定第一注意力矩阵,其中,所述第一预设权重矩阵包括第一查询权重矩阵、第一键权重矩阵以及第一值权重矩阵;根据各目标语言对应的第一翻译假设、第二翻译假设以及第二预设权重矩阵,确定各目标语言对应的第二查询矩阵、第二键矩阵以及第二值矩阵,执行注意力计算确定每个翻译假设对应的第二注意力矩阵,并对所述第二注意力矩阵进行融合,确定每种所述目标语言的第一翻译假设融合注意力隐状态矩阵以及第二翻译假设融合注意力隐状态矩阵;依据所述第一注意力矩阵以及第三预设权重矩阵,确定第三键矩阵以及第三值矩阵,依据所述第一翻译假设融合注意力隐状态矩阵以及所述第三预设权重矩阵,确定第三查询矩阵,并基于所述第三查询矩阵、所述第三键矩阵以及所述第三值矩阵执行注意力计算确定第三注意力矩阵;以及依据所述第二翻译假设融合注意力隐状态矩阵以及所述第三预设权重矩阵,确定第四查询矩阵,并基于所述第四查询矩阵、所述第三键矩阵以及第三值矩阵执行注意力计算确定第四注意力矩阵;在翻译过程中利用柱搜索算法,依据所述第三注意力矩阵逐词对所述源语言文本序列向所述目标语言进行正向翻译迭代更新所述第一翻译假设,依据所述第四注意力矩阵逐词对所述源语言文本序列向所述目标语言进行反向翻译迭代更新所述第二翻译假设,并利用更新后的第一翻译假设和第二翻译假设迭代更新所述第三注意力矩阵以及所述第四注意力矩阵,直至所述源语言文本序列正向翻译结束得到所述源语言文本序列中全部内容对应的所述预设翻译假设数量的第三翻译假设,以及所述源语言文本序列翻译结束得到所述源语言文本序列中全部内容对应的所述预设翻译假设数量的第四翻译假设。可选地,当所述第三翻译假设包含句子结束符或者所述第三翻译假设的长度超过预设第一阈值时,所述源语言文本序列正向翻译结束,当所述第四翻译假设包含句子结束符或者所述第四翻译假设的长度超过预设第二阈值时,所述源语言文本序列反向翻译结束。可选地,所述基于所述第三翻译假设以及所述第四翻译假设,确定所述源语言目标文本对应的目标语言翻译文本,具体包括:获取所述第三翻译假设以及所述第四翻译假设中得分最高的目标翻译假设,其中,所述第三翻译假设以及所述第四翻译假设的得分基于对应的扩展概率确定;若所述目标翻译假设属于第三翻译假设,则按照所述目标翻译假设的序列顺序确定所述目标语言翻译文本;若所述目标翻译假设属于第四翻译假设,则按照所述目标翻译假设的逆向序列顺序确定所述目标语言翻译文本。可选地,所述获取待翻译的源语言目标文本以及与所述源语言目标文本对应的至少一种目标语言,具体包括:接收第一终端发送的源语言目标文本,并确定所述第一终端对应的至少一个第二终端,其中,所述第一终端为消息发送方终端,所述第二终端为消息接收方终端;获取所述第二终端对应的预设语言,并将所述预设语言作为所述源语言目标文本对应的各目标语言。可选地,所述确定所述源语言目标文本对应的目标语言翻译文本之后,所述方法还包括:将所述目标语言翻译文本发送至与对应的所述目标语言匹配的所述第二终端中,以使所述第二终端输出与对应的预设语言匹配的各目标语言翻译文本。根据本申请的另一方面,提供了一种同步交互式翻译装置,所述装置包括:源语言文本获取模块,用于获取待翻译的源语言目标文本以及与所述源语言目标文本对应的至少一种目标语言,其中,所述源语言目标文本包括至少两个目标词;编码模块,用于对所述源语言目标文本进行编码处理,生成与所述源语言目标文本对应的源语言文本序列;第一翻译模块,用于对所述源语言文本序列向所述目标语言进行正向翻译,确定所述源语言文本序列中正向第一个目标词对应的至少一个第一翻译假设,同时,同步地对所述源语言文本序列向所述目标语言进行反向翻译,确定所述源语言文本序列中反向第一个目标词对应的至少一个第二翻译假本文档来自技高网...

【技术保护点】
1.一种同步交互式翻译方法,其特征在于,所述方法包括:/n获取待翻译的源语言目标文本以及与所述源语言目标文本对应的至少一种目标语言,其中,所述源语言目标文本包括至少两个目标词;/n对所述源语言目标文本进行编码处理,生成与所述源语言目标文本对应的源语言文本序列;/n对所述源语言文本序列向各目标语言进行正向翻译,确定所述源语言文本序列中正向第一个目标词对应的至少一个第一翻译假设,同时,同步地对所述源语言文本序列向各目标语言进行反向翻译,确定所述源语言文本序列中反向第一个目标词对应的至少一个第二翻译假设;/n依据所述源语言文本序列以及所述各目标语言的第一翻译假设以及所述各目标语言的第二翻译假设,对所述源语言文本序列向所述目标语言同时进行正向翻译和反向翻译,更新所述第一翻译假设以及所述第二翻译假设,直至将所述源语言文本序列翻译结束,确定对所述源语言文本序列正向翻译结束后得到的至少一个第三翻译假设以及对所述源语言文本序列反向翻译结束后得到的至少一个第四翻译假设;/n基于所述第三翻译假设以及所述第四翻译假设,确定所述源语言目标文本对应的各目标语言翻译文本。/n

【技术特征摘要】
1.一种同步交互式翻译方法,其特征在于,所述方法包括:
获取待翻译的源语言目标文本以及与所述源语言目标文本对应的至少一种目标语言,其中,所述源语言目标文本包括至少两个目标词;
对所述源语言目标文本进行编码处理,生成与所述源语言目标文本对应的源语言文本序列;
对所述源语言文本序列向各目标语言进行正向翻译,确定所述源语言文本序列中正向第一个目标词对应的至少一个第一翻译假设,同时,同步地对所述源语言文本序列向各目标语言进行反向翻译,确定所述源语言文本序列中反向第一个目标词对应的至少一个第二翻译假设;
依据所述源语言文本序列以及所述各目标语言的第一翻译假设以及所述各目标语言的第二翻译假设,对所述源语言文本序列向所述目标语言同时进行正向翻译和反向翻译,更新所述第一翻译假设以及所述第二翻译假设,直至将所述源语言文本序列翻译结束,确定对所述源语言文本序列正向翻译结束后得到的至少一个第三翻译假设以及对所述源语言文本序列反向翻译结束后得到的至少一个第四翻译假设;
基于所述第三翻译假设以及所述第四翻译假设,确定所述源语言目标文本对应的各目标语言翻译文本。


2.根据权利要求1所述的方法,其特征在于,所述对所述源语言文本序列向各目标语言进行正向翻译,确定所述源语言文本序列中正向第一个目标词对应的至少一个第一翻译假设,同时,同步地对所述源语言文本序列向各目标语言进行反向翻译,确定所述源语言文本序列中反向第一个目标词对应的至少一个第二翻译假设,具体包括:
根据预设翻译假设数量以及所述目标语言的数量,设置柱搜索算法中的柱大小;
利用柱搜索算法,对所述源语言文本序列向各目标语言进行正向翻译,获取扩展概率较高的所述预设翻译假设数量的第一翻译假设,同时,同步地对所述源语言文本序列向各目标语言进行反向翻译,获取扩展概率较高的所述预设翻译假设数量的第二翻译假设。


3.根据权利要求2所述的方法,其特征在于,所述依据所述源语言文本序列以及所述各目标语言的第一翻译假设以及所述各目标语言的第二翻译假设,对所述源语言文本序列向所述目标语言同时进行正向翻译和反向翻译,更新所述第一翻译假设以及所述第二翻译假设,直至将所述源语言文本序列翻译结束,确定对所述源语言文本序列正向翻译结束后得到的至少一个第三翻译假设以及对所述源语言文本序列反向翻译结束后得到的至少一个第四翻译假设,具体包括:
根据所述源语言文本序列以及第一预设权重矩阵,确定第一查询矩阵、第一键矩阵以及第一值矩阵,执行注意力计算确定第一注意力矩阵,其中,所述第一预设权重矩阵包括第一查询权重矩阵、第一键权重矩阵以及第一值权重矩阵;
根据各目标语言对应的第一翻译假设、第二翻译假设以及第二预设权重矩阵,确定各目标语言对应的第二查询矩阵、第二键矩阵以及第二值矩阵,执行注意力计算确定每个翻译假设对应的第二注意力矩阵,并对所述第二注意力矩阵进行融合,确定每种所述目标语言的第一翻译假设融合注意力隐状态矩阵以及第二翻译假设融合注意力隐状态矩阵;
依据所述第一注意力矩阵以及第三预设权重矩阵,确定第三键矩阵以及第三值矩阵,依据所述第一翻译假设融合注意力隐状态矩阵以及所述第三预设权重矩阵,确定第三查询矩阵,并基于所述第三查询矩阵、所述第三键矩阵以及所述第三值矩阵执行注意力计算确定第三注意力矩阵;以及依据所述第二翻译假设融合注意力隐状态矩阵以及所述第三预设权重矩阵,确定第四查询矩阵,并基于所述第四查询矩阵、所述第三键矩阵以及第三值矩阵执行注意力计算确定第四注意力矩阵;
在翻译过程中利用柱搜索算法,依据所述第三注意力矩阵逐词对所述源语言文本序列向所述目标语言进行正向翻译迭代更新所述第一翻译假设,依据所述第四注意力矩阵逐词对所述源语言文本序列向所述目标语言进行反向翻译...

【专利技术属性】
技术研发人员:何灏朱鹤于志鹏
申请(专利权)人:何灏
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1