文本翻译方法及装置制造方法及图纸

技术编号:38744956 阅读:9 留言:0更新日期:2023-09-08 23:27
本说明书实施例提供文本翻译方法及装置,其中所述文本翻译方法包括:获取待翻译文本和目标参考信息对,其中,所述目标参考信息对包含参考源文信息和参考译文信息,所述参考源文信息与所述待翻译文本相关;拼接所述参考源文信息和所述待翻译文本,获得待处理文本;将所述待处理文本和所述参考译文信息输入翻译模型,基于所述参考译文信息对所述待处理文本进行翻译,获得待翻译文本对应的翻译文本。通过将待翻译文本和目标参考信息对输入翻译模型,使得翻译模型可以基于目标参考信息对中的参考译文信息对待翻译文本进行翻译,即可以基于与待翻译文本相关的参考源文信息以及对应的参考译文信息,对待翻译文本进行翻译,提升翻译模型的翻译准确性。译模型的翻译准确性。译模型的翻译准确性。

【技术实现步骤摘要】
文本翻译方法及装置


[0001]本说明书实施例涉及计算机
,特别涉及文本翻译方法。

技术介绍

[0002]随着计算机技术的不断发展,对于文本翻译的技术也在不断提升。
[0003]目前,为了提升对文本的翻译效率,通常需要基于需求训练翻译模型,通过使用训练完成的翻译模型提升翻译效率;并且,为了保证翻译效果,通常需要基于不同项目场景的翻译文本对翻译模型进行微调,得到不同翻译场景下的翻译模型。
[0004]但目前的处理方式,需要基于不同场景的翻译文本对翻译模型进行训练,即每个场景都需要进行一次训练,导致训练消耗的资源和时间较多,造成资源和时间的花费较大,进而影响对文本的翻译效率。

技术实现思路

[0005]有鉴于此,本说明书实施例提供了文本翻译方法。本说明书一个或者多个实施例同时涉及文本翻译装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0006]根据本说明书实施例的第一方面,提供了一种文本翻译方法,包括:
[0007]获取待翻译文本和目标参考信息对,其中,所述目标参考信息对包含参考源文信息和参考译文信息,所述参考源文信息与所述待翻译文本相关;
[0008]拼接所述参考源文信息和所述待翻译文本,获得待处理文本;
[0009]将所述待处理文本和所述参考译文信息输入翻译模型,基于所述参考译文信息对所述待处理文本进行翻译,获得所述待翻译文本对应的翻译文本。
[0010]根据本说明书实施例的第二方面,提供了一种文本翻译装置,包括:
[0011]获取模块,被配置为获取待翻译文本和目标参考信息对,其中,所述目标参考信息对包含参考源文信息和参考译文信息,所述参考源文信息与所述待翻译文本相关;
[0012]拼接模块,被配置为拼接所述参考源文信息和所述待翻译文本,获得待处理文本;
[0013]翻译模块,被配置为将所述待处理文本和所述参考译文信息输入翻译模型,基于所述参考译文信息对所述待处理文本进行翻译,获得所述待翻译文本对应的翻译文本。
[0014]根据本说明书实施例的第三方面,提供了一种翻译模型的训练方法,应用于云侧设备,包括:
[0015]获取样本集,其中,所述样本集包括多个样本文本对和各样本文本对对应的关联信息对,所述样本文本对包括待翻译样本文本和译文样本文本,所述关联信息对包括关联源文信息和关联译文信息,所述关联源文信息与所述待翻译样本文本相关;
[0016]从所述样本集中,提取目标样本文本对和所述目标样本文本对对应的目标关联信息对;
[0017]拼接所述目标关联信息对中的目标关联源文信息与所述目标样本文本对中的目
标待翻译样本文本,获得目标待处理样本文本;
[0018]将所述目标待处理样本文本和所述目标关联信息对中的目标关联译文信息输入翻译模型;
[0019]获取所述翻译模型输出的目标预测翻译文本,并基于所述目标预测翻译文本和所述目标样本文本对中的目标译文样本文本计算翻译损失值;
[0020]基于所述翻译损失值对所述翻译模型的模型参数进行调整,并返回执行从所述样本集中,提取目标样本文本对和所述目标样本文本对对应的目标关联信息对的步骤,直至达到模型训练停止条件,获得训练完成的翻译模型;
[0021]将所述翻译模型的模型参数发送至端侧设备。
[0022]根据本说明书实施例的第四方面,提供了另一种文本翻译方法,应用于云侧设备,包括:
[0023]接收端侧设备发送的待翻译文本;
[0024]查找与所述待翻译文本对应的目标参考信息对,其中,所述目标参考信息对包含参考源文信息和参考译文信息,所述参考源文信息与所述待翻译文本相关;
[0025]拼接所述参考源文信息和所述待翻译文本,获得待处理文本;
[0026]将所述待处理文本和所述参考译文信息输入翻译模型,基于所述参考译文信息对所述待处理文本进行翻译,获得所述待翻译文本对应的翻译文本;
[0027]将所述翻译文本返回至所述端侧设备。
[0028]根据本说明书实施例的第五方面,提供了一种计算设备,包括:
[0029]存储器和处理器;
[0030]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本翻译方法的步骤。
[0031]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述文本翻译方法的步骤。
[0032]根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述文本翻译方法的步骤。
[0033]本说明书一个实施例实现了获取待翻译文本和目标参考信息对,其中,所述目标参考信息对包含参考源文信息和参考译文信息,所述参考源文信息与所述待翻译文本相关;拼接所述参考源文信息和所述待翻译文本,获得待处理文本;将所述待处理文本和所述参考译文信息输入翻译模型,基于所述参考译文信息对所述待处理文本进行翻译,获得所述待翻译文本对应的翻译文本。
[0034]通过将待翻译文本和目标参考信息对输入翻译模型,使得翻译模型可以基于目标参考信息对中的参考译文信息对待翻译文本进行翻译,即可以基于与待翻译文本相关的参考源文信息以及对应的参考译文信息为翻译参考,对待翻译文本进行翻译,提升翻译模型的翻译准确性。
附图说明
[0035]图1是本说明书一个实施例提供的一种文本翻译方法的场景示意图;
[0036]图2是本说明书一个实施例提供的一种文本翻译方法的流程图;
[0037]图3是本说明书一个实施例提供的一种翻译模型训练方法的流程图;
[0038]图4是本说明书一个实施例提供的另一种文本翻译方法的流程图;
[0039]图5是本说明书一个实施例提供的一种待翻译文本E方法的处理过程流程图;
[0040]图6是本说明书一个实施例提供的一种文本翻译装置的结构示意图;
[0041]图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0042]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0043]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0044]应当理解,尽管在本说明书一个或多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本翻译方法,包括:获取待翻译文本和目标参考信息对,其中,所述目标参考信息对包含参考源文信息和参考译文信息,所述参考源文信息与所述待翻译文本相关;拼接所述参考源文信息和所述待翻译文本,获得待处理文本;将所述待处理文本和所述参考译文信息输入翻译模型,基于所述参考译文信息对所述待处理文本进行翻译,获得所述待翻译文本对应的翻译文本。2.如权利要求1所述的方法,将所述待处理文本和所述参考译文信息输入翻译模型之前,还包括:获取样本集,其中,所述样本集包括多个样本文本对和各样本文本对对应的关联信息对,所述样本文本对包括待翻译样本文本和译文样本文本,所述关联信息对包括关联源文信息和关联译文信息,所述关联源文信息与所述待翻译样本文本相关;从所述样本集中,提取目标样本文本对和所述目标样本文本对对应的目标关联信息对,其中,所述目标样本对为所述样本集中的任一样本文本对;拼接所述目标关联信息对中的目标关联源文信息与所述目标样本文本对中的目标待翻译样本文本,获得目标待处理样本文本;将所述目标待处理样本文本和所述目标关联信息对中的目标关联译文信息输入翻译模型;获取所述翻译模型输出的目标预测翻译文本,并基于所述目标预测翻译文本和所述目标样本文本对中的目标译文样本文本计算翻译损失值;基于所述翻译损失值对所述翻译模型的模型参数进行调整,并返回执行从所述样本集中,提取目标样本文本对和所述目标样本文本对对应的第一关联信息对的步骤,直至达到模型训练停止条件,获得训练完成的翻译模型。3.如权利要求2所述的方法,将所述目标待处理文本和所述目标关联信息对中的目标关联译文信息输入翻译模型,包括:将所述目标待处理文本输入所述翻译模型的编码层,获得目标样本编码文本;将所述目标样本编码文本和所述目标关联信息对中的目标关联译文信息输入所述翻译模型的解码层;相应地,获取所述翻译模型输出的目标预测翻译文本,包括:获取所述解码层输出的目标预测翻译文本。4.如权利要求1所述的方法,获取待翻译文本和目标参考信息对,包括:确定所述待翻译文本中的目标字段;基于所述目标字段在文本信息库中获取目标参考源文信息和目标参考译文信息;根据所述目标参考源文信息和所述目标参考译文信息,确定目标参考信息对。5.如权利要求1所述的方法,拼接所述参考源文信息和所述待翻译文本,获得待处理文本,包括:确定预设拼接顺序和所述参考源文信息对应的目标信息类型;获取所述目标信息类型对应的信息标签;基于所述预设拼接顺序对所述参考源文信息、所述信息标签和所述待翻译文本进行拼接,获得待处理文本。
6.如权利要求1所述的方法,将所述待处理文本和所述参考译文信息输入翻译模型,基于所述参考译文信息对所述待处理文本进行翻译,获得所述待翻译文本对应的翻译文本,包括:将所述待处理文本输入所述翻译模型的编码层,获得编码翻译文本;将所述参考译文信息和所述编码翻译文本输入所述翻译模型的解码层,获得翻译文本。7.如权利要求1所述的方法,获取待翻译文本和目标参考信息对之前,还包括:确定文本信息库,其中,所述文本信息库中包含参考源文信息和参考译文信息;在所述文本信息库中获取与所述待翻译文本对应的目标参考源文信息和目标参考译文信息,并基于所述目标参考源文信息和所...

【专利技术属性】
技术研发人员:王轲谢军张昱琪赵宇
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1