System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本翻译方法、文本翻译装置、电子设备及存储介质制造方法及图纸_技高网

文本翻译方法、文本翻译装置、电子设备及存储介质制造方法及图纸

技术编号:43130274 阅读:2 留言:0更新日期:2024-10-29 17:37
本公开提供了一种文本翻译方法、文本翻译装置、电子设备及计算机可读存储介质,属于人工智能技术领域。该方法包括:获取待翻译文本,并获取所述待翻译文本的翻译场景信息;根据所述翻译场景信息确定第一提示信息;基于第一词库将所述待翻译文本中的至少部分词替换为第一标准术语,得到所述待翻译文本对应的中间文本;根据所述中间文本和所述第一提示信息,生成第二提示信息;利用语言模型对所述第二提示信息进行处理,得到所述待翻译文本在目标语种下对应的目标文本。本公开可以结合翻译场景与术语标准,对待翻译文本进行准确、有效的翻译。

【技术实现步骤摘要】

本公开涉及人工智能,尤其涉及一种文本翻译方法、文本翻译装置、电子设备及计算机可读存储介质。


技术介绍

1、随着人工智能的迅速发展,其在翻译领域的应用也越来越广泛。目前,现有技术中存在多种用于进行文本翻译的预训练语言模型,如基于transformer架构的预训练语言模型。然而,实际应用中,由于翻译场景多元化程度高、术语文本表达丰富、文化差异程度大等因素影响,仅通过用户输入的文本无法对其进行准确、有效的翻译,常常会出现翻译错误、文本嵌套等情况。

2、因此,如何对待翻译文本进行准确有效的翻译,是现有技术亟待解决的问题。

3、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、本公开提供了一种文本翻译方法、文本翻译装置、电子设备及计算机可读存储介质,进而至少在一定程度上克服现有技术中文本翻译无法适应翻译场景或术语要求等需求而导致翻译不准确的问题。

2、本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

3、根据本公开的一个方面,提供一种文本翻译方法,包括:获取待翻译文本,并获取所述待翻译文本的翻译场景信息;根据所述翻译场景信息确定第一提示信息;基于第一词库将所述待翻译文本中的至少部分词替换为第一标准术语,得到所述待翻译文本对应的中间文本;根据所述中间文本和所述第一提示信息,生成第二提示信息;利用语言模型对所述第二提示信息进行处理,得到所述待翻译文本在目标语种下对应的目标文本。

4、在本公开的一种示例性实施例中,所述获取所述待翻译文本的翻译场景信息,包括:根据所述待翻译文本的输入环境,确定所述待翻译文本的翻译场景信息。

5、在本公开的一种示例性实施例中,所述根据所述翻译场景信息确定第一提示信息,包括:从所述翻译场景信息中提取业务场景信息、文化背景信息、语言风格信息、情绪信息中的一种或多种信息,基于所提取的信息构建所述第一提示信息。

6、在本公开的一种示例性实施例中,所述第一词库包括一个或多个第一术语映射词组,所述第一术语映射词组包括原词和所述原词对应的第一标准术语;所述基于第一词库将所述待翻译文本中的至少部分词替换为第一标准术语,包括:将所述待翻译文本中的词与所述第一词库中的原词进行匹配,将所述待翻译文本中与原词匹配命中的词替换为所述原词对应的第一标准术语。

7、在本公开的一种示例性实施例中,在将所述待翻译文本中的词与所述第一词库中的原词进行匹配,将所述待翻译文本中与原词匹配命中的词替换为所述原词对应的第一标准术语前,所述方法还包括:基于第二词库对所述待翻译文本进行分词,若得到多种分词结果,则根据每种分词结果的词长,确定采用其中词长最长的分词结果,以得到所述待翻译文本中的词;其中,所述分词结果是对所述待翻译文本进行分词后得到的词组,所述分词结果的词长为所述词组中最长的一个或多个词的词长。

8、在本公开的一种示例性实施例中,所述第一标准术语是所述待翻译文本的源语种下的标准术语;所述方法还包括:获取所述中间文本中的第一标准术语对应的所述目标语种下的第二标准术语,以形成参考术语集合;将所述参考术语集合添加到所述第二提示信息。

9、在本公开的一种示例性实施例中,所述方法还包括:获取所述待翻译文本的上下文信息;将所述上下文信息添加到所述第二提示信息。

10、在本公开的一种示例性实施例中,所述获取所述待翻译文本的上下文信息,包括:从所述待翻译文本的上文和/或下文中提取预设长度的文本,以得到所述上下文信息。

11、在本公开的一种示例性实施例中,在利用语言模型对所述第二提示信息进行处理,得到所述待翻译文本在目标语种下对应的目标文本之后,所述方法还包括:将所述目标文本与已知错误文本库进行匹配,根据匹配结果确定所述目标文本中的错误信息,并修正或删除所述错误信息。

12、根据本公开的一个方面,提供一种文本翻译装置,包括:场景信息获取模块,用于获取待翻译文本,并获取所述待翻译文本的翻译场景信息;第一信息确定模块,用于根据所述翻译场景信息确定第一提示信息;中间文本获取模块,用于基于第一词库将所述待翻译文本中的至少部分词替换为第一标准术语,得到所述待翻译文本对应的中间文本;第二信息生成模块,用于根据所述中间文本和所述第一提示信息,生成第二提示信息;目标文本获得模块,用于利用语言模型对所述第二提示信息进行处理,得到所述待翻译文本在目标语种下对应的目标文本。

13、根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的文本翻译方法。

14、根据本公开的一个方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的文本翻译方法。

15、本公开的示例性实施例具有以下有益效果:

16、获取待翻译文本,并获取待翻译文本的翻译场景信息;根据翻译场景信息确定第一提示信息;基于第一词库将待翻译文本中的至少部分词替换为第一标准术语,得到待翻译文本对应的中间文本;根据中间文本和第一提示信息,生成第二提示信息;利用语言模型对第二提示信息进行处理,得到待翻译文本在目标语种下对应的目标文本。一方面,本示例性实施例提出了一种新的文本翻译方法,能够结合翻译场景信息确定第一提示信息,根据由待翻译文本生成的中间文本与第一提示信息共同生成第二提示信息,并通过语言模型对其进行处理,确定目标文本,通过将翻译场景与待翻译文本两个维度的信息融入提示信息中,使得提示信息即能够包括待翻译文本的相关信息,又能够包括待翻译文本当前的场景信息,保证了基于第二提示信息确定目标文本的准确性,提高了翻译结果与翻译场景的适配性;另一方面,本示例性实施例在进行翻译处理之前,对待翻译文本进行了与术语相关的预处理过程,根据第一词库将待翻译文本中的至少部分词替换为第一标准术语,使得生成的中间文本在术语专业性这一方面具备一定的准确性,进一步,为后续进行文本翻译奠定了有效、标准的文本基础;再一方面,本示例性实施例可以结合场景因素与术语差异因素,构建用于进行文本翻译的第二提示信息,流程简单、便捷,应用场景广泛,且可以提高文本翻译的准确性,相比于现有技术,翻译结果更为精准。

17、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种文本翻译方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述待翻译文本的翻译场景信息,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述翻译场景信息确定第一提示信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述第一词库包括一个或多个第一术语映射词组,所述第一术语映射词组包括原词和所述原词对应的第一标准术语;所述基于第一词库将所述待翻译文本中的至少部分词替换为第一标准术语,包括:

5.根据权利要求4所述的方法,其特征在于,在将所述待翻译文本中的词与所述第一词库中的原词进行匹配,将所述待翻译文本中与原词匹配命中的词替换为所述原词对应的第一标准术语前,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述第一标准术语是所述待翻译文本的源语种下的标准术语;所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,所述获取所述待翻译文本的上下文信息,包括:

9.根据权利要求1所述的方法,其特征在于,在利用语言模型对所述第二提示信息进行处理,得到所述待翻译文本在目标语种下对应的目标文本之后,所述方法还包括:

10.一种文本翻译装置,其特征在于,包括:

11.一种电子设备,其特征在于,包括:

12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9任一项所述的文本翻译方法。

...

【技术特征摘要】

1.一种文本翻译方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述待翻译文本的翻译场景信息,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述翻译场景信息确定第一提示信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述第一词库包括一个或多个第一术语映射词组,所述第一术语映射词组包括原词和所述原词对应的第一标准术语;所述基于第一词库将所述待翻译文本中的至少部分词替换为第一标准术语,包括:

5.根据权利要求4所述的方法,其特征在于,在将所述待翻译文本中的词与所述第一词库中的原词进行匹配,将所述待翻译文本中与原词匹配命中的词替换为所述原词对应的第一标准术语前,所述方法还包括:

6....

【专利技术属性】
技术研发人员:张斯扬丁泽伟
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1