基于多词单元进行辅助翻译的方法和装置制造方法及图纸

技术编号:12405268 阅读:181 留言:0更新日期:2015-11-28 19:48
本发明专利技术涉及一种基于多词单元进行辅助翻译的方法和装置,该方法包括:获取用户输入的源语言音节或目标语言音节;获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元;将所述多词单元划分为多个短语,并从划分后的所述多词单元中提取出多个短语组合;利用预先建立的模型,至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多词单元的权值;根据所述多词单元的权值显示目标语言的多词单元。

【技术实现步骤摘要】

本专利技术涉及计算机辅助翻译领域,特别涉及一种基于多词单元进行辅助翻译的方 法和装置。
技术介绍
计算机辅助翻译,是通过人工智能搜寻及比对技术,运用参考数据库和翻译存储 程序,记录翻译人员所完成的译文,当遇到相同与重复的句型、词组或专业术语时,能向翻 译人员提供建议和解决方案,有效节省翻译时间及成本,同时确保翻译品质。 计算机辅助翻译充分运用数据库功能,将已翻译的文本内容加以储存。当日后遇 到相似或相同的翻译文句时,计算机会自动比对并建议翻译人员使用数据库中已有的译文 作为可能的翻译,让翻译人员自行决定是否接受、编辑或拒绝使用。计算机辅助翻译在概念 上与一般机器翻译、翻译机、翻译软件及线上翻译软件是截然不同的。计算机辅助翻译并非 仅仅将文句词语交给软件处理后,将软件处理结果即作为最终的翻译结果。在计算机辅助 翻译中,计算机处理的结果仅供翻译人员参考,并非最后的翻译结果,而是最终由翻译人员 来决定最适合的翻译结果。 在计算机辅助翻译的帮助下,译员的翻译效率得到提升,但是计算机辅助翻译并 不能解决所有问题。对于没有历史记录的语句依旧需要用户进行完整输入,并且译员的日 常翻译工作中包含许多不常用的短语,输入这些短语的译文通常需要多次的击键操作,这 会使翻译效率下降。另外,即使是专业的翻译人员也会遇到不会翻译的词语,尤其是专业 术语,因此查询译文的操作也同样会耽误很多时间。此时,可能会使用到SMT(Statistical Machine Translation,统计机器翻译)进行翻译。尽管SMT在专业术语翻译方面拥有较高 的准确率,但是它并不能独立地完成一个翻译任务,并且译员使用SMT进行翻译同样会耽 误较多时间,导致翻译效率下降。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本 理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的 关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概 念,以此作为稍后论述的更详细描述的前序。 鉴于现有技术的上述缺陷,本专利技术的目的之一是提供一种基于多词单元进行辅助 翻译的方法和装置。 为了实现上述目的,根据本专利技术的一个方面,提供了一种基于多词单元进行辅助 翻译的方法。该方法包括:获取用户输入的源语言音节或目标语言音节;获取与用户输入 的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元;将所述多词单元 划分为多个短语,并从划分后的所述多词单元中提取出多个短语组合;利用预先建立的模 型,至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所 述多词单元的权值;根据所述多词单元的权值显示目标语言的所述多词单元。 根据本专利技术的另一个方面,提供了一种基于多词单元进行辅助翻译的装置,包括: 用户输入获取部件,配置为获取用户输入的源语言音节或目标语言音节;多词单元获取部 件,配置为获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个 多词单元;短语提取部件,配置为将所述多词单元划分为多个短语,并从划分后的所述多词 单元中提取出多个短语组合;权值计算部件,配置为利用预先建立的模型,至少根据所述多 词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多词单元的权值; 以及输出显示部件,配置为根据所述多词单元的权值显示目标语言的所述多词单元。 另外,根据本专利技术的另一方面,还提供了一种存储介质。所述存储介质包括机器可 读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处 理设备执行根据本专利技术的上述方法。 此外,根据本专利技术的再一方面,还提供了 一种程序产品。所述程序产品包括机器可 执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行 根据本专利技术的上述方法。 通过以下结合附图对本专利技术的最佳实施例的详细说明,本专利技术的这些以及其他优 点将更加明显。【附图说明】 本专利技术可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所 有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的 详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本 专利技术的优选实施例和解释本专利技术的原理和优点。在附图中: 图1示出根据本专利技术的一个具体实施例的基于多词单元进行辅助翻译的方法的 示例流程图; 图2示出在权值计算步骤中计算多词单元的多个短语组合之间的共现度值的方 法的示例流程图; 图3示出根据本专利技术的一个具体实施例对基于多词单元进行辅助翻译的方法中 所使用的多词单元的权值计算模型进行训练的方法的示例流程图; 图4示出根据本专利技术的一个具体实施例的基于多词单元进行辅助翻译的装置的 示例方框图;以及 图5示出可用于实施根据本专利技术的实施例的方法和装置的计算机的示意性框图。 本领域技术人员应当理解,附图中的元件仅仅是为了简单和清楚起见而示出的, 而且不一定是按比例绘制的。例如,附图中某些元件的尺寸可能相对于其他元件放大了,以 便有助于提高对本专利技术实施例的理解。【具体实施方式】 在下文中将结合附图对本专利技术的示范性实施例进行描述。为了清楚和简明起见, 在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施 例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符 合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有 所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开 内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。 在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中 仅仅示出了与根据本专利技术的方案密切相关的装置结构和/或处理步骤,而省略了与本专利技术 关系不大的其他细节。 如上文所述,现有技术中的计算机辅助翻译并没有针对当前待翻译的文档提供相 应的辅助翻译,存在翻译效率不高的问题。本专利技术提供了一种基于多词单元进行辅助翻译 的方法和装置,能够在译员进行翻译时,向译员提供与当前待翻译的文档相关的、较为全面 的目标语言的多词单元,以提高译员的翻译效率。 下面首先结合图1来详细描述根据本专利技术的实施例的基于多词单元进行辅助翻 译的方法的示例流程。 如图1所示,根据本专利技术的该实施例的基于多词单元进行辅助翻译的方法100包 括如下步骤:用户输入获取步骤S110,获取用户输入的源语言音节或目标语言音节;多词 单元获取步骤S120,获取与在用户输入获取步骤SllO中所获取的用户输入的音节相关 联的、且取自待翻译源语言文本中的至少一个多词单元;短语提取步骤S130,用于将多词 单元获取步骤S120所获取的多词单元划分为多个短语,并从划分后的所述多词单元中提 取出多个短语组合;权值计算步骤S140,利用预先建立的模型,至少根据在短语提取步骤 S130中所提取的多词单元的各短语组合在待翻译源语言文本中出现的频率,计算多词单元 获取步骤S120所获取的多词单元的权值;以及输出显示步骤S150,根据权值计算步骤S140 所计算的多词单元的权值显示相应的目标语言的多词单本文档来自技高网
...

【技术保护点】
一种基于多词单元进行辅助翻译的方法,包括:获取用户输入的源语言音节或目标语言音节;获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元;将所述多词单元划分为多个短语,并从划分后的所述多词单元中提取出多个短语组合;利用预先建立的模型,至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多词单元的权值;以及根据所述多词单元的权值显示目标语言的多词单元。

【技术特征摘要】

【专利技术属性】
技术研发人员:付亦雯郑仲光方瑞玉孟遥孙俊宋昕
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1