机器翻译测评装置和方法制造方法及图纸

技术编号:6002830 阅读:256 留言:0更新日期:2012-04-11 18:40
一种机器翻译测评装置,包括:第一翻译单元,用于对输入的源语言进行机器翻译,并生成目标语言;第二翻译单元,用于把所述目标语言逆向翻译成源语言;源语言语言模型,对输入的源语言和第二翻译单元逆向翻译的结果分别进行评分;以及评价单元,用于根据所述源语言语言模型的评分比较所述输入的源语言和第二翻译单元的逆向翻译结果之间的相似度,对所述机器翻译进行评价。根据本发明专利技术,可以在不存在参考译文或标准翻译结果的情况下,对翻译结果进行评分,提供机器翻译结果的信赖度,在实用层面上解决了翻译结果评价困难的问题,为包括语音自动翻译在内的机器翻译系统提供高效可信的机器翻译结果。

【技术实现步骤摘要】

本专利技术涉及一种,属于机器翻译结果的自动测评的自然 语言处理

技术介绍
目前,机器翻译系统的译文评测标准有两种一种是主观评测标准,即由人工主观 判断译文质量打分;另一种是客观评测标准,即依据一定的评价模型计算打分。主观评测依 据人工给出参考译文对翻译系统译文的流畅性和充分性进行评分。客观测评定量地计算系 统译文与参考译文之间的接近程度。日本专利文献特開2007-241910公开了一种机器翻译评价装置和方法。然而,其 需要给出参考译文,即源语言翻译句子的目标语言的正确翻译结果。但是,一般而言,对实 际应用中的机器翻译系统而言,由于语言的多样性,对绝大多数的源语言句子而言,很难对 被翻译的句子给出正确的翻译结果。尽管通常的机器翻译评测活动中测试集都包括许许多 多的正确译文。对于普通用户而言,这种花销显得不必要、不现实、不实用、且不能给用户提供具 有实际参考价值上的意义和便利,因为对于普通用户而言,通常的需求往往是在没有参考 译文的条件下想知道翻译结果的可信度,或者比较多个系统译文的评分来选择评分更高的 译文供自己使用。因此,在不存在参考译文或标准翻译结果的情况下,无法对源语言的翻译结果给 出评测结果,在实际的机器翻译系统中,往往造成用户对翻译结果的可信度或信赖度一无 所知或无法了解的状况,这一问题成为机器翻译系统推广使用过程中的巨大障碍,同时给 用户带来了很多的不便。
技术实现思路
本专利技术的目的是提供一种,其可使得机器翻译系统在不 存在参考译文或标准翻译结果的情况下,对机器翻译系统的翻译结果进行合理的评价,为 机器翻译用户提供机器翻译信赖度的合理评价方法。为此,根据本专利技术的一个方面,提供了一种机器翻译测评装置,其特征在于,包括 第一翻译单元,用于对输入的源语言进行机器翻译,并生成目标语言;第二翻译单元,用于 把所述目标语言逆向翻译成源语言;源语言语言模型,对输入的源语言和第二翻译单元的 逆向翻译结果分别进行评分;以及评价单元,用于根据所述源语言语言模型的评分比较所 述输入的源语言和第二翻译单元的逆向翻译结果之间的相似度,对所述机器翻译进行评 价。优选地,还包括源语言输入单元,用于接收所述输入的源语言;以及目标语言输 出单元,将所述目标语言输出给所述第二翻译单元。优选地,所述源语言语言模型通过计算句子的概率来提供评分。优选地,所述源语言语言模型是词、词类、语义属性中的任意的一种或组合,或是N 元语法模型,根据对输入的源语言的评分和对第二翻译单元的逆向翻译结果的评分之间的 和、差、积、商、对数、指数中的任意一种或组合,所述评价单元对所述机器翻译进行评价。优选地,所述第一翻译单元采用的机器翻译方法是直接翻译方法、基于转换的机 器翻译方法、基于中间语言的机器翻译方法、基于语言学的机器翻译方法、基于知识的机器 翻译方法、基于平行语法的机器翻译方法、基于实例的机器翻译方法、基于统计的机器翻译 方法中的其中之一或者组合;或者,所述第二翻译单元采用的逆向翻译方法是直接翻译方 法、基于转换的机器翻译方法、基于中间语言的机器翻译方法、基于语言学的机器翻译方 法、基于知识的机器翻译方法、基于平行语法的机器翻译方法、基于实例的机器翻译方法、 基于统计的机器翻译方法中的其中之一或者组合。根据本专利技术的另外一个方面,提供了一种机器翻译测评方法,其特征在于,包括下 列步骤对输入的源语言进行机器翻译,并生成目标语言;将所述目标语言逆向翻译成源 语言;根据源语言语言模型对输入的源语言和逆向翻译的结果分别进行评分;根据所述源 语言语言模型的评分比较所述输入的源语言和逆向翻译结果之间的相似度,对所述机器翻 译进行评价。优选地,采用源语言输入单元接收所述输入的源语言;以及采用目标语言输出单 元启动逆向翻译。优选地,所述源语言语言模型通过计算句子的概率来提供评分。优选地,所述源语言语言模型是词、词类、语义属性中的任意的一种或组合,或是 N元语法模型,根据对输入的源语言的评分和逆向翻译结果的评分之间的和、差、积、商、对 数、指数中的任意一种或组合,所述评价单元对所述机器翻译进行评价。优选地,所述机器翻译方法是直接翻译方法、基于转换的机器翻译方法、基于中间 语言的机器翻译方法、基于语言学的机器翻译方法、基于知识的机器翻译方法、基于平行语 法的机器翻译方法、基于实例的机器翻译方法、基于统计的机器翻译方法中的其中之一或 者组合;或者,所述逆向翻译方法是直接翻译方法、基于转换的机器翻译方法、基于中间语言 的机器翻译方法、基于语言学的机器翻译方法、基于知识的机器翻译方法、基于平行语法的机 器翻译方法、基于实例的机器翻译方法、基于统计的机器翻译方法中的其中之一或者组合。根据本专利技术,在不存在参考译文或标准翻译结果的情况下,可以实现对翻译结果 的信赖度进行评价,尤其对统计机器翻译系统的翻译结果的信赖度评价具有很好的评价效 果。具体来讲,通过使用机器翻译单元B (第二翻译单元)把输入的源语言经机器翻译单元 A(第一翻译单元)的翻译结果进行还原,然后,使用翻译结果评分单元来计算输入的源语 言和被还原的翻译结果之间的相似度,从而对机器翻译系统的翻译结果进行评分计算,或 使用源语言模型计算输入给系统的源语言句子和被还原的翻译结果的句子之间的相似度, 对机器翻译系统的翻译结果进行评分计算和信赖度估值,为用户提供机器翻译结果的信赖 度,从而基本解决机器翻译系统在实用层面上的翻译结果评价困难的问题,为包括语音自 动翻译在内的机器翻译系统提供高效可信的机器翻译结果的评价装置和方法。附图说明下面结合附图,对本专利技术的实施例进行说明,应该理解,这些实施例适用于说明本专利技术,而不是对本专利技术进行限定,其中图1是根据本专利技术的第一实施例的机器翻译测评装置的方框图。图2是根据本专利技术的第二实施例的机器翻译测评装置的方框图。图3是根据本专利技术的第一实施例的机器翻译测评方法的流程图。具体实施方式以下对照附图并结合具体实施方式对本专利技术进行进一步的详细说明。在接下来的 部分中,将利用一些具体的例子如英语、汉语等等来解释本专利技术。然而,毋庸讳言,本专利技术所 述的,并不仅仅限于英语或汉语,对其他任何语言都是可以接受 的。根据本专利技术提供的,可以在不存在参考译文或标准翻译 结果的情况下,对翻译结果进行评分和估值,可以为广大普通用户提供机器翻译结果的信 赖度,从而基本解决机器翻译系统在实用层面上的翻译结果评价困难的问题,为包括语音 自动翻译在内的机器翻译系统提供高效可信的机器翻译结果的评价装置和方法,为用户带 来便利。如图1所示,机器翻译测评装置包括源语言输入单元100 ;机器翻译单元AllO ; 目标语言输出单元120 ;机器翻译单元B130 ;翻译结果评分单元140 ;输出单元150。接下 来将详细解释每个构成模块的功能、性质、原理及实现方法。源语言输入单元100接收用户提供的源语言输入语句,并把输入的语句发送给机 器翻译单元AllO和源语言评分单元140。为了输入源语言输入语句,可以使用任何输入 设备,如键盘、手写识别、语音识别装置,或者从已存盘的文件中读取,这些方法都是可接受 的。源语言输入单元100可以使用任何方法,只要能够执行处理最终源语言输入语句即可。 例如,如下设置是可接受的源语言输入单元本文档来自技高网...

【技术保护点】
一种机器翻译测评装置,其特征在于,包括:第一翻译单元,用于对输入的源语言进行机器翻译,并生成目标语言;第二翻译单元,用于把所述目标语言逆向翻译成源语言;源语言语言模型,对输入的源语言和第二翻译单元的逆向翻译结果分别进行评分;以及评价单元,用于根据所述源语言语言模型的评分比较所述输入的源语言和第二翻译单元的逆向翻译结果之间的相似度,对所述机器翻译进行评价。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐金安陈亮
申请(专利权)人:北京交通大学
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1