翻译装置、学习装置、翻译方法以及存储介质制造方法及图纸

技术编号：12572774 阅读：56 留言：0更新日期：2015-12-23 13:56

当利用对特征进行非线性结合的神经网络时，在检索过程中需要重新计算候选翻译的分数，负荷较大。通过一种翻译装置，能够在机器翻译中高精度且快速地进行翻译，该翻译装置具备：参数存储部，能够存储适用于非局部特征函数的第一权重向量以及适用于局部特征函数的第二权重向量；特征函数信息存储部，能够存储非局部的第一特征函数信息以及局部的第二特征函数信息；部分对信息存储部，能够存储两个以上的部分对信息，所述部分对信息为短语对或规则对等；分数取得部，以短语对或规则对等为单位导入非线性模型，并且将非线性模型限定于对短语对或规则对封闭的特性，从而取得两个以上目标语言句的分数；目标语言句取得部，取得分数最大的目标语言句；以及输出部，用于输出目标语言句。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及翻译装置等。
技术介绍
例如统计机器翻译等以往的翻译装置是通过组合了多个特征的线性模型来实现的，并被程式化为如下问题，即搜索使该线性模型的分数最高的翻译。在这种模型化中，尽管翻译装置的改进是被当作开发出对翻译做出贡献的特征的问题来理解的，但是，评价翻译好坏的评价函数与翻译装置中所使用的特征之间不一定能够通过线性关系表现出来。因此，即使重新向线性模型中添加特征，新的特征也未必会对翻译装置的改进做出贡献。另外，基于线性模型的制约，即使开发出更好的特征，有可能对翻译装置的改进所做出的贡献也是有限的。因此，以往在统计机器翻译领域中，不拘泥于线性模型，而提出了非线性模型（参照非专利文献1~5)。在非专利文献1、2中，根据Boosting算法实现了一种非线性翻译模型，并将其用于对从翻译装置输出的多个候选翻译进行的重排序。另外，在非专利文献3中，将神经网络导入到表现为转换机（Transducer)的翻译模型中。在非专利文献4、5中，按照短语对和规则对等翻译知识的基本单位，基于神经网络构建了模型，并将其作为重排序和短语对单位的特征导入。在先技术文献非专利文献非专利文献 I :Kevin Duh and Katrin Kirchhoff. 2008. Beyond log-linear models:Boosted minimum error rate training for n-best re-ranking. In Proceedings of ACL_08:HLT，Short Papers,pages 37...

【技术保护点】
一种翻译装置，具备：参数存储部，能够存储适用于非局部特征函数的权重向量即第一权重向量、以及适用于局部特征函数的权重向量即第二权重向量；特征函数信息存储部，能够存储与非局部特征函数相关的信息即第一特征函数信息、以及与局部特征函数相关的信息即第二特征函数信息；部分对信息存储部，能够存储两个以上的部分对信息，所述部分对信息具有用于构成源语言句部分的源语言部分信息和用于构成目标语言句部分的目标语言部分信息；接受部，用于接受源语言句；向量取得部，将所述接受部接受的源语言句和存储在所述部分对信息存储部中的一个以上的部分对信息适用在由所述第一特征函数信息表示的非局部特征函数，从而取得第一向量，并且，将构成所述接受部接受的源语言句的一个以上的用语和存储在所述部分对信息存储部中的一个以上的部分对信息适用在由所述第二特征函数信息表示的局部特征函数，从而取得第二向量；分数取得部，使用所述向量取得部取得的第一向量以及所述第一权重向量计算出非局部的分数即非局部分数，并使用所述向量取得部取得的第二向量以及所述第二权重向量计算出局部的分数即局部分数，再使用所述非局部分数和所述局部分数取得与所述接受部接受的源语言句对...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：渡边太郎，刘乐茂，隅田英一郎，
申请(专利权)人：国立研究开发法人情报通信研究机构，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人