【技术实现步骤摘要】
翻译模型的质量信息获取方法、装置及计算机设备
本申请涉及机器学习
,特别涉及一种翻译模型的质量信息获取方法、装置、计算机设备及存储介质。
技术介绍
近年来,在机器翻译领域中,基于深度学习的机器翻译方法得到了极大的发展,通常可以通过神经网络等翻译模型来进行机器翻译,由于翻译模型中神经元的高维表示形式以及神经元之间复杂的非线性变换,理解翻译模型的工作机制变得非常困难,为翻译模型的训练、调试、优化等方面带来了极大挑战。目前,在探索翻译模型的可解释性方面,一方面,可以探索模型自身的可解释性,例如,通过分析神经元的中间表示相邻的语言学特性,探索特定神经元在预测过程中扮演的角色,另一方面,可以探索模型行为的可解释性,例如,通过修改模型的输入来观察模型的输出有何改变,得到输入对于输出的贡献度。在上述过程中,不管是探索模型自身的可解释性,还是探索模型行为的可解释性,较为依赖于具体的模型结构和参数,可移植性较差,而且上述两种方法均不能用来衡量翻译模型所学习到的知识,因此,亟需一种具有较高可移植性的、能够准确评估和量化翻译模型所学习到的知识的质量信息获取方法。
技术实现思路
本申请实施例提供了一种翻译模型的质量信息获取方法、装置、计算机设备及存储介质,能够准确评估和量化翻译模型所学习到的知识且具有较高的可移植性。该技术方案如下:一方面,提供了一种翻译模型的质量信息获取方法,该方法包括:将至少一个语料对中的至少一个样本语料输入至基于神经网络的翻译模型,通过所述翻译模型对所述至少一个 ...
【技术保护点】
1.一种翻译模型的质量信息获取方法,其特征在于,所述方法包括:/n将至少一个语料对中的至少一个样本语料输入至基于神经网络的翻译模型,通过所述翻译模型对所述至少一个样本语料进行机器翻译,得到至少一个预测译文,其中,一个语料对包括一个样本语料以及作为所述样本语料的翻译结果的参考语料;/n基于所述至少一个样本语料、所述至少一个预测译文以及至少一个参考语料所包含的短语之间的对应关系,抽取在多个语种中表示相同语义的至少一个短语对,得到所述翻译模型的学习结果信息,所述学习结果信息用于表示所述翻译模型已学习到的多个语种短语之间的映射关系;/n基于所述学习结果信息,生成所述翻译模型的质量信息。/n
【技术特征摘要】
1.一种翻译模型的质量信息获取方法,其特征在于,所述方法包括:
将至少一个语料对中的至少一个样本语料输入至基于神经网络的翻译模型,通过所述翻译模型对所述至少一个样本语料进行机器翻译,得到至少一个预测译文,其中,一个语料对包括一个样本语料以及作为所述样本语料的翻译结果的参考语料;
基于所述至少一个样本语料、所述至少一个预测译文以及至少一个参考语料所包含的短语之间的对应关系,抽取在多个语种中表示相同语义的至少一个短语对,得到所述翻译模型的学习结果信息,所述学习结果信息用于表示所述翻译模型已学习到的多个语种短语之间的映射关系;
基于所述学习结果信息,生成所述翻译模型的质量信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个样本语料、所述至少一个预测译文以及至少一个参考语料所包含的短语之间的对应关系,抽取在多个语种中表示相同语义的至少一个短语对,得到所述翻译模型的学习结果信息包括:
对任一样本语料所包含的任一短语,响应于与所述样本语料的短语所对应的预测译文的短语与参考语料的短语相一致,将所述样本语料的短语和所述预测译文的短语抽取为一个短语对;
重复执行抽取短语对的操作,将得到的至少一个短语对确定为所述学习结果信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对任一样本语料所包含的任一短语,响应于与所述样本语料的短语所对应的预测译文的短语与参考语料的短语不一致,将所述预测译文的短语中与所述参考语料的短语中不一致的字符替换为掩码,删除包含掩码的短语所构成的短语对。
4.根据权利要求2所述的方法,其特征在于,所述响应于与所述样本语料的短语所对应的预测译文的短语与参考语料的短语相一致,将所述样本语料的短语和所述预测译文的短语抽取为一个短语对之前,所述方法还包括:
获取所述样本语料分别与所述预测译文以及所述参考语料之间的词对齐信息,所述词对齐信息是指将所述样本语料中的字符对应翻译至所述预测译文或者所述参考语料中的字符;
基于所述词对齐信息,确定所述样本语料的短语分别与所述预测译文的短语以及所述参考语料的短语之间的对应关系。
5.根据权利要求2所述的方法,其特征在于,所述将得到的至少一个短语对确定为所述学习结果信息之前,所述方法还包括:
基于词频、正向翻译概率或者反向翻译概率中至少一项,对所述至少一个短语对进行数据筛选。
6.根据权利要求1所述的方法,其特征在于,所述基于所述学习结果信息,生成所述翻译模型的质量信息包括:
获取所述学习结果信息中所包含的映射关系数目、数据重构率或者翻译质量中至少一项,所述数据重构率用于表示所述翻译模型对样本语料翻译得到的预测译文与参考语料相一致的比例,所述翻译质量为基于所述学习结果信息的双语评估研究值进行映射所得的数值;
基于所述映射关系数目、所述数据重构率或者所述翻译质量中至少一项,生成所述翻译模型的质量信息。
7.根据权利要求1所述的方法,其特征在于,所述质量信息为质量分数,所述基于所述学习结果信息,生成所述翻译模型的质量信息之后,所述方法还包括:
响应于所述翻译模型的质量分数小于分数阈值,对所述翻译模型进行迭代训练,直到得到质量分数大于或等于所...
【专利技术属性】
技术研发人员:王星,何世林,涂兆鹏,史树明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。