翻译评测方法和系统、电子设备及可读存储介质技术方案

技术编号:33384492 阅读:17 留言:0更新日期:2022-05-11 22:58
本说明书实施例提供了翻译评测方法和系统、电子设备及可读存储介质,其中一种翻译评测方法包括:获取源语内容、目标语参考答案,以及源语种和目标语种信息;获取对所述源语内容进行翻译得到的目标语结果;基于所述目标语参考答案和所述目标语结果,进行句子对齐,生成句对齐信息;根据所述句对齐信息和所述源语种和目标语种信息,进行特征提取,生成所述目标语结果的特征;将所述目标语结果的特征输入完成预训练的多维能力模型,生成对应的翻译评测结果。采用上述方案,能够在保障评测质量的情况下,提高翻译评测的效率。提高翻译评测的效率。提高翻译评测的效率。

【技术实现步骤摘要】
翻译评测方法和系统、电子设备及可读存储介质


[0001]本说明书实施例涉及自然语言处理
,尤其涉及翻译评测方法和系统、电子设备及可读存储介质。

技术介绍

[0002]随着国际化进程的推进,对于翻译人才的需求日益增加,而培养一个翻译人才需要大量的实践练习,并且需要对翻译练习的结果的质量进行有效而及时地反馈。传统的方法是通过老师(或称为教师,审阅者)人工批改,给出翻译质量评价打分,这样效率很低,很难满足学生的训练需求。

技术实现思路

[0003]有鉴于此,本说明书实施例提供一种翻译评测方法和系统、电子设备及可读存储介质,能够在保障评测质量的情况下,提高翻译评测的效率。
[0004]本说明书实施例的一个方面,提供了一种翻译评测方法,其中,包括:
[0005]获取源语内容、目标语参考答案,以及源语种和目标语种信息;
[0006]获取对所述源语内容进行翻译得到的目标语结果;
[0007]基于所述目标语参考答案和所述目标语结果,进行句子对齐,生成句对齐信息;
[0008]根据所述句对齐信息和所述源语种和目标语种信息,进行特征提取,生成所述目标语结果的特征;
[0009]将所述目标语结果的特征输入完成预训练的多维能力模型,生成对应的翻译评测结果。
[0010]可选地,所述获取源语内容,包括:获取待笔译的原始文本;
[0011]所述获取对所述源语内容进行翻译得到的目标语结果,包括以下至少一种方式:通过键盘或手写输入方式直接获取对待笔译的原始文本进行笔译得到的笔译文本,得到目标语文本;
[0012]获取用户上传的对待笔译的原始文本进行笔译得到的笔译文本,得到目标语文本;
[0013]获取用户上传的对待笔译的原始文本进行笔译的笔译文本图像,并通过图像识别,得到目标语文本。
[0014]可选地,所述获取源语内容,包括:获取待口译内容的原始音频;
[0015]所述获取对所述源语内容进行翻译得到的目标语结果,包括:
[0016]获取对待口译内容的原始音频进行口译得到的口译音频;
[0017]对所述口译音频进行识别处理,生成口译文本,以得到目标语文本。
[0018]可选地,所述翻译评测方法还包括:
[0019]响应于对所述口译文本中的识别错误进行修正的操作,对所述口译文本进行修正处理,得到修正后的口译文本,作为所述目标语文本。
[0020]可选地,所述基于所述目标语参考答案和所述目标语结果,进行句子对齐,生成句对齐信息,包括:
[0021]对所述目标语文本和所述目标语参考答案分别按照字节顺序以预设窗口大小进行滑动操作,形成以所述预设窗口大小为片段单位的第一片段序列和第二片段序列;
[0022]按照字节顺序,以所述预设窗口大小为对齐单位,将所述第一片段序列和所述第二片段序列执行对齐操作,生成所述句对齐信息。
[0023]可选地,所述基于所述句对齐信息和所述源语种和目标语种信息,进行特征提取,生成所述目标语文本的特征,包括:
[0024]基于所述句对齐信息以及所述源语种和目标语种信息,采用多种粒度的特征提取模型,进行特征提取,得到相应粒度的特征向量;
[0025]将提取得到的不同粒度的特征向量进行融合,得到所述目标语文本的特征向量。
[0026]可选地,所述基于所述句对齐信息以及所述源语种和目标语种信息,采用多种粒度的特征提取模型,进行特征提取,得到相应粒度的特征向量,包括:
[0027]基于所述句对齐信息中的第一片段序列和所述第二片段序列,采用基于统计的特征提取方法,提取词级别的特征,得到相应的词向量;
[0028]基于所述句对齐信息中的第一片段序列和所述第二片段序列,采用基于语义的特征提取方法,提取句子级别的特征,得到相应的句子向量。
[0029]可选地,所述基于所述句对齐信息中的第一片段序列和所述第二片段序列,采用基于语义的特征提取方法,提取句子级别的特征,得到相应的句子向量,包括以下至少一种:
[0030]将所述第一片段序列输入预设的概率语言模型,计算所述第一片段序列作为一句话的概率,得到对应的单语质量分,作为相应的句子向量;
[0031]将所述第一片段序列和所述第二片段序列输入预训练的相似度评估模型,得到所述第一片段序列和所述第二片段序列的相似度值,作为相应的句子向量。
[0032]可选地,所述基于所述句对齐信息以及所述源语种和目标语种信息,采用多种粒度的特征提取模型,进行特征提取,得到相应粒度的特征向量,还包括:
[0033]基于所述句对齐信息中的第一片段序列和所述第二片段序列,对所述第一片段序列中的相邻片段进行位置互换,采用预设的分类模型,提取句子的语法特征信息,得到相应的句子向量。
[0034]可选地,所述将所述目标语文本的特征输入完成预训练的多维能力模型,生成对应的翻译评测结果,包括:
[0035]将所述目标语文本的特征向量分别输入预设的多个维度的能力模型,分别得到多个维度的量化分级数据;
[0036]基于所述多个维度的量化分级数据,生成所述翻译评测结果。
[0037]本说明书实施例的另一方面,提供了另一种翻译评测方法,其中,包括:
[0038]获取待口译内容的原始音频、目标语参考答案,以及源语种和目标语种信息;
[0039]获取对待口译内容的原始音频进行口译得到的口译音频,对所述口译音频进行识别,生成口译文本,以得到目标语文本;
[0040]基于所述目标语参考答案和所述目标语文本,进行句子对齐,生成句对齐信息;
[0041]根据所述句对齐信息和所述源语种和目标语种信息,进行特征提取,生成所述目标语结果的特征;
[0042]将所述目标语结果的特征输入完成预训练的多维能力模型,生成对应的翻译评测结果。
[0043]可选地,所述获取对待口译内容的原始音频进行口译得到的口译音频,对所述口译音频进行识别,生成口译文本,以得到目标语文本,包括:
[0044]获取对待口译内容的原始音频进行同声传译得到的同声传译音频;对所述同声传译音频通过自动语音识别,生成口译文本,作为目标语文本;
[0045]或,
[0046]获取对待口译内容的原始音频进行交替传译得到的交替传译音频;对所述交替传译音频通过自动语音识别,生成交替传译文本;对所述交替传译文本进行识别,提取出目标语文本。
[0047]本说明书实施例的另一方面,提供了一种翻译评测系统,其中,包括:
[0048]第一获取单元,适于获取源语内容、目标语参考答案,以及源语种和目标语种信息;
[0049]第二获取单元,适于获取对所述源语内容进行翻译得到的目标语结果;
[0050]句对齐单元,适于基于所述目标语参考答案和所述目标语文本,进行句子对齐,生成句对齐信息;
[0051]特征提取单元,适于根据所述句对齐信息和所述源语种和目标语种信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种翻译评测方法,其中,包括:获取源语内容、目标语参考答案,以及源语种和目标语种信息;获取对所述源语内容进行翻译得到的目标语结果;基于所述目标语参考答案和所述目标语结果,进行句子对齐,生成句对齐信息;根据所述句对齐信息和所述源语种和目标语种信息,进行特征提取,生成所述目标语结果的特征;将所述目标语结果的特征输入完成预训练的多维能力模型,生成对应的翻译评测结果。2.根据权利要求1所述的翻译评测方法,其中,所述获取源语内容,包括:获取待笔译的原始文本;所述获取对所述源语内容进行翻译得到的目标语结果,包括以下至少一种方式:通过键盘或手写输入方式直接获取对待笔译的原始文本进行笔译得到的笔译文本,得到目标语文本;获取用户上传的对待笔译的原始文本进行笔译得到的笔译文本,得到目标语文本;获取用户上传的对待笔译的原始文本进行笔译的笔译文本图像,并通过图像识别,得到目标语文本。3.根据权利要求1所述的翻译评测方法,其中,所述获取源语内容,包括:获取待口译内容的原始音频;所述获取对所述源语内容进行翻译得到的目标语结果,包括:获取对待口译内容的原始音频进行口译得到的口译音频;对所述口译音频进行识别处理,生成口译文本,以得到目标语文本。4.根据权利要求3所述的翻译评测方法,其中,还包括:响应于对所述口译文本中的识别错误进行修正的操作,对所述口译文本进行修正处理,得到修正后的口译文本,作为所述目标语文本。5.根据权利要求2

4任一项所述的翻译评测方法,其中,所述基于所述目标语参考答案和所述目标语结果,进行句子对齐,生成句对齐信息,包括:对所述目标语文本和所述目标语参考答案分别按照字节顺序以预设窗口大小进行滑动操作,形成以所述预设窗口大小为片段单位的第一片段序列和第二片段序列;按照字节顺序,以所述预设窗口大小为对齐单位,将所述第一片段序列和所述第二片段序列执行对齐操作,生成所述句对齐信息。6.根据权利要求5所述的翻译评测方法,其中,所述基于所述句对齐信息和所述源语种和目标语种信息,进行特征提取,生成所述目标语文本的特征,包括:基于所述句对齐信息以及所述源语种和目标语种信息,采用多种粒度的特征提取模型,进行特征提取,得到相应粒度的特征向量;将提取得到的不同粒度的特征向量进行融合,得到所述目标语文本的特征向量。7.根据权利要求6所述的翻译评测方法,其中,所述基于所述句对齐信息以及所述源语种和目标语种信息,采用多种粒度的特征提取模型,进行特征提取,得到相应粒度的特征向量,包括:基于所述句对齐信息中的第一片段序列和所述第二片段序列,采用基于统计的特征提
取方法,提取词级别的特征,得到相应的词向量;基于所述句对齐信息中的第一片段序列和所述第二片段序列,采用基于语义的特征提取方法,提取句子级别的特征,得到相应的句子向量。8.根据权利要求7所述的翻译评测方法,其中,所述基于所述句对齐信息中的第一片段序列和所述第二片段序列,采用基于语义的特征提取方法,提取句子级别的特征,得到相应的句子向量,包括以下至少一种:将所述第一片段序列输入预设的概率语言模型,计算所述第一片段序列作为一句话的概率,得到对应的单语质量分,作为相应的句子向量;将所述第一片段序列和所述第二片段序列输入预训练的相似度评估模型,得到所述第一片段序列和所述第二片段序列的相似度值,作为相应的句子向量。9.根据权利要求7所述的翻译评测方法,其中,所述基于所述句对齐信息以及所述源语种和目标语种信息,采用多种粒度的特征提取模型,进行特征提取,得到相应粒度的特征向量,还包括:基于所述句对齐信息中的第一片段序列和所述第二片段序列,对所述第一片段序列中的相邻片段进行位置互换,采用预设的分类模型,提取句子的语法特征信息,得到相应的句子向量。10.根据权利要求6所述的翻译评测方法,其中,所述将所述目标语文本的特征输入完成预训练的多维能力模型,生成对应的翻译评测结果,包括:将所述目标语文本的特征向量分别输入预设的多个维度的能力模型,分别得到多个维度的量化分级数据;基于所述多个维度的量化分级数据,生成所述翻译评测结果。11.一种翻译评测方法,其中,包括:获取待口译内容的原始音频、目标语参考答案,以及源语种和目标语种信息;获取对待口译内容的原始音频进行口译得到的口译音频,对所述口译音频进行识别,生成口译文本,以得到目标语文本;基于所述目标语参考答案和所述目标语文本,进行句子对齐,生成句对齐信息;根据所述句对齐信息和所述源语种和目标语种信息,进行特征提取,生成所述目标语文本的特征;将...

【专利技术属性】
技术研发人员:王轲张昱琪王巍巍赵宇骆卫华
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1