语音机器翻译模型的构建方法及语音机器翻译装置制造方法及图纸

技术编号：32224653 阅读：10 留言：0更新日期：2022-02-09 17:29

本公开提供了一种语音机器翻译模型的构建方法，包括：获取语音机器翻译模型的预测概率分布；将源语言语音

全部详细技术资料下载

【技术实现步骤摘要】
语音机器翻译模型的构建方法及语音机器翻译装置

[0001]本公开涉及机器翻译
，本公开尤其涉及一种语音机器翻译模型的构建方法及语音机器翻译装置、电子设备及存储介质。

技术介绍

[0002]语音翻译是将一种语言的语音翻译成另一种语言的语音或者文本，是打破语言障碍的关键技术。
[0003]现有技术中的语音翻译系统一般由语音识别模块、机器翻译模块等构成。首先，语音识别模块将源语言的语音转换为源语言的文本，然后通过机器翻译模块再将源语言的文本翻译为目标语言的文本，这种语音翻译系统已经被广泛使用，但是这种语音翻译系统存在着错误累积、翻译时延、计算和存储资源占用较大等缺点，且这种语音翻译系统将源语言的语音识别为源语言的文本再进行翻译的做法，丢失了源语言的语音中的语气、声调等信息，难以避免的会导致语音翻译的不够准确。

技术实现思路

[0004]为了解决上述技术问题中的至少一个，本公开提供了一种语音机器翻译模型的构建方法及语音机器翻译装置、电子设备及存储介质。
[0005]根据本公开的一个方面，提供一种语音机器翻译模型的构建方法，包括：
[0006]构建语音机器翻译模型的预目标函数，所述预目标函数表征预测概率分布与真实数据分布之间的交叉熵，基于源语言语音
‑
目标语言文本的数据集以及所述预目标函数对语音机器翻译模型进行训练，获取所述语音机器翻译模型的预测概率分布；
[0007]将所述源语言语音
‑
目标语言文本组成的数据集中的源语言语音转录文本作为

【技术保护点】

【技术特征摘要】
1.一种语音机器翻译模型的构建方法，其特征在于，包括：构建语音机器翻译模型的预目标函数，所述预目标函数表征预测概率分布与真实数据分布之间的交叉熵，基于源语言语音
‑
目标语言文本的数据集以及所述预目标函数对语音机器翻译模型进行训练，获取所述语音机器翻译模型的预测概率分布；将所述源语言语音
‑
目标语言文本组成的数据集中的源语言语音转录文本作为源语言文本构建源语言文本
‑
目标语言文本的数据集；构建文本机器翻译模型的目标函数，所述目标函数表征预测概率分布与真实数据分布之间的交叉熵，基于所述源语言文本
‑
目标语言文本的数据集以及所述目标函数对文本机器翻译模型进行训练，获取所述文本机器翻译模型的预测概率分布；将所述语音机器翻译模型的预测概率分布与所述文本机器翻译模型的预测概率分布之间的交叉熵作为所述语音机器翻译模型的最终目标函数；以及基于所述最终目标函数对所述语音翻译模型进行训练，最小化所述语音机器翻译模型的预测概率分布与所述文本机器翻译模型的预测概率分布之间的交叉熵，获得构建后的语音机器翻译模型。2.根据权利要求1所述的语音机器翻译模型的构建方法，其特征在于，基于源语言语音
‑
目标语言文本的数据集以及所述预目标函数对语音机器翻译模型进行训练，获取所述语音机器翻译模型的预测概率分布，包括：最小化所述语音机器翻译模型的预测概率分布与真实数据分布之间的交叉熵，以获得所述语音机器翻译模型的预测概率分布。3.根据权利要求1或2所述的语音机器翻译模型的构建方法，其特征在于，基于所述源语言文本
‑
目标语言文本的数据集以及所述目标函数对文本机器翻译模型进行训练，获取所述文本机器翻译模型的预测概率分布，包括：最小化所述文本机器翻译模型的预测概率分布与真实数据分布之间的交叉熵，以获得所述文本机器翻译模型的预测概率分布。4.根据权利要求3所述的语音机器翻译模型的构建方法，其特征在...

【专利技术属性】
技术研发人员：刘宇宸，周玉，
申请(专利权)人：北京中科凡语科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人