语音处理模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号：29963824 阅读：16 留言：0更新日期：2021-09-08 09:27

本申请提供一种语音处理模型的训练方法、装置、设备及计算机可读存储介质，该方法包括：获取样本数据，样本数据包括源语种的语音和与源语种的语音对应的目标语种样本文本；将源语种的语音输入语音处理模型的语音识别子模型，得到源语种文本；将源语种文本输入语音处理模型的字词数据库中遍历，得到源语种文本对应的词向量；将词向量和目标语种样本文本输入语音处理模型的机器翻译子模型，得到目标语种翻译文本；基于预设损失函数，根据目标语种翻译文本和目标语种样本文本计算语音处理模型的损失值；根据损失值对语音处理模型进行参数调整，得到训练好的语音处理模型。可以减少模型的训练数据，提高训练效率。本申请还涉及区块链技术。链技术。链技术。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理模型的训练方法、装置、设备及存储介质

[0001]本申请涉及计算机
，尤其涉及一种语音处理模型的训练方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]目前，语音翻译技术多数先通过ASR对语音进行文本转录，再通过机器翻译将转录后的文本翻译为所需要的目标文本，需要经过自动语音识别(ASR)模型转录以及神经机器翻译(NMT)模型翻译，在对上述模型进行训练时，需要大量的数据，训练的效率不高，且自动语音识别(ASR)模型的转录效果不够精确的情况下，经翻译处理后输出的结果会产生更大的误差，从而得到的从语音到文本的翻译结果不符合预期。

技术实现思路

[0003]本申请的主要目的在于提供一种语音处理模型的训练方法、装置、设备及计算机可读存储介质，旨在提高语音处理模型的训练效率和准确性，训练好的语音处理模型能够降低翻译文本输出的时延性以及得到更精准的翻译文本。
[0004]第一方面，本申请提供一种语音处理模型的训练方法，所述语音处理模型的训练方法包括以下步骤：获取样本数据，所述样本数据包括源语种的语音和与所述源语种的语音对应的目标语种样本文本；
[0005]将所述源语种的语音输入语音处理模型的语音识别子模型，得到所述语音识别子模型输出的源语种文本；
[0006]将所述源语种文本输入所述语音处理模型的字词数据库中遍历，得到所述源语种文本对应的词向量；
[0007]将所述词向量和所述源语种的语音对应的目标语种样本文本输入所述语音处理模型的机器翻译子模型，得到所述机器...

【技术保护点】

【技术特征摘要】
1.一种语音处理模型的训练方法，其特征在于，包括：获取样本数据，所述样本数据包括源语种的语音和与所述源语种的语音对应的目标语种样本文本；将所述源语种的语音输入语音处理模型的语音识别子模型，得到所述语音识别子模型输出的源语种文本；将所述源语种文本输入所述语音处理模型的字词数据库中遍历，得到所述源语种文本对应的词向量；将所述词向量和所述源语种的语音对应的目标语种样本文本输入所述语音处理模型的机器翻译子模型，得到所述机器翻译子模型输出的目标语种翻译文本；基于预设损失函数，根据所述目标语种翻译文本和所述目标语种样本文本计算所述语音处理模型的损失值；根据所述损失值对语音处理模型进行参数调整，得到训练好的语音处理模型。2.如权利要求1所述的语音处理模型的训练方法，其特征在于，所述机器翻译子模型包括编码器和解码器；所述将所述词向量和所述目标语种样本文本输入所述语音处理模型的机器翻译子模型，得到所述机器翻译子模型输出的目标语种翻译文本，包括：将所述词向量输入所述编码器进行权重计算，得到权重计算后的权重词向量；将所述权重词向量和所述目标语种样本文本输入所述解码器进行翻译得到目标语种翻译文本。3.如权利要求2所述的语音处理模型的训练方法，其特征在于，所述将所述权重词向量和所述目标语种样本文本输入所述解码器进行翻译得到目标语种翻译文本，包括：将所述权重词向量和所述目标语种样本文本N个位置的样本词向量输入所述解码器进行翻译，得到位于目标语种翻译文本第N+1个位置的目标词向量，其中，N为大于零且不大于所述权重词向量的数量的正整数；将预测得到的位于目标语种翻译文本各个位置的目标词向量进行拼接得到目标语种翻译文本。4.如权利要求3所述的语音处理模型的训练方法，其特征在于，所述将所述权重词向量和所述目标语种样本文本N个位置的样本词向量输入所述解码器进行翻译，得到位于目标语种翻译文本第N+1个位置的目标词向量，包括：若N等于1，将所述权重词向量和位于所述目标语种样本文本第一个位置的样本词向量输入所述解码器进行翻译，得到位于目标语种翻译文本第二个位置的目标词向量，以及将N加1；若N大于1，将预测得到的目标语种翻译文本N个位置的目标词向量进行拼接，并将拼接后的目标词向量、目标语种样本文本N个位置的样本词向量以及权重词向量输入所述解码器进行翻译，得到位于目标语种翻译文本的第N+1个位置的目标词向量，以及若N不大于所述权重词向量的数量时将N加1。5.如权利要求1
‑
4中任一项所述的语音处理模型的训练方法，其特征在于，所述基于预设损失函数，根据...

【专利技术属性】
技术研发人员：陈霖捷，王健宗，黄章成，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人