通用语音、目标语音合成模型的训练方法及相关装置制造方法及图纸

技术编号：29926910 阅读：34 留言：0更新日期：2021-09-04 18:48

本发明专利技术提供一种通用语音、目标语音合成模型的训练方法及相关装置，其中通用语音合成模型的训练方法包括：利用语音样本数据对初始语音建模模型进行训练，进而得到语音建模模型，其中，语音样本数据为非标注文本信息的样本数据；利用语音建模模型对语音测试数据进行处理，进而得到第一语音建模数据；利用第一语音建模数据对初始通用语音合成模型进行训练，进而得到通用语音合成模型。本申请的方法采用未标注文本信息的语音样本数据即可训练得到语音合成模型，其能够降低训练语音合成模型的代价以及困难度。价以及困难度。价以及困难度。

全部详细技术资料下载

【技术实现步骤摘要】
通用语音、目标语音合成模型的训练方法及相关装置

[0001]本专利技术涉及语音信号处理
，尤其是涉及一种通用语音、目标语音合成模型的训练方法及相关装置。

技术介绍

[0002]端到端的语音合成模型已经能够合成接近人类的语音，但是训练这种基于神经网络的端到端的语音合成模型需要大量标注有文本信息的语音样本，而获取标注有文本信息的语音样本代价昂贵。对于标注有文本信息的语音样本稀缺的语种，构建高自然度的语音合成模型是比较困难的。

技术实现思路

[0003]本专利技术提供一种通用语音、目标语音合成模型的训练方法及相关装置，其能够降低语音合成模型的代价。
[0004]为解决上述技术问题，本专利技术提供的第一个技术方案为：提供一种通用语音合成模型的训练方法，包括：利用语音样本数据对初始语音建模模型进行训练，进而得到语音建模模型，其中，语音样本数据为非标注文本信息的样本数据；利用语音建模模型对语音测试数据进行处理，进而得到第一语音建模数据；利用第一语音建模数据对初始通用语音合成模型进行训练，进而得到通用语音合成模型。
[0005]其中，利用语音样本数据对初始语音建模模型进行训练，进而得到语音建模模型的步骤，包括：对语音样本数据进行处理，进而得到语音样本数据对应的上下文表征向量以及第二语音建模数据；利用上下文表征向量以及第二语音建模数据对初始语音建模模型进行训练，进而得到语音建模模型。
[0006]其中，对语音样本数据进行处理，进而得到语音样本数据对应的上下文表征向量以及第二语音建模数据的...

【技术保护点】

【技术特征摘要】
1.一种通用语音合成模型的训练方法，其特征在于，包括：利用语音样本数据对初始语音建模模型进行训练，进而得到语音建模模型，其中，所述语音样本数据为非标注文本信息的样本数据；利用所述语音建模模型对语音测试数据进行处理，进而得到第一语音建模数据；利用所述第一语音建模数据对初始通用语音合成模型进行训练，进而得到通用语音合成模型。2.根据权利要求1所述的方法，其特征在于，所述利用语音样本数据对初始语音建模模型进行训练，进而得到语音建模模型的步骤，包括：对所述语音样本数据进行处理，进而得到所述语音样本数据对应的上下文表征向量以及第二语音建模数据；利用所述上下文表征向量以及所述第二语音建模数据对所述初始语音建模模型进行训练，进而得到所述语音建模模型。3.根据权利要求2所述的方法，其特征在于，所述对所述语音样本数据进行处理，进而得到所述语音样本数据对应的上下文表征向量以及第二语音建模数据的步骤，包括：对所述语音样本数据进行特征提取，进而得到第一表征向量；利用上下文表征算法对所述第一表征向量进行处理，进而得到所述上下文表征向量；利用乘积量化的方法对所述第一表征向量进行处理，进而得到所述第二语音建模数据。4.根据权利要求3所述的方法，其特征在于，所述利用所述上下文表征向量以及所述第二语音建模数据对所述初始语音建模模型进行训练，进而得到所述语音建模模型的步骤，包括：利用所述上下文表征向量以及所述第二语音建模数据构建目标函数，进而得到第一语音建模模型；利用乘积量化的方法基于交叉熵函数得到辅助语音建模模型；利用所述第一语音建模模型以及所述辅助语音建模模型得到所述语音建模模型。5.根据权利要求3所述的方法，其特征在于，所述对所述语音样本数据进行特征提取，进而得到第一表征向量的步骤，包括：对所述语音样本数据进行归一化处理，得到归一化数据；对所述归一化数据进行特征提取，进而得到所述第一表征向量。6.根据权利要求3所述的方法，其特征在于，所述利用上下文表征算法对所述第一表征向量进行处理，进而得到所述上下文表征向量的步骤，包括：利用自注意力算法以及前馈网络算法对所述第一表征向量进行处理，进而得到所述上下文表征向量。7.根据权利要求1所述的方法，其...

【专利技术属性】
技术研发人员：陈梦楠，高丽，祖漪清，江源，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人