语音合成模型的训练方法、装置、设备及可读存储介质制造方法及图纸

技术编号：31707634 阅读：8 留言：0更新日期：2022-01-01 11:10

本申请涉及人工智能技术领域，公开了一种自定义语音合成模型的训练方法，包括：加载待训练语音合成模型，并获取进行训练的初始数据，其中，所述初始数据包括文本信息以及标准音频信息；根据所述文本信息，得到所述初始数据对应的音素隐性特征向量和音素差异向量；根据所述标准音频信息、音素隐性特征向量以及音素差异向量，对所述待训练语音合成模型进行训练，得到基础模型；接收模型微调数据，并基于所述模型微调数据对所述基础模型进行微调，得到训练好的语音合成模型。本申请还提供一种装置、计算机设备和存储介质。实现了定制化的模型微调，降低模型微调的工作量，提高模型训练效率，也提高了语音合成的质量。也提高了语音合成的质量。也提高了语音合成的质量。

全部详细技术资料下载

【技术实现步骤摘要】
语音合成模型的训练方法、装置、设备及可读存储介质

[0001]本申请涉及人工智能
，尤其涉及一种自定义语音合成模型的训练方法、自定义语音合成模型的训练装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]自定义语音是商业语音平台中一种特殊的文本转语音服务，旨在利用少量目标说话人语音数据微调源语音合成模型，实现合成目标说话人语音的目的。但是，少量目标说话人语音数据对合成目标说话人语音的自然度和相似性提出了挑战。
[0003]以往关于自定义语音的研究充分考虑了微调参数量设置这一问题，但并没有完全克服上述挑战。具体地，对整个源模型微调或者只微调源模型中解码器部分参数，虽能取得优良的合成语音质量，但是需微调的参数随着用户的增加而大量增加，这限制了其在实际商业服务中的应用。一些工作，仅微调说话人向量参数，可实现高效和轻量化的自定义语音，但合成语音质量较差。
[0004]因此，现在亟需一种提高模型训练效率以及语音合成的质量的自定义语音合成模型的训练方法。

技术实现思路

[0005]本申请提供了一种自定义语音合成模型的训练方法、装置、计算机设备及存储介质，以降低模型微调的工作量，提高模型训练效率，也提高了语音合成的质量。
[0006]第一方面，本申请提供了一种自定义语音合成模型的训练方法，所述方法包括：
[0007]加载待训练语音合成模型，并获取进行训练的初始数据，其中，所述初始数据包括文本信息以及标准音频信息，且所述文本信息与所述标准音频信息一一对应；
[00...

【技术保护点】

【技术特征摘要】
1.一种自定义语音合成模型的训练方法，其特征在于，所述方法包括：加载待训练语音合成模型，并获取进行训练的初始数据，其中，所述初始数据包括文本信息以及标准音频信息，且所述文本信息与所述标准音频信息一一对应；根据所述文本信息，得到所述初始数据对应的音素隐性特征向量和音素差异向量；根据所述标准音频信息、音素隐性特征向量以及音素差异向量，对所述待训练语音合成模型进行训练，得到基础模型；接收模型微调数据，并基于所述模型微调数据对所述基础模型进行微调，得到训练好的语音合成模型。2.根据权利要求1所述的方法，其特征在于，所述待训练语音合成模型包括音素编码器以及差异适配器，所述根据所述文本信息，得到所述初始数据对应的音素隐性特征向量和音素差异向量，包括：获取所述初始数据包含的文本信息，并对所述文本信息进行音素提取，得到每一文本信息对应的音素序列；将所述音素序列输入至所述音素编码器中，得到音素隐性特征向量；将所述音素隐性特征向量输入至所述差异适配器中，得到音素差异向量。3.根据权利要求1所述的方法，其特征在于，所述根据所述标准音频信息、音素隐性特征向量以及音素差异向量，对所述待训练语音合成模型进行训练，得到基础模型，包括：以文本信息为一组别，将所述因素隐性特征向量与所述音素差异向量进行拼接，得到每一文本信息对应的特征向量；根据所述特征向量以及所述标准音频信息，对所述待训练语音合成模型进行训练，并确定训练后的所述待训练语音合成模型是否收敛；当确定所述待训练语音合成模型收敛时，得到基础模型。4.根据权利要求3所述的方法，其特征在于，所述待训练语音合成模型还包括梅尔谱解码器以及声码器，所述根据所述特征向量以及所述初始数据包含的标准音频信息，对所述待训练语音合成模型进行训练，并确定训练后的所述待训练语音合成模型是否收敛，包括：将所述特征向量输入至所述梅尔谱解码器中，得到每一特征向量对应的梅尔谱序列；利用所述声码器对所述梅尔谱序列进行处理，得到每一梅尔谱序列对应的音频信息；根据所述音频信息以及所述初始数据包含的每一文本对应的标准音频信息，确定所述待训练语音合成模型是否训练完成。5.根据权利要求4所述的方法，其特征在于，所述确定所述待训练语音合成模型是否训练完成，包括：根据所述音频信息以及所述标准音频信息，确定所述待训练语音合成模型的损失函...

【专利技术属性】
技术研发人员：郭洋，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人