频响均衡模型的训练方法、语音合成方法和可读存储介质技术

技术编号：37965831 阅读：7 留言：0更新日期：2023-06-30 09:41

本发明专利技术提出了一种频响均衡模型的训练方法、语音合成方法和可读存储介质。频响均衡模型的训练方法包括：获取原始音频和音频播放设备的播放音频，其中，播放音频为原始音频经过音频播放设备播放输出的音频；对原始音频和播放音频进行数据训练，以得到频响均衡模型。以得到频响均衡模型。以得到频响均衡模型。

全部详细技术资料下载

【技术实现步骤摘要】
频响均衡模型的训练方法、语音合成方法和可读存储介质

[0001]本专利技术涉及语音合成
，具体而言，涉及一种频响均衡模型的训练方法、语音合成方法和可读存储介质。

技术介绍

[0002]频响均衡模型为均衡语音中频响特性的模型，而市面上存在大量音质较差的播放器，如耳机、音箱等，原始语音在经过音质较差的播放器播放后，会出现音质细节损失，某些频段噪声较大等情况，针对上述情况，现阶段的频响均衡模型存在无法补偿音质损失，无法消除噪声等问题。

技术实现思路

[0003]本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。
[0004]为此，本专利技术的第一个方面在于提出一种频响均衡模型的训练方法。
[0005]本专利技术的第二个方面在于提出一种语音合成方法。
[0006]本专利技术的第三个方面在于提出另一种语音合成方法。
[0007]本专利技术的第四个方面在于提出一种可读存储介质。
[0008]本专利技术的第五个方面在于提出一种计算机程序产品。
[0009]本专利技术的第六个方面在于提出一种电子设备。
[0010]本专利技术的第七个方面在于提出一种家电设备。
[0011]有鉴于此，根据本专利技术的第一个方面，提出了一种频响均衡模型的训练方法，包括：获取原始音频和音频播放设备的播放音频，其中，播放音频为原始音频经过音频播放设备播放输出的音频；对原始音频和播放音频进行数据训练，以得到频响均衡模型。
[0012]本技术方案中的频响均衡

【技术保护点】

【技术特征摘要】
1.一种频响均衡模型的训练方法，其特征在于，所述频响均衡模型的训练方法包括：获取原始音频和音频播放设备的播放音频，其中，所述播放音频为所述原始音频经过所述音频播放设备播放输出的音频；对所述原始音频和所述播放音频进行数据训练，以得到所述频响均衡模型。2.根据权利要求1所述的频响均衡模型的训练方法，其特征在于，所述对所述原始音频和所述播放音频进行数据训练，以得到所述频响均衡模型，具体包括：根据所述播放音频的第一音频特性，确定模型输入数据；根据所述原始音频的第二音频特性，确定模型输出数据；根据所述模型输入数据和所述模型输出数据，确定所述频响均衡模型。3.根据权利要求1所述的频响均衡模型的训练方法，其特征在于，所述对所述原始音频和所述播放音频进行数据训练，以得到所述频响均衡模型，具体包括：根据所述播放音频对应的第一分贝值，确定目标权重参数；根据所述目标权重参数，对所述第一分贝值和所述原始音频对应的第二分贝值进行均方误差更新，以得到目标分贝值；根据所述目标分贝值，确定所述频响均衡模型。4.根据权利要求3所述的频响均衡模型的训练方法，其特征在于，所述根据所述播放音频对应的第一分贝值，确定目标权重参数，具体包括：根据所述音频播放设备的频响特性和播放效果，对所述播放音频对应的所述第一分贝值进行参数初始化，以得到所述目标权重参数。5.根据权利要求3所述的频响均衡模型的训练方法，其特征在于，所述频响均衡模型的训练方法，还包括：对所述播放音频对应的N个分贝值数进行数据组合，以得到所述第一分贝值，对所述原始音频对应的N个分贝值数进行数据组合，以得到所述第二分贝值，其中，N为所述频响均衡模型中频带中心的数量。6.根据权利要求1所述的频响均衡模型的训练方法，其特征在于，所述对所述原始音频和所述播放音频进行数据训练，以得到所述频响均衡模型，具体包括：根据所述播放音频，确定第一幅度相位数据，根据所述原始音频，确定第二幅度相位数据；对所述第一幅度相位数据和所述第二幅度相位数据进行数据训练，以得到所述频响均衡模型。7.根据权利要求6所述的频响均衡模型的训练方法，其特征在于，所述根据所述播放音频，确定第一幅度相位数据，根据所述原始音频，确定第二幅度相位数据，具体包括：对所述播放音频进行短时傅里叶变换，提取出所述播放音频的第一幅度相位数据，对所述原始音频进行短时傅里叶变换，提取出所述原始音频的第二幅度相位数据。8.根据权利要求6所述的频响均衡模型的训练方法，其特征在于，所述对所述第一幅度相位数据和所述第二幅...

【专利技术属性】
技术研发人员：朱宁焱，高羽，王添翼，脱立恒，
申请(专利权)人：美的集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人