频响均衡模型的训练方法、语音合成方法和可读存储介质技术

技术编号:37965831 阅读:7 留言:0更新日期:2023-06-30 09:41
本发明专利技术提出了一种频响均衡模型的训练方法、语音合成方法和可读存储介质。频响均衡模型的训练方法包括:获取原始音频和音频播放设备的播放音频,其中,播放音频为原始音频经过音频播放设备播放输出的音频;对原始音频和播放音频进行数据训练,以得到频响均衡模型。以得到频响均衡模型。以得到频响均衡模型。

【技术实现步骤摘要】
频响均衡模型的训练方法、语音合成方法和可读存储介质


[0001]本专利技术涉及语音合成
,具体而言,涉及一种频响均衡模型的训练方法、语音合成方法和可读存储介质。

技术介绍

[0002]频响均衡模型为均衡语音中频响特性的模型,而市面上存在大量音质较差的播放器,如耳机、音箱等,原始语音在经过音质较差的播放器播放后,会出现音质细节损失,某些频段噪声较大等情况,针对上述情况,现阶段的频响均衡模型存在无法补偿音质损失,无法消除噪声等问题。

技术实现思路

[0003]本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。
[0004]为此,本专利技术的第一个方面在于提出一种频响均衡模型的训练方法。
[0005]本专利技术的第二个方面在于提出一种语音合成方法。
[0006]本专利技术的第三个方面在于提出另一种语音合成方法。
[0007]本专利技术的第四个方面在于提出一种可读存储介质。
[0008]本专利技术的第五个方面在于提出一种计算机程序产品。
[0009]本专利技术的第六个方面在于提出一种电子设备。
[0010]本专利技术的第七个方面在于提出一种家电设备。
[0011]有鉴于此,根据本专利技术的第一个方面,提出了一种频响均衡模型的训练方法,包括:获取原始音频和音频播放设备的播放音频,其中,播放音频为原始音频经过音频播放设备播放输出的音频;对原始音频和播放音频进行数据训练,以得到频响均衡模型。
[0012]本技术方案中的频响均衡模型的训练方法通过对原始音频和播放音频进行数据训练,确定频响均衡模型,提升了频响均衡模型的音质增强能力,对于音质较差播放器播放的语音,通过频响均衡模型补偿了语音中的音质细节,并消除了语音中的噪声。
[0013]根据本专利技术的第二个方面,提出了一种语音合成方法,包括:获取第一训练数据,通过频响均衡模型,对第一训练数据进行数据增强,以得到第二训练数据;对第二训练数据进行数据训练,以得到语音合成模型;根据语音合成模型,对输入语音进行语音合成,以得到第一合成语音。
[0014]本技术方案中的语音合成方法通过频响均衡模型优化第一训练数据,得到第二训练数,并基于第二训练数据进行数据训练,生成语音合成模型,再通过语音合成模型,将输入语音合成为第一合成语音,保证了第二训练数据的数据准确性,进而保证了语音合成模型的数据准确性,提升了第一合成语音的频响特性,同时提升了第一合成语音的音频质量。
[0015]根据本专利技术的第三个方面,提出了一种语音合成方法,包括:获取第一训练数据,对第一训练数据进行数据训练,以得到语音合成模型;根据语音合成模型,对输入语音进行语音合成,以得到第一合成语音;通过频响均衡模型,对第一合成语音进行数据增强,以得
到第二合成语音。
[0016]本实施例中的语音合成方法对第一训练数据进行数据训练,得到语音合成模型,并通过语音合成模型,对输入的输入语音进行语音合成,确定输入语音对应第一合成语音,在通过频响均衡模型增强第一合成语音,确定第二合成语音,提升了第一合成语音的音频质量,保证了第二合成语音的频响特性。
[0017]根据本专利技术的第四个方面,提出了一种可读存储介质,其上存储有程序或指令,程序或指令被处理器执行时实现如上述任一技术方案中的频响均衡模型的训练方法或上述任一技术方案中的语音合成方法。因此,该可读存储介质具备上述任一技术方案中的频响均衡模型的训练方法或上述任一技术方案中的语音合成方法的全部有益效果,在此不再赘述。
[0018]根据本专利技术的第五个方面,提出了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如上述任一技术方案中的频响均衡模型的训练方法或上述任一技术方案中的语音合成方法。因此,该计算机程序产品具备上述任一技术方案中的频响均衡模型的训练方法或上述任一技术方案中的语音合成方法的全部有益效果,在此不再赘述。
[0019]根据本专利技术的第六个方面,提出了一种电子设备,包括:上述第四方面中限定的可读存储介质,和/或上述第五方面中限定的计算机程序产品,因而具有上述第四方面中限定的可读存储介质,和/或上述第五方面中限定的计算机程序产品的全部有益技术效果,在此不再做过多赘述。
[0020]根据本专利技术的第七个方面,提出了一种家电设备,包括:如上述第六方面中限定的电子设备,因而具有上述第六方面中限定的电子设备的全部有益技术效果,在此不再做过多赘述,家电设备可以为音箱、空调或冰箱中的任一种。
[0021]本专利技术的附加方面和优点将在下面的描述部分中变得明显,或通过本专利技术的实践了解到。
附图说明
[0022]本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0023]图1示出了本专利技术的实施例中的频响均衡模型的训练方法的流程示意图之一;
[0024]图2示出了本专利技术的实施例中的频响均衡模型的训练方法的流程示意图之二;
[0025]图3示出了本专利技术的实施例中的频响均衡模型的训练方法的流程示意图之三;
[0026]图4示出了本专利技术的实施例中的频响均衡模型的训练方法的流程示意图之四;
[0027]图5示出了本专利技术的实施例中的频响均衡模型的训练方法的流程示意图之五;
[0028]图6示出了本专利技术的实施例中的频响均衡模型的训练方法的流程示意图之六;
[0029]图7示出了本专利技术的实施例中的频响均衡模型的训练方法的流程示意图之七;
[0030]图8示出了本专利技术的实施例中的频响均衡模型的训练方法的流程示意图之八;
[0031]图9示出了本专利技术的实施例中的语音合成方法的流程示意图之一;
[0032]图10示出了本专利技术的实施例中的语音合成方法的流程示意图之二;
[0033]图11示出了本专利技术的实施例中的语音合成方法的流程示意图之三;
[0034]图12示出了本专利技术的实施例中的语音合成方法的流程示意图之四;
[0035]图13示出了本专利技术的实施例中的频响均衡模型的训练装置的结构框图之一;
[0036]图14示出了本专利技术的实施例中的频响均衡模型的训练装置的示意图之一;
[0037]图15示出了本专利技术的实施例中的频响均衡模型的训练装置的示意图之二;
[0038]图16示出了本专利技术的实施例中的频响均衡模型的训练装置的示意图之三;
[0039]图17示出了本专利技术的实施例中的频响均衡模型的训练装置的结构框图之二;
[0040]图18示出了本专利技术的实施例中的语音合成装置的结构框图之一;
[0041]图19示出了本专利技术的实施例中的语音合成装置的示意图之一;
[0042]图20示出了本专利技术的实施例中的语音合成装置的结构框图之二;
[0043]图21示出了本专利技术的实施例中的语音合成装置的示意图之二;
[0044]图22示出了本专利技术的实施例中的语音合成装置的结构框图之三;
具体实施方式
...

【技术保护点】

【技术特征摘要】
1.一种频响均衡模型的训练方法,其特征在于,所述频响均衡模型的训练方法包括:获取原始音频和音频播放设备的播放音频,其中,所述播放音频为所述原始音频经过所述音频播放设备播放输出的音频;对所述原始音频和所述播放音频进行数据训练,以得到所述频响均衡模型。2.根据权利要求1所述的频响均衡模型的训练方法,其特征在于,所述对所述原始音频和所述播放音频进行数据训练,以得到所述频响均衡模型,具体包括:根据所述播放音频的第一音频特性,确定模型输入数据;根据所述原始音频的第二音频特性,确定模型输出数据;根据所述模型输入数据和所述模型输出数据,确定所述频响均衡模型。3.根据权利要求1所述的频响均衡模型的训练方法,其特征在于,所述对所述原始音频和所述播放音频进行数据训练,以得到所述频响均衡模型,具体包括:根据所述播放音频对应的第一分贝值,确定目标权重参数;根据所述目标权重参数,对所述第一分贝值和所述原始音频对应的第二分贝值进行均方误差更新,以得到目标分贝值;根据所述目标分贝值,确定所述频响均衡模型。4.根据权利要求3所述的频响均衡模型的训练方法,其特征在于,所述根据所述播放音频对应的第一分贝值,确定目标权重参数,具体包括:根据所述音频播放设备的频响特性和播放效果,对所述播放音频对应的所述第一分贝值进行参数初始化,以得到所述目标权重参数。5.根据权利要求3所述的频响均衡模型的训练方法,其特征在于,所述频响均衡模型的训练方法,还包括:对所述播放音频对应的N个分贝值数进行数据组合,以得到所述第一分贝值,对所述原始音频对应的N个分贝值数进行数据组合,以得到所述第二分贝值,其中,N为所述频响均衡模型中频带中心的数量。6.根据权利要求1所述的频响均衡模型的训练方法,其特征在于,所述对所述原始音频和所述播放音频进行数据训练,以得到所述频响均衡模型,具体包括:根据所述播放音频,确定第一幅度相位数据,根据所述原始音频,确定第二幅度相位数据;对所述第一幅度相位数据和所述第二幅度相位数据进行数据训练,以得到所述频响均衡模型。7.根据权利要求6所述的频响均衡模型的训练方法,其特征在于,所述根据所述播放音频,确定第一幅度相位数据,根据所述原始音频,确定第二幅度相位数据,具体包括:对所述播放音频进行短时傅里叶变换,提取出所述播放音频的第一幅度相位数据,对所述原始音频进行短时傅里叶变换,提取出所述原始音频的第二幅度相位数据。8.根据权利要求6所述的频响均衡模型的训练方法,其特征在于,所述对所述第一幅度相位数据和所述第二幅...

【专利技术属性】
技术研发人员:朱宁焱高羽王添翼脱立恒
申请(专利权)人:美的集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1