变声方法、装置、设备和介质制造方法及图纸

技术编号:29616867 阅读:16 留言:0更新日期:2021-08-10 18:35
本公开提供一种变声方法、装置、设备和介质,涉及计算机技术领域,变声方法包括:根据初始音频对应的目标变声音频,确定初始音频对应的目标基频偏移量和目标变声参数;其中,目标变声参数包括目标滤波参数和目标均衡参数;根据目标滤波参数,对初始音频进行滤波处理,得到第一音频;基于目标基频偏移量,对第一音频进行基频变换处理,得到第二音频;根据目标均衡参数,对第二音频进行均衡处理,得到目标变声音频。本公开的方案可以抑制变声后的尖锐噪声和沉闷声,从而提高变声性能。

【技术实现步骤摘要】
变声方法、装置、设备和介质
本公开涉及计算机
,特别涉及一种变声方法、装置、设备和介质。
技术介绍
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。变声是一种音频信号处理的技术,通过改变语音信号的基频、抑制或者增强某些频率成分、添加混响等,可以得到一些特殊的变声音效,例如男女声互变、成熟、恐怖、机器人等音效。其中,改变语音信号的基频,可以显著改变语音的特征信息,因此,大部分变声音效都需要先进行基频变换,即变调处理。目前的基频变换方法,在语音信号的基频偏移量较大时,容易使变声后的语音产生尖锐噪声和沉闷声,导致变声性能较差。例如,当基频偏移量向上偏移较大时,高频成分容易产生尖锐噪声;当基频偏移量向下偏移较大时,低频成分容易产生沉闷声。
技术实现思路
本公开实施例提供一种变声方法、装置、设备和介质,用于抑制变声后的尖锐噪声和沉闷声,从而提高变声性能。第一方面,本公开实施例提供了一种变声方法,包括:根据初始音频对应的目标变声音频,确定所述初始音频对应的目标基频偏移量和目标变声参数;其中,所述目标变声参数包括目标滤波参数和目标均衡参数;根据所述目标滤波参数,对所述初始音频进行滤波处理,得到第一音频;基于所述目标基频偏移量,对所述第一音频进行基频变换处理,得到第二音频;根据所述目标均衡参数,对所述第二音频进行均衡处理,得到所述目标变声音频。在一种可选的实施方式中,所述根据初始音频对应的目标变声音频,确定所述初始音频对应的目标基频偏移量和目标变声参数,包括:基于预先设置的变声类型与基频偏移量的对应关系,根据所述目标变声音频的目标变声类型,确定所述目标基频偏移量;以及基于预先设置的变声类型与变声参数的对应关系,根据所述目标变声音频的目标变声类型,确定所述目标变声参数。在一种可选的实施方式中,所述根据初始音频对应的目标变声音频,确定所述初始音频对应的目标基频偏移量和目标变声参数,包括:基于预先设置的变声类型与基频偏移量的对应关系,根据所述目标变声音频的目标变声类型,确定所述目标基频偏移量;以及基于预先设置的基频偏移量与变声参数的对应关系,确定所述目标基频偏移量对应的所述目标变声参数。在一种可选的实施方式中,所述根据所述目标滤波参数,对所述初始音频进行滤波处理,得到第一音频,包括:若所述目标滤波参数为目标低频频段,则将所述初始音频的所述目标低频频段滤除,得到所述第一音频;或者若所述目标滤波参数为目标高频频段,则将所述初始音频的所述目标高频频段滤除,得到所述第一音频。在一种可选的实施方式中,所述基于所述目标基频偏移量,对所述第一音频进行基频变换处理,得到第二音频,包括:基于所述目标基频偏移量,对所述第一音频进行变速处理,得到变速音频;对所述变速音频进行重采样处理,得到所述第二音频;其中,所述第二音频与所述初始音频的语调不同。在一种可选的实施方式中,所述基于所述目标基频偏移量,对所述第一音频进行变速处理,得到变速音频,包括:将所述第一音频的时域信号转换为频域信号,得到待处理音频;根据所述目标基频偏移量,确定待处理音频的音频帧跨度;基于所述待处理音频的各帧音频,每隔所述音频帧跨度,重新合成一个目标音频帧,得到所述变速音频;其中,每个目标音频帧的幅度信息根据所述待处理音频中,该目标音频帧对应的参考音频帧的幅度信息确定,以及每个目标音频帧的相位信息根据所述待处理音频中,该目标音频帧对应的参考音频帧的相位信息确定。在一种可选的实施方式中,所述方法还包括:针对所述变速音频中的每个目标音频帧,确定所述目标音频帧对应的参考音频帧的参考能量以及所述目标音频帧的目标能量,若所述目标能量与所述参考能量不一致,则将所述目标能量调整至所述参考能量;或者针对所述变速音频中的每个目标音频帧,确定所述目标音频帧对应的参考音频帧的参考幅度以及所述目标音频帧的目标幅度,若所述目标幅度与所述参考幅度不一致,则将所述目标幅度调整至所述参考幅度。在一种可选的实施方式中,所述若所述目标能量与所述参考能量不一致,则将所述目标能量调整至所述参考能量,包括:若所述目标能量与所述参考能量不一致,则将所述参考能量和所述目标能量的比值,作为所述目标音频帧的能量调节因子,并根据所述目标音频帧的能量调节因子,对所述目标能量进行调整;或者若所述目标能量与所述参考能量不一致,则将所述目标能量逐步调整至所述参考能量。在一种可选的实施方式中,所述若所述目标幅度与所述参考幅度不一致,则将所述目标幅度调整至所述参考幅度,包括:若所述目标幅度与所述参考幅度不一致,将所述参考幅度和所述目标幅度的比值,作为所述目标音频帧的幅度调节因子,并根据所述目标音频帧的幅度调节因子,对所述目标幅度进行调整;或者若所述目标幅度与所述参考幅度不一致,则将所述目标幅度逐步调整至所述参考幅度。在一种可选的实施方式中,所述根据所述目标均衡参数包括均衡频段和所述均衡频段的能量增强参数,对所述第二音频进行均衡处理,得到所述目标变声音频,包括:基于所述能量增强参数,对所述第二音频的所述均衡频段的能量进行增强,得到所述目标变声音频。在一种可选的实施方式中,所述预先设置的基频偏移量与变声参数的对应关系通过如下方式确定:针对多种变声类型的参考变声音频中的每种变声类型的参考变声音频,执行如下操作:根据所述参考变声音频的频谱特征,确定多组候选变声参数;其中,所述参考变声音频对应一个基频偏移量;针对所述多组候选变声参数中的每组候选变声参数,根据该组候选变声参数和所述基频偏移量,对测试音频依次进行滤波处理、基频变换处理和均衡处理,得到该组候选变声参数对应的变声音频;根据得到的多个变声音频的频谱特征,确定频谱特征与所述参考变声音频的频谱特征相匹配的候选变声音频集;从所述候选变声音频集中,选择与所述参考变声音频最匹配的候选变声音频,将选择的候选变声音频对应的候选变声参数,作为所述基频偏移量对应的变声参数。第二方面,本公开实施例还提供了一种变声装置,包括:确定模块,用于根据初始音频对应的目标变声音频,确定所述初始音频对应的目标基频偏移量和目标变声参数;其中,所述目标变声参数包括目标滤波参数和目标均衡参数;滤波模块,用于根据所述目标滤波参数,对所述初始音频进行滤波处理,得到第一音频;基频变换模块,用于基于所述目标基频偏移量,对所述第一音频进行基频变换处理,得到第二音频;均衡模块,用于根据所述目标均衡参数,对所述第二音频进行均衡处理,得到所述目标变声音频。在一种可选的实施方式中,所述确定模块,还用于:基于预先设置的变声类型与基频偏移量的对应关系,根据所述目标变声音频的目标变声类型,确定所述目标基频偏移量;以及基于预先设置的变声类型与本文档来自技高网...

【技术保护点】
1.一种变声方法,其特征在于,包括:/n根据初始音频对应的目标变声音频,确定所述初始音频对应的目标基频偏移量和目标变声参数;其中,所述目标变声参数包括目标滤波参数和目标均衡参数;/n根据所述目标滤波参数,对所述初始音频进行滤波处理,得到第一音频;/n基于所述目标基频偏移量,对所述第一音频进行基频变换处理,得到第二音频;/n根据所述目标均衡参数,对所述第二音频进行均衡处理,得到所述目标变声音频。/n

【技术特征摘要】
1.一种变声方法,其特征在于,包括:
根据初始音频对应的目标变声音频,确定所述初始音频对应的目标基频偏移量和目标变声参数;其中,所述目标变声参数包括目标滤波参数和目标均衡参数;
根据所述目标滤波参数,对所述初始音频进行滤波处理,得到第一音频;
基于所述目标基频偏移量,对所述第一音频进行基频变换处理,得到第二音频;
根据所述目标均衡参数,对所述第二音频进行均衡处理,得到所述目标变声音频。


2.根据权利要求1所述的变声方法,其特征在于,所述根据初始音频对应的目标变声音频,确定所述初始音频对应的目标基频偏移量和目标变声参数,包括:
基于预先设置的变声类型与基频偏移量的对应关系,根据所述目标变声音频的目标变声类型,确定所述目标基频偏移量;以及
基于预先设置的变声类型与变声参数的对应关系,根据所述目标变声音频的目标变声类型,确定所述目标变声参数。


3.根据权利要求1所述的变声方法,其特征在于,所述根据初始音频对应的目标变声音频,确定所述初始音频对应的目标基频偏移量和目标变声参数,包括:
基于预先设置的变声类型与基频偏移量的对应关系,根据所述目标变声音频的目标变声类型,确定所述目标基频偏移量;以及
基于预先设置的基频偏移量与变声参数的对应关系,确定所述目标基频偏移量对应的所述目标变声参数。


4.根据权利要求1所述的变声方法,其特征在于,所述根据所述目标滤波参数,对所述初始音频进行滤波处理,得到第一音频,包括:
若所述目标滤波参数为目标低频频段,则将所述初始音频的所述目标低频频段滤除,得到所述第一音频;或者
若所述目标滤波参数为目标高频频段,则将所述初始音频的所述目标高频频段滤除,得到所述第一音频。


5.根据权利要求1至4任一项所述的变声方法,其特征在于,所述基于所述目标基频偏移量,对所述第一音频进行基频变换处理,得到第二音频,包括:
基于所述目标基频偏移量,对所述第一音频进行变速处理,得到变速音频;
对所述变速音频进行重采样处理,得到所述第二音频;其中,所述第二音频与所述初始音频的语调不同。

【专利技术属性】
技术研发人员:王志强阮良陈丽陈功
申请(专利权)人:杭州朗和科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1