一种音频处理方法及计算机装置制造方法及图纸

技术编号:32781615 阅读:19 留言:0更新日期:2022-03-23 19:39
本发明专利技术实施例提供了一种音频处理方法及计算机装置,用于生成带有目标对象变声的合成伴奏。本发明专利技术实施例方法包括获取待合成变声,所述待合成变声为对目标歌曲对应的原始干声按照目标对象的声调执行变调不变速处理后得到的音频;获取目标歌曲的对唱句群时段模板,根据对唱句群时段模板,将待合成变声分解为目标对象句群和用户句群;保留待合成变声中的目标对象句群,并将待合成变声中的用户句群执行静音处理;将保留的目标对象句群按照预设的能量比与目标歌曲伴奏进行混音,使得混音后伴奏音量的响度与目标歌曲伴奏的原始响度相同,且不低于预设的响度标准;输出混音后的带有目标对象变声的伴奏音频。对象变声的伴奏音频。对象变声的伴奏音频。

【技术实现步骤摘要】
一种音频处理方法及计算机装置


[0001]本专利技术涉及音频的合成处理,尤其涉及一种音频处理方法及计算机装置。

技术介绍

[0002]近些年来,音乐创作速度呈现爆炸式增长,每天有成百上千的原唱歌曲产生。而在日常娱乐中,如果在不同的应用常用场景中,人们可能需要带有不同目标对象的变音伴奏,如小黄人变音伴奏或蜡笔小新变音伴奏等,而这种与原唱歌曲相对应的变音伴奏却无法及时提供到K歌系统中使用。
[0003]故目前亟需提供一种可以生成带有目标对象变声的合成伴奏的方法。

技术实现思路

[0004]本专利技术实施例提供了一种音频处理方法及计算机装置,用于生成带有目标对象变声的合成伴奏。
[0005]本申请实施例第一方面提供了一种音频处理方法,包括:
[0006]获取待合成变声,所述待合成变声为对目标歌曲对应的原始干声按照目标对象的声调执行变调不变速处理后得到的音频;
[0007]获取所述目标歌曲的对唱句群时段模板,根据所述对唱句群时段模板,将所述待合成变声分解为目标对象句群和用户句群;
[0008]保留所述待合成变声中的目标对象句群,并将所述待合成变声中的用户句群执行静音处理;
[0009]将保留的所述目标对象句群按照预设的能量比与目标歌曲伴奏进行混音,使得混音后伴奏音量的响度与所述目标歌曲伴奏的原始响度相同,且不低于预设的响度标准;
[0010]输出混音后的带有所述目标对象变声的伴奏音频。
[0011]可选的,在所述获取所述目标歌曲的对唱句群时段模板之前,所述方法还包括:
[0012]获取所述待合成变声;
[0013]对所述待合成变声执行第一处理,以生成所述目标歌曲的对唱句群时段模板,其中,所述第一处理用于获取所述待合成变声中有效声音句群的时间戳信息。
[0014]可选的,所述对所述待合成变声执行第一处理,以生成所述目标歌曲的对唱句群时段模板,包括:
[0015]对所述待合成变声的语音信号执行平滑处理,以获取所述待合成变声的幅度包络;
[0016]利用阈值函数对所述待合成变声的幅度包络进行处理,以获取所述待合成变声中有效声音句群的时间戳信息;
[0017]根据所述待合成变声中有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板。
[0018]可选的,对所述待合成变声的语音信号执行平滑处理,以获取所述待合成变声的
幅度包络之前,所述方法还包括:
[0019]对所述待合成变声的语音信号进行低通滤波,以获取目标频段的待合成变声信号。
[0020]可选的,在对所述待合成变声的语音信号进行低通滤波之前,所述方法还包括:
[0021]对所述待合成变声的语音信号的幅值进行归一化处理,以得到归一化的待合成变声。
[0022]可选的,所述根据所述待合成变声中有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板,包括:
[0023]获取所述待合成变声的时间歌词信息;
[0024]根据所述待合成变声的时间歌词信息和所述待合成变声中有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板。
[0025]可选的,所述根据所述待合成变声的时间歌词信息和所述待合成变声中有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板,包括:
[0026]将所述待合成变声中有效声音句群的时间戳信息与所述待合成变声的时间歌词信息中的时间戳信息执行对齐操作,以得到校正后的有效声音句群的时间戳信息;
[0027]根据校正后的有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板。
[0028]可选的,在所述将保留的所述目标对象句群按照预设的能量比与目标歌曲伴奏进行混音之前,所述方法还包括:
[0029]设置所述目标对象句群的响度小于所述目标歌曲伴奏的响度,且比所述目标歌曲伴奏的响度低预设值。
[0030]可选的,所述方法还包括:
[0031]获取所述待合成变声的时间歌词信息;
[0032]在所述保留所述待合成变声中的目标对象句群,并将所述待合成变声中的用户句群执行静音处理之后,所述方法还包括:
[0033]根据所述待合成变声的时间歌词信息、保留的所述目标对象句群和静音处理后的用户句群,对所述待合成变声的时间歌词信息中目标对象句群的时间歌词信息进行标记以生成带有目标对象标记的时间歌词信息。
[0034]可选的,所述根据所述待合成变声的时间歌词信息、保留的所述目标对象句群和静音处理后的用户句群,对所述待合成变声的时间歌词信息中目标对象句群的时间歌词信息进行标记以生成带有目标对象标记的时间歌词信息,包括:
[0035]根据所述待合成变声的时间歌词新、保留的所述目标对象句群和静音处理后的用户句群,利用note文件或midi文件对所述目标对象句群的歌词在所述待合成变声的时间歌词信息中的时间戳位置进行标记,以生成带有目标对象标记的时间歌词信息。
[0036]可惜的,在所述获取待合成变声之前,所述方法还包括:
[0037]对目标歌曲的原始干声按照目标对象的声调执行变调不变速处理,以得到所述目标歌曲的目标对象变声集合;
[0038]从所述目标歌曲的目标对象变声集合中筛选出符合预设标准的待合成变声。
[0039]可选的,在对目标歌曲的原始干声按照目标对象的声调执行变调不变速处理,以得到所述目标歌曲的目标对象变声集合之前,所述方法还包括:
[0040]从所述目标歌曲的干声音频集合中筛选出满足预设旋律标准和预设音质标准的原始干声集合;
[0041]从所述目标歌曲的目标对象变声集合中筛选出符合预设标准的待合成变声,包括:
[0042]按照听音的自然度和愉悦度标准,从所述目标歌曲的目标对象变声集合中筛选出符合预设标准的待合成变声。
[0043]可选的,所述预设旋律标准包括预设音准标准和预设节奏标准;
[0044]所述听音的自然度和愉悦度标准,包括:音频气息的平稳度、基频序列的余弦相似度和音频节拍分布的稳定性中的至少一项。
[0045]可选的,所述变调不变速处理包括:重采样的变速变调处理和相频声码器的变速不变调处理。
[0046]可选的,所述对目标歌曲的原始干声按照目标对象的声调执行变调不变速处理,包括:
[0047]对所述原始干声的语音信号先执行所述重采样的变速变调策略,再执行所述相频声码器的变速不变调策略;
[0048]或,
[0049]对所述原始干声的语音信号先执行所述相频声码器的变速不变调策略,再执行所述重采样的变速变调策略。
[0050]可选的,对所述原始干声的语音信号先执行所述重采样的变速变调策略,再执行所述相频声码器的变速不变调本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:获取待合成变声,所述待合成变声为对目标歌曲对应的原始干声按照目标对象的声调执行变调不变速处理后得到的音频;获取所述目标歌曲的对唱句群时段模板,根据所述对唱句群时段模板,将所述待合成变声分解为目标对象句群和用户句群;保留所述待合成变声中的目标对象句群,并将所述待合成变声中的用户句群执行静音处理;将保留的所述目标对象句群按照预设的能量比与目标歌曲伴奏进行混音,使得混音后伴奏音量的响度与所述目标歌曲伴奏的原始响度相同,且不低于预设的响度标准;输出混音后的带有所述目标对象变声的伴奏音频。2.根据权利要求1所述的方法,其特征在于,在所述获取所述目标歌曲的对唱句群时段模板之前,所述方法还包括:对所述待合成变声执行第一处理,以生成所述目标歌曲的对唱句群时段模板,其中,所述第一处理用于获取所述待合成变声中有效声音句群的时间戳信息。3.根据权利要求2所述的方法,其特征在于,所述对所述待合成变声执行第一处理,以生成所述目标歌曲的对唱句群时段模板,包括:对所述待合成变声的语音信号执行平滑处理,以获取所述待合成变声的幅度包络;利用阈值函数对所述待合成变声的幅度包络进行处理,以获取所述待合成变声中有效声音句群的时间戳信息;根据所述待合成变声中有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板。4.根据权利要求3所述的方法,其特征在于,对所述待合成变声的语音信号执行平滑处理,以获取所述待合成变声的幅度包络之前,所述方法还包括:对所述待合成变声的语音信号进行低通滤波,以获取目标频段的待合成变声信号。5.根据权利要求4所述的方法,其特征在于,在对所述待合成变声的语音信号进行低通滤波之前,所述方法还包括:对所述待合成变声的语音信号的幅值进行归一化处理,以得到归一化的待合成变声。6.根据权利要求3所述的方法,其特征在于,所述根据所述待合成变声中有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板,包括:获取所述待合成变声的时间歌词信息;根据所述待合成变声的时间歌词信息和所述待合成变声中有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板。7.根据权利要求6所述的方法,其特征在于,所述根据所述待合成变声的时间歌词信息和所述待合成变声中有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以生成所述目标歌曲的对唱句群时段模板,包括:将所述待合成变声中有效声音句群的时间戳信息与所述待合成变声的时间歌词信息中的时间戳信息执行对齐操作,以得到校正后的有效声音句群的时间戳信息;根据校正后的有效声音句群的时间戳信息,对所述待合成变声执行对唱时段标记,以
生成所述目标歌曲的对唱句群时段模板。8.根据权利要求1所述的方法,其特征在于,在所述将保留的所述目标对象句群按照预设的能量比与目标歌曲伴奏进行混音之前,所述方法还包括:设置所述目标对象句群的响度小于所述目标歌曲伴奏的响度,且比所述目标歌曲伴奏的响度低预设值。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述待合成变声的时间歌词信息;在所述保留所述待合成变声中的目标对象句群,并将所述待合成变声中的用户句群执行静音处理之后,所述方法还包括:根据所述待合成变声的时间歌词信息、保留的所述目标对象句群和静音处理后的用户句群,对所述待合成变声的时间歌词信息中目标对象句群的时间歌词信息进行标记以生成带有目标对象标记的时间歌词信息。10.根据权利要求9所述的方法,其特征在于,所述根据所述待合成变声的时间歌词信息、保留的所述目标对象句群和静音处理后的用户句群,对所述待合成变声的时间歌词信息中目标对象句群的时间歌词信息进行标记以生成带有目标对象标记的时间歌词信息,包括:根据所述待合成变声的时间歌词新、保留的所述目标对象句群和静音处理后的用户句群,利用note文件或midi文件对所述目标对象句群的歌词在所述待合成变声的时间歌词信息中的时间戳位置进行标记,以生成带有目标对象标记的时间歌词信息。11.根据权利要求1至10中任一项所述的方法,其特征在于,在所述获取待合成变声之前,所述方法还包括:对目标歌曲的原始干声按照目标对象的声调执行变调不变速处理,以得到所述目标歌曲的目标对象变声集合;从所述目标歌曲的目标对象变声集合中筛选出符合预设标准的待合成变声。12.根据权利要求11所述的方法,其特征在于,在对目标歌曲的原始干声按照目标对象的声调执行变调...

【专利技术属性】
技术研发人员:张超鹏张珈伟寇志娟翁志强
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1