本申请提供了一种录音的修音方法及相关装置,其中,该方法包括:对混音信号中的用户干声信号进行音量均衡,获得音量均衡后的用户干声信号;对歌曲的原唱干声信号以及音量均衡后的用户干声信号进行对齐处理,获得对齐信息,该对齐信息中包括用户干声信号的每个信号帧与原唱干声信号的每个信号帧之间的对应关系;根据对齐信息,对用户干声信号进行修音,获得修音后的用户干声信号。本申请实施例能够提升修音后的音准和音质效果。修音后的音准和音质效果。修音后的音准和音质效果。
【技术实现步骤摘要】
录音的修音方法及相关装置
[0001]本申请涉及计算机
,尤其涉及一种录音的修音方法及相关装置。
技术介绍
[0002]随着信息技术的快速发展,音乐娱乐已经成为计算机或手机等终端中的一项必备应用,在手机上唱歌也变得越来越流行。但是,由于不同年龄段和不同教育背景的人对乐感和旋律的感知能力参差不齐,跑调或是节奏跟不上的情况时有发生,因此,“一键修音”是应用程序中的一项音频处理功能。目前的修音技术方法中,为了避免采集到的干声混有伴奏杂音,需要用户戴耳机录制歌曲,之后再对录制得到的干声进行修音,否则无法使用修音功能。其中,干声是指不包含伴奏的纯净歌声。然而,大部分非入耳式耳机都存在漏音的情况,即使戴耳机录制得到的干声也会有伴奏杂音,从而会降低修音后的音准和音质效果。
技术实现思路
[0003]针对上述技术问题,本申请提供一种录音的修音方法及相关装置,可能够提升修音后的音准和音质效果。
[0004]一方面,本申请实施例提供了一种录音的修音方法,所述方法包括:
[0005]对混音信号中的用户干声信号进行音量均衡,获得音量均衡后的用户干声信号;
[0006]对歌曲的原唱干声信号以及音量均衡后的用户干声信号进行对齐处理,获得对齐信息,所述对齐信息中包括所述用户干声信号的每个信号帧与所述原唱干声信号的每个信号帧之间的对应关系;
[0007]根据所述对齐信息,对所述用户干声信号进行修音,获得修音后的用户干声信号。
[0008]可选地,所述对混音信号中的用户干声信号进行音量均衡,获得音量均衡后的用户干声信号之前,所述方法还包括:
[0009]对混音信号进行音量均衡,获得音量均衡后的混音信号;
[0010]对所述音量均衡后的混音信号进行歌声分离,获得所述混音信号中的用户干声信号。
[0011]可选地,所述对所述音量均衡后的混音信号进行歌声分离,获得所述混音信号中的用户干声信号,包括:
[0012]将所述音量均衡后的混音信号输入到神经网络,获得所述混音信号中的用户干声信号;
[0013]所述神经网络中卷积核大小和通道数是通过歌声分离训练样本进行训练获得的。
[0014]可选地,所述根据所述对齐信息,对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号,包括:
[0015]根据所述对齐信息和所述歌曲的时间戳信息,确定所述音量均衡后的用户干声信号的时间戳信息;
[0016]根据所述音量均衡后的用户干声信号的时间戳信息和基频,确定所述音量均衡后
的用户干声信号中每个字的基频;
[0017]根据所述音量均衡后的用户干声信号中每个字的基频,对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号。
[0018]可选地,所述根据所述音量均衡后的用户干声信号的时间戳信息和基频,确定所述音量均衡后的用户干声信号中每个字的基频之前,所述方法还包括:
[0019]对所述音量均衡后的用户干声信号进行基频提取,获得所述音量均衡后的用户干声信号的基频。
[0020]可选地,所述根据所述音量均衡后的用户干声信号中每个字的基频,对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号,包括:
[0021]根据所述音量均衡后的用户干声信号中每个字的基频和所述歌曲的参考曲谱中每个字的音高,确定所述音量均衡后的用户干声信号中每个字的修音幅度;
[0022]利用所述音量均衡后的用户干声信号中每个字的修音幅度对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号。
[0023]可选地,在所述音量均衡后的用户干声信号中存在任一字的修音幅度大于预设阈值时,执行利用所述音量均衡后的用户干声信号中每个字的修音幅度对所述用户干声信号进行修音。
[0024]可选地,所述利用所述音量均衡后的用户干声信号中每个字的修音幅度对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号,包括:
[0025]根据所述音量均衡后的用户干声信号中每个字的修音幅度,确定对每个字的修音程度;
[0026]基于所述每个字的修音程度和修音幅度,对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号。
[0027]可选地,所述利用所述音量均衡后的用户干声信号中每个字的修音幅度对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号,包括:
[0028]确定音量均衡后的用户干声信号中修音幅度大于预设阈值的目标字,利用所述目标字的修音幅度对所述目标字进行修音,获得修音后的用户干声信号。
[0029]一方面,本申请实施例提供了一种录音的修音装置,所述装置包括:
[0030]音质增强模块,用于终端对混音信号中的用户干声信号进行音量均衡,获得音量均衡后的用户干声信号;
[0031]歌声对齐模块,用于所述终端对所述歌曲的原唱干声信号以及音量均衡后的用户干声信号进行对齐处理,获得对齐信息,所述对齐信息中包括所述用户干声信号的每个信号帧与所述原唱干声信号的每个信号帧之间的对应关系;
[0032]修音模块,用于所述终端根据所述对齐信息,对所述用户干声信号进行修音,获得修音后的用户干声信号。
[0033]一方面,本申请实施例提供了一种终端,包括:处理器、通信接口和存储器,所述处理器、所述通信接口和所述存储器相互连接,其中,所述存储器存储有可执行程序代码,所述处理器用于调用所述可执行程序代码,执行本申请实施例提供的方法。
[0034]相应地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时
实现本申请实施例提供的方法。
[0035]相应地,本申请实施例还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。终端的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述终端执行本申请实施例提供的方法。
[0036]本申请实施例中,终端对混音信号中的用户干声信号进行音量均衡,获得音量均衡后的用户干声信号;对歌曲的原唱干声信号以及音量均衡后的用户干声信号进行对齐处理,获得对齐信息;根据对齐信息,对用户干声信号进行修音,获得修音后的用户干声信号。可见,本申请实施例通过对用户干声信号进行音量均衡后再进行修音,从而提升了能够提升修音后的音准和音质效果。
附图说明
[0037]为了更清楚地说明本申请实施例或现有技术中的技术方法,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1是本申请实施例示出的一种语音频谱示意图;
[0039]图2是本申本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种录音的修音方法,其特征在于,所述方法包括:对混音信号中的用户干声信号进行音量均衡,获得音量均衡后的用户干声信号,对歌曲的原唱干声信号以及音量均衡后的用户干声信号进行对齐处理,获得对齐信息,所述对齐信息中包括所述音量均衡后用户干声信号的每个信号帧与所述原唱干声信号的每个信号帧之间的对应关系;根据所述对齐信息,对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号。2.根据权利要求1所述的方法,其特征在于,所述对混音信号中的用户干声信号进行音量均衡,获得音量均衡后的用户干声信号之前,所述方法还包括:对混音信号进行音量均衡,获得音量均衡后的混音信号;对所述音量均衡后的混音信号进行歌声分离,获得所述混音信号中的用户干声信号。3.根据权利要求2所述的方法,其特征在于,所述对所述音量均衡后的混音信号进行歌声分离,获得所述混音信号中的用户干声信号,包括:将所述音量均衡后的混音信号输入到神经网络,获得所述混音信号中的用户干声信号;所述神经网络中卷积核大小和通道数是通过歌声分离训练样本进行训练获得的。4.根据权利要求1所述的方法,其特征在于,所述根据所述对齐信息,对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号,包括:根据所述对齐信息和所述歌曲的时间戳信息,确定所述音量均衡后的用户干声信号的时间戳信息;根据所述音量均衡后的用户干声信号的时间戳信息和基频,确定所述音量均衡后的用户干声信号中每个字的基频;根据所述音量均衡后的用户干声信号中每个字的基频,对所述音量均衡后的用户干声信号进行修音,获得修音后的用户干声信号。5.根据权利要求4所述的方法,其特征在于,所述根据所述音量均衡后的用户干声信号的时间戳信息和基频,确定所述音量均衡后的用户干声信号中每个字的基频之前,所述方法还包括:对所述音量均衡后的用户干声信号进行基频提取,获得所述音量均衡后的用户干声信号的基频。6.根据权利要求4所述的方法,其特征在于,所述根据所述音量均衡后的用户干声信号...
【专利技术属性】
技术研发人员:庄晓滨,
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。