【技术实现步骤摘要】
音频处理方法、装置、存储介质及电子设备
本申请属于音频
,尤其涉及一种音频处理方法、装置、存储介质及电子设备。
技术介绍
目前,用户可以利用诸如智能手机等终端设备提供的伴奏音频来录制自己演唱的歌曲。但是,如果该伴奏音频与完整的歌曲音频在时间上存在偏移,那么用户利用该伴奏音频录制的歌曲相对于完整的歌曲音频也将出现时间偏移,即如果同时播放用户录制的歌曲和完整歌曲的话,这二者在步调上会出现不同步的问题。相关技术中,无法准确地对完整歌曲和其相应的伴奏音频存在的时间偏移进行检测。
技术实现思路
本申请实施例提供一种音频处理方法、装置、存储介质及电子设备,可以有效检测出完整的歌曲音频和相应的伴奏音频存在的时间偏移值。本申请实施例提供一种音频处理方法,包括:获取歌曲音频以及所述歌曲音频对应的伴奏音频;若所述歌曲音频和所述伴奏音频的采样率不一致,则对所述歌曲音频和所述伴奏音频的采样率进行预设处理,以使所述歌曲音频和所述伴奏音频的采样率一致;对采样率一致的所述歌曲音频和所述伴奏音频进行音频特征检测,得到音频特征检测结果,所述音频特征检测包括播放时长差检测、音频帧功率差检测、端点静音时长差检测、鼓点同步数量检测中的至少一种;提取所述歌曲音频的第一音频指纹信息以及所述伴奏音频的第二音频指纹信息,并对所述第一音频指纹信息和所述第二音频指纹信息进行匹配,得到音频指纹信息匹配结果;根据所述音频特征检测结果和所述音频指纹信息匹配结果,输出所述歌曲音频和所述伴奏音频的时间偏移 ...
【技术保护点】
1.一种音频处理方法,其特征在于,包括:/n获取歌曲音频以及所述歌曲音频对应的伴奏音频;/n若所述歌曲音频和所述伴奏音频的采样率不一致,则对所述歌曲音频和所述伴奏音频的采样率进行预设处理,以使所述歌曲音频和所述伴奏音频的采样率一致;/n对采样率一致的所述歌曲音频和所述伴奏音频进行音频特征检测,得到音频特征检测结果,所述音频特征检测包括播放时长差检测、音频帧功率差检测、端点静音时长差检测、鼓点同步数量检测中的至少一种;/n提取所述歌曲音频的第一音频指纹信息以及所述伴奏音频的第二音频指纹信息,并对所述第一音频指纹信息和所述第二音频指纹信息进行匹配,得到音频指纹信息匹配结果;/n根据所述音频特征检测结果和所述音频指纹信息匹配结果,输出所述歌曲音频和所述伴奏音频的时间偏移值。/n
【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:
获取歌曲音频以及所述歌曲音频对应的伴奏音频;
若所述歌曲音频和所述伴奏音频的采样率不一致,则对所述歌曲音频和所述伴奏音频的采样率进行预设处理,以使所述歌曲音频和所述伴奏音频的采样率一致;
对采样率一致的所述歌曲音频和所述伴奏音频进行音频特征检测,得到音频特征检测结果,所述音频特征检测包括播放时长差检测、音频帧功率差检测、端点静音时长差检测、鼓点同步数量检测中的至少一种;
提取所述歌曲音频的第一音频指纹信息以及所述伴奏音频的第二音频指纹信息,并对所述第一音频指纹信息和所述第二音频指纹信息进行匹配,得到音频指纹信息匹配结果;
根据所述音频特征检测结果和所述音频指纹信息匹配结果,输出所述歌曲音频和所述伴奏音频的时间偏移值。
2.根据权利要求1所述的音频处理方法,其特征在于,提取所述歌曲音频的第一音频指纹信息以及所述伴奏音频的第二音频指纹信息,包括:
将所述歌曲音频划分为多个歌曲音频帧,得到歌曲音频帧序列;
获取所述歌曲音频帧序列中的每一歌曲音频帧的音频指纹信息,得到对应的歌曲音频指纹信息序列,并将所述歌曲音频指纹信息序列确定为第一音频指纹信息;
将所述伴奏音频划分为多个伴奏音频帧,得到伴奏音频帧序列;
获取所述伴奏音频帧序列中的每一伴奏音频帧的音频指纹信息,得到对应的伴奏音频指纹信息序列,并将所述伴奏音频指纹信息序列确定为第二音频指纹信息。
3.根据权利要求2所述的音频处理方法,其特征在于,获取所述歌曲音频帧序列中的每一歌曲音频帧的音频指纹信息,得到对应的歌曲音频指纹信息序列,包括:获取所述歌曲音频帧序列中的每一歌曲音频帧的音频指纹,并获取每一歌曲音频帧的音频指纹所对应的哈希值,将每一歌曲音频帧对应的哈希值确定为每一歌曲音频帧的音频指纹信息,得到对应的第一哈希值序列,将所述第一哈希值序列确定为对应的歌曲音频指纹信息序列;
获取所述伴奏音频帧序列中的每一伴奏音频帧的音频指纹信息,得到对应的伴奏音频指纹信息序列,包括:获取所述伴奏音频帧序列中的每一伴奏音频帧的音频指纹,并获取每一伴奏音频帧的音频指纹所对应的哈希值,将每一伴奏音频帧对应的哈希值确定为每一伴奏音频帧的音频指纹信息,得到对应的第二哈希值序列,将所述第二哈希值序列确定为对应的伴奏音频指纹信息序列;
对所述第一音频指纹信息和所述第二音频指纹信息进行匹配,得到音频指纹信息匹配结果,包括:对所述第一哈希值序列和所述第二哈希值序列进行匹配,得到对应的匹配结果,并将所述对应的匹配结果确定为音频指纹信息匹配结果。
4.根据权利要求2或3所述的音频处理方法,其特征在于,所述将所述歌曲音频划分为多个歌曲音频帧,得到歌曲音频帧序列,包括:将所述歌曲音频进行降采样,将降采样后的歌曲音频划分为多个歌曲音频帧,得到歌曲音频帧序列;
所述将所述伴奏音频划分为多个伴奏音频帧,得到伴奏音频帧序列,包括:将所述伴奏音频进行降采样,将降采样后的伴奏音频划分为多个伴奏音频帧,得到伴奏音频帧序列;
其中,所述降采样后的歌曲音频和所述降采样后的伴奏音频的采样率一致。
5.根据权利要求4所述的音频处理方法,其特征在于,所述歌曲音频帧序列中顺序相邻的前后两帧具有第一重叠率,并且所述伴奏音频帧序列中顺序相邻的前后两帧具有所述第一重叠率。
6.根据权利要求3所述的音频处理方法,其特征在于,对所述第一哈希值序列和所述第二哈希值序列进行匹配,得到对应的匹配结果,并将所述对应的匹配结果确定为音频指纹信息匹配结果,包括:
获取多个偏移值,每一所述偏移值为整数;
按照每一所述偏移值,将所述第一哈希值序列和所述第二哈希值序列中的哈希值进行匹配,其中,进行匹配的每两个哈希值的位次相差所...
【专利技术属性】
技术研发人员:徐东,
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。