基于音频分离的原伴唱音频识别方法及存储介质技术

技术编号：41098266 阅读：24 留言：0更新日期：2024-04-25 13:55

本发明专利技术公开了一种基于音频分离的原伴唱音频识别方法及存储介质，方法包括：获取待识别多媒体文件，并提取所述待识别多媒体文件中的第一音频和第二音频；分别提取各音频中的人声成分，得到各音频对应的人声成分音频；分别计算所述第一音频和第二音频对应的人声成分音频的能量值；根据所述第一音频和第二音频对应的人声成分音频的能量值，确定原唱音频和伴唱音频。本发明专利技术可提高原伴唱音频的识别效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频处理，尤其涉及一种基于音频分离的原伴唱音频识别方法及存储介质。

技术介绍

1、mv视频中的音频一般有两路，分别是原唱音频和伴唱音频，但两路音频的顺序不确定。为了在演唱时可以选择到正确的原唱音频或伴唱音频，需要事先进行识别并标记音频顺序。

2、传统的手段是由人工分别听两路音频中内容，然后判断各音频的原伴唱类型，并记录，但该过程耗时久，且耗费人力。

技术实现思路

1、本专利技术所要解决的技术问题是：提供一种基于音频分离的原伴唱音频识别方法及存储介质，可提高原伴唱音频的识别效率。

2、为了解决上述技术问题，本专利技术采用的技术方案为：一种基于音频分离的原伴唱音频识别方法，包括：

3、获取待识别多媒体文件，并提取所述待识别多媒体文件中的第一音频和第二音频；

4、分别提取各音频中的人声成分，得到各音频对应的人声成分音频；

5、分别计算所述第一音频和第二音频对应的人声成分音频的能量值；

6、根据所述第一音频和第二音频对应的人声成分音频的能量值，确定原唱音频和伴唱音频。

7、本专利技术还提出一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如上所述的方法。

8、本专利技术的有益效果在于：通过分别对第一音频和第二音频提取人声成分，并分别计算人声成分能量值，利用原唱音频的人声成分比伴唱音频的人声成分多的特点，将人声成分能量值较大的音频记为原唱音频，将人声成分能量值较

本文档来自技高网...

【技术保护点】

1.一种基于音频分离的原伴唱音频识别方法，其特征在于，包括：

2.根据权利要求1所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述分别提取各音频中的人声成分，得到各音频对应的人声成分音频具体为：

3.根据权利要求2所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述根据所述伴奏成分音频的预测幅度谱和人声成分音频的预测幅度谱以及所述一音频的频谱，计算得到所述人声成分音频的预测频谱具体为：

4.根据权利要求2所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述训练得到第一神经网络模型和第二神经网络模型具体为：

5.根据权利要求4所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述根据所述第一神经网络模型和第二神经网络模型的预测值和标准值，计算损失值具体为：

6.根据权利要求1所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述分别计算所述第一音频和第二音频对应的人声成分音频的能量值具体为：

7.根据权利要求1所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述根据所述第一音频和第二音频对

8.根据权利要求1所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述根据所述第一音频和第二音频对应的人声成分音频的能量值，确定原唱音频和伴唱音频具体为：

9.根据权利要求8所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述第一阈值为2，第二阈值为0.5。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-9任一项所述的方法。

...

【技术特征摘要】

1.一种基于音频分离的原伴唱音频识别方法，其特征在于，包括：

4.根据权利要求2所述的基于音频分离的原伴唱音频识别方法，其特征在于，所述训练得到第一神经网络模型和第二神经网络模型具体为：

...

【专利技术属性】
技术研发人员：陈勇，王子亮，马雪怀，
申请(专利权)人：福建星网视易信息系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人