演奏时长统计方法及相关产品技术

技术编号：40976711 阅读：23 留言：0更新日期：2024-04-18 21:24

本申请提供一种演奏时长统计方法及相关产品，其中相关产品包括装置、电子设备及计算机可读存储介质。该方法包括：获取示例音频、录制音频和传播时延；根据上述传播时延确定上述示例音频的幅度与上述回声的幅度的幅度衰减值；按照上述幅度衰减值，对上述示例音频的幅度进行衰减，得到上述回声；去除上述录制音频中的上述回声，得到待处理演奏音频；根据上述待处理演奏音频的时长，确定上述演奏声的演奏时长。本申请通过对录制音频中的回声进行消除，得到干净的待处理演奏音频，并对待处理演奏音频进行特征识别，以此获得演奏声的演奏时长。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机音频，尤其涉及一种演奏时长统计方法及相关产品。

技术介绍

1、在进行乐器演奏的同时在终端设备中播放示范、伴奏、节拍器等音视频文件是音乐学习中非常普遍的练习方法，为了自动统计乐器演奏的具体时长我们需要将演奏过程中的声音进行录制，再通过乐器识别的方式统计演奏时长。但是在各种恶劣的录音环境进行录制会存在各种干扰，导致基于信号处理或深度学习的声源分离方法无法使用，造成统计演奏时长的精度低。

技术实现思路

1、本申请提供一种演奏时长统计方法及相关产品，其中相关产品包括装置、电子设备及计算机可读存储介质。

2、第一方面，提供了一种演奏时长统计方法，上述方法用于根据录制音频确定演奏时长，上述录制音频为在目标设备播放示例音频，且按照上述示例音频进行演奏的过程中录制得到的音频，上述方法包括：

3、获取上述示例音频、上述录制音频和传播时延；上述录制音频包括上述目标设备播放上述示例音频的回声和演奏声；上述演奏声是在上述目标设备播放上述示例音频的过程中，按照上述示例音频进行演奏的声音；上述传播时延是上述目标设备播放上述示例音频与上述目标设备接收上述示例音频的回声的时间差；

4、根据上述传播时延确定上述示例音频的幅度与上述回声的幅度的幅度衰减值；上述幅度衰减值与上述传播时延呈正相关；

5、按照上述幅度衰减值，对上述示例音频的幅度进行衰减，得到上述回声；

6、去除上述录制音频中的上述回声，得到待处理演奏音频；

7、根据上述

8、结合本申请任一实施方式，上述传播时延为上述回声在目标路径上传播的时延；上述目标路径为上述回声在上述目标设备所处的空间中的传播路径。

9、结合本申请任一实施方式，上述传播时延为上述回声在上述目标设备所处的空间中传播时间最短的时延。

10、结合本申请任一实施方式，上述根据上述传播时延确定上述示例音频的幅度与上述回声的幅度的幅度衰减值之前，上述方法还包括：

11、根据上述传播时延，将上述示例音频和上述录制音频中的上述回声在时间上进行对齐。

12、结合本申请任一实施方式，上述去除上述录制音频中的上述回声，得到待处理演奏音频，包括：

13、去除上述录制音频中的上述回声，得到第一待处理演奏音频；

14、对上述第一待处理演奏音频进行非线性滤波，得到上述待处理演奏音频。

15、结合本申请任一实施方式，上述对上述第一待处理演奏音频进行非线性滤波，得到上述待处理演奏音频，包括：

16、对上述第一待处理演奏音频进行非线性滤波，得到第二待处理演奏音频；

17、消除上述第二待处理演奏音频中幅度小于阈值的信号，得到上述待处理演奏音频。

18、结合本申请任一实施方式，上述对上述第一待处理演奏音频进行非线性滤波，得到第二待处理演奏音频，包括：

19、根据上述示例音频、上述录制音频和上述第一待处理演奏音频，得到第a帧的掩膜值；上述掩膜值与上述录制音频信号和上述示例音频信号成反比，与上述录制音频跟上述第一待处理演奏音频的相似度呈正比；

20、将上述第一待处理演奏音频中的幅度值乘以上述掩膜值，得到上述第二待处理演奏音频。

21、结合本申请任一实施方式，上述对上述第一待处理演奏音频进行非线性滤波，得到上述待处理演奏音频，包括：

22、根据上述示例音频、上述录制音频和上述第一待处理演奏音频，得到第a帧的掩膜值；上述掩膜值与上述录制音频信号和上述示例音频信号成反比，与上述录制音频跟上述第一待处理演奏音频的相似度呈正比；

23、将上述第一待处理演奏音频中的幅度值乘以上述掩膜值，得到上述待处理演奏音频。

24、本申请实施例中，通过计算第一待处理演奏音频幅度谱上的每个频点对应的掩膜值，并将第一待处理演奏音频幅度谱上的每个频点乘以对应的掩膜值，得到待处理演奏音频。以此来达到抑制非线性回声的目的。

25、结合本申请任一实施方式，上述根据上述待处理演奏音频的时长，确定上述演奏声的演奏时长，包括：

26、将上述待处理演奏音频进行切分，得到m个第三待处理演奏音频；

27、根据上述m个第三待处理演奏音频，得到上述m个第三待处理演奏音频的对数梅尔谱图；

28、根据上述m个对数梅尔谱图，从上述m个第三待处理演奏音频中确定n个待统计演奏音频；上述待统计演奏音频为具有上述演奏声的音频；

29、根据上述n个待统计演奏音频的时长，得到上述演奏时长。

30、本申请实施例中，通过对待处理演奏音频切分成m个第三待处理演奏音频，同一待处理演奏音频切分数量越多精度越高，但计算时间也越久。对m个第三待处理演奏音频进行特征提取，得到对数梅尔谱图，对对数梅尔谱图进行特征识别，得到存在演奏声的第三待处理演奏音频，即待统计演奏音频。根据待统计演奏音频的时长与数量，统计演奏时长。当单个待统计演奏音频的时长越长，演奏时长越长。当待统计演奏音频的数量越多，演奏时长越长。

31、结合本申请任一实施方式，上述根据上述m个第三待处理演奏音频，得到上述m个第三待处理演奏音频的对数梅尔谱图，包括：

32、通过对上述第三待处理演奏音频的幅度谱进行压缩，得到上述对数梅尔谱图。

33、结合本申请任一实施方式，上述根据上述n个待统计演奏音频的时长，得到上述演奏时长，包括：

34、确定上述待统计演奏音频的第一参考时长；

35、根据上述第一参考时长的和，得到上述演奏时长；上述第一参考时长的和与上述演奏时长呈正相关。

36、结合本申请任一实施方式，上述根据上述n个待统计演奏音频的时长，得到上述演奏时长，包括：

37、在上述m个第三待处理演奏音频中，时间戳相邻的两个上述待统计演奏音频之间的非待统计演奏音频的数量不超过阈值的情况下，确定上述时间戳相邻的两个上述待统计演奏音频的第二参考时长；

38、计算上述第二参考时长的和，得到上述演奏时长；上述第二参考时长和与上述演奏时长呈正相关。

39、结合本申请任一实施方式，上述根据上述n个待统计演奏音频的时长，得到上述演奏时长，包括：

40、在上述m个第三待处理演奏音频中，x秒内上述待统计演奏音频数量超过阈值的情况下，确定x秒为第三参考时长；

41、计算上述第三参考时长的和，得到上述演奏时长；上述第三参考时长的和与上述演奏时长呈正相关。

42、第二方面，提供了一种演奏时长统计装置，上述装置包括：

43、获取单元，用于获取上述示例音频、上述录制音频和传播时延；

44、回声计算单元，用于根据上述传播时延确定上述示例音频的幅度与上述回声的幅度的幅度衰减值；

45、衰减单元，用于按照上述幅度衰减值，对上述示例音频的幅度进行衰减本文档来自技高网...

【技术保护点】

1.一种演奏时长统计方法，其特征在于，所述方法用于根据录制音频确定演奏时长，所述录制音频为在目标设备播放示例音频，且按照所述示例音频进行演奏的过程中录制得到的音频，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述传播时延为所述回声在目标路径上传播的时延；所述目标路径为所述回声在所述目标设备所处的空间中的传播路径。

3.根据权利要求2所述的方法，其特征在于，所述传播时延为所述回声在所述目标设备所处的空间中传播时间最短的时延。

4.根据权利要求1-3中任意一项所述的方法，其特征在于，所述根据所述传播时延确定所述示例音频的幅度与所述回声的幅度的幅度衰减值之前，所述方法还包括：

5.根据权利要求1-3中任意一项所述的方法，其特征在于，所述去除所述录制音频中的所述回声，得到待处理演奏音频，包括：

6.根据权利要求5所述的方法，其特征在于，所述对所述第一待处理演奏音频进行非线性滤波，得到所述待处理演奏音频，包括：

7.根据权利要求6所述的方法，其特征在于，所述对所述第一待处理演奏音频进行非线性滤波，得到第二待处理演奏音频，包括：

8.根据权利要求5所述的方法，其特征在于，所述对所述第一待处理演奏音频进行非线性滤波，得到所述待处理演奏音频，包括：

9.根据权利要求1-3中任意一项所述的方法，其特征在于，所述根据所述待处理演奏音频的时长，确定所述演奏声的演奏时长，包括：

10.根据权利要求9所述的方法，其特征在于，所述根据所述M个第三待处理演奏音频，得到所述M个第三待处理演奏音频的对数梅尔谱图，包括：

11.根据权利要求9所述的方法，其特征在于，所述根据所述N个待统计演奏音频的时长，得到所述演奏时长，包括：

12.根据权利要求9所述的方法，其特征在于，所述根据所述N个待统计演奏音频的时长，得到所述演奏时长，包括：

13.根据权利要求9所述的方法，其特征在于，所述根据所述N个待统计演奏音频的时长，得到所述演奏时长，包括：

14.一种演奏时长统计装置，其特征在于，所属装置包括：

15.一种电子设备，其特征在于，包括：处理器和存储器，所述存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令，在所述处理器执行所述计算机指令的情况下，所述电子设备执行如权利要求1至13中任意一项所述的方法。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序包括程序指令，在所述程序指令被处理器执行的情况下，使所述处理器执行权利要求1至13中任意一项所述的方法。

...

【技术特征摘要】

3.根据权利要求2所述的方法，其特征在于，所述传播时延为所述回声在所述目标设备所处的空间中传播时间最短的时延。

5.根据权利要求1-3中任意一项所述的方法，其特征在于，所述去除所述录制音频中的所述回声，得到待处理演奏音频，包括：

6.根据权利要求5所述的方法，其特征在于，所述对所述第一待处理演奏音频进行非线性滤波，得到所述待处理演奏音频，包括：

7.根据权利要求6所述的方法，其特征在于，所述对所述第一待处理演奏音频进行非线性滤波，得到第二待处理演奏音频，包括：

8.根据权利要求5所述的方法，其特征在于，所述对所述第一待处理演奏音频进行非线性滤波，得到所述待处理演奏音频，包括：

【专利技术属性】
技术研发人员：魏新元，易洋，
申请(专利权)人：深圳市芒果未来科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人