System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 经由音频分类进行动态音量调节的方法和装置制造方法及图纸_技高网

经由音频分类进行动态音量调节的方法和装置制造方法及图纸

技术编号:43701161 阅读:7 留言:0更新日期:2024-12-18 21:15
公开了经由音频分类进行动态音量调节的方法和装置。示例方法包括:利用经神经网络训练的模型对与第一音量水平相关联的音频信号的参数进行分析,以确定与音频信号相关联的分类组;确定音频信号的输入音量,所述选择基于与音频信号相关联的分类组;向音频信号施加增益值,所述增益值基于分类组和输入音量,所述增益值将第一音量水平修改成第二音量水平;以及向音频信号施加压缩值,所述压缩值将第二音量水平修改成满足目标音量阈值的第三音量水平。

【技术实现步骤摘要】

本公开总体上涉及音量调节,并且更具体地,涉及经由音频分类进行动态音量调节的方法和装置


技术介绍

1、近年来,使用越来越多的渠道传送了大量具有时变特性的媒体。可以使用更传统的渠道(例如,无线电)或者使用最新开发的渠道(诸如使用因特网连接的流传输设备)来接收。随着这些渠道的开发,也已经开发了能够对来自多个源的音频进行处理和输出的系统。例如,一些汽车媒体系统能够从光盘(cd)、蓝牙连接设备、通用串行总线(usb)连接设备、wi-fi连接设备、辅助输入端和其它源传送媒体。


技术实现思路

1、在一个方面中,公开了一种装置。所述装置包括:音频信号分类器,所述音频信号分类器利用神经网络对与第一音量水平相关联的音频信号的参数进行分析,以确定与所述音频信号相关联的分类组;输入音量检测器,所述输入音量检测器确定所述音频信号的输入音量;音量调节器,所述音量调节器向所述音频信号施加增益值,所述增益值基于所述分类组和所述输入音量,所述增益值将所述第一音量水平修改成第二音量水平;以及动态范围压缩器,所述动态范围压缩器向所述音频信号施加压缩值,所述压缩值将所述第二音量水平修改成满足目标音量阈值的第三音量水平。

2、在另一方面中,公开了一种装置。所述装置包括:用于进行分析的单元,所述用于进行分析的单元利用神经网络对与第一音量水平相关联的音频信号的参数进行分析,以确定与所述音频信号相关联的分类组;用于进行确定的单元,所述用于进行确定的单元确定所述音频信号的输入音量;用于进行施加的第一单元,所述用于进行施加的第一单元向所述音频信号施加增益值,所述增益值基于所述分类组和所述输入音量,所述增益值将所述第一音量水平修改成第二音量水平;以及用于进行施加的第二单元,所述用于进行施加的第二单元向所述音频信号施加压缩值,所述压缩值将所述第二音量水平修改成满足目标音量阈值的第三音量水平。

3、在又一方面中,公开了一种方法。所述方法包括以下步骤:利用神经网络对与第一音量水平相关联的音频信号的参数进行分析,以确定与所述音频信号相关联的分类组;确定所述音频信号的输入音量;向所述音频信号施加增益值,所述增益值基于所述分类组和所述输入音量,所述增益值将所述第一音量水平修改成第二音量水平;以及向所述音频信号施加压缩值,所述压缩值将所述第二音量水平修改成满足目标音量阈值的第三音量水平。

本文档来自技高网...

【技术保护点】

1.一种非暂时性机器可读介质,所述非暂时性机器可读介质上存储有指令,所述指令在被执行时使一个或更多个处理器执行一组操作,所述操作包括:

2.根据权利要求1所述的非暂时性机器可读介质,其中,所述目标增益值是通过向所述输入音量施加第一权重并且向所述分类增益值施加第二权重来确定的。

3.根据权利要求1所述的非暂时性机器可读介质,其中,所述一组操作还包括向所述输入音频信号施加所述中间值,其中,所述中间值将所述输入音量水平修改为第二音量水平。

4.根据权利要求3所述的非暂时性机器可读介质,其中,所述一组操作还包括向所述输入音频信号施加压缩值,其中,所述压缩值将所述第二音量水平修改为满足目标音量阈值的第三音量水平。

5.根据权利要求1所述的非暂时性机器可读介质,其中,所述一组操作还包括确定所述输入音频信号的源是否已改变。

6.根据权利要求5所述的非暂时性机器可读介质,其中,确定所述输入音频信号的源是否已改变是基于以下至少一项:(1)所述输入音频信号所关联的当前压缩器增益与所述输入音频信号所关联的先前压缩器增益的比较,(2)所述输入音频信号所关联的RMS功率与所述输入音频信号所关联的先前RMS功率的比较,以及(3)所述输入音频信号所关联的当前音频样本值与所述输入音频信号所关联的先前音频样本值的比较。

7.根据权利要求5所述的非暂时性机器可读介质,其中,所述一组操作还包括,响应于确定所述输入音频信号的源已改变而重置所述输入音频信号的所述中间值。

8.根据权利要求1所述的非暂时性机器可读介质,其中,所述分类组包括以下至少一项:(1)由所述输入音频信号表示的音乐的流派,(2)由所述输入音频信号表示的音乐的时间段,以及(3)由所述输入音频信号表示的音乐中存在的乐器。

9.一种方法,所述方法包括以下步骤:

10.根据权利要求9所述的方法,其中,所述目标增益值是通过向所述输入音量施加第一权重并且向所述分类增益值施加第二权重来确定的。

11.根据权利要求9所述的方法,其中,所述方法还包括向所述输入音频信号施加所述中间值,其中,所述中间值将所述输入音量水平修改为第二音量水平。

12.根据权利要求11所述的方法,其中,所述方法还包括向所述输入音频信号施加压缩值,其中,所述压缩值将所述第二音量水平修改为满足目标音量阈值的第三音量水平。

13.根据权利要求9所述的方法,其中,所述方法还包括确定所述输入音频信号的源是否已改变。

14.根据权利要求13所述的方法,其中,确定所述输入音频信号的源是否已改变是基于以下至少一项:(1)所述输入音频信号所关联的当前压缩器增益与所述输入音频信号所关联的先前压缩器增益的比较,(2)所述输入音频信号所关联的RMS功率与所述输入音频信号所关联的先前RMS功率的比较,以及(3)所述输入音频信号所关联的当前音频样本值与所述输入音频信号所关联的先前音频样本值的比较。

15.根据权利要求13所述的方法,其中,所述方法还包括,响应于确定所述输入音频信号的源已改变而重置所述输入音频信号的所述中间值。

16.根据权利要求9所述的方法,其中,所述分类组包括以下至少一项:(1)由所述输入音频信号表示的音乐的流派,(2)由所述输入音频信号表示的音乐的时间段,以及(3)由所述输入音频信号表示的音乐中存在的乐器。

17.一种计算设备,所述计算设备包括:

18.根据权利要求17所述的计算设备,其中,所述目标增益值是通过向所述输入音量施加第一权重并且向所述分类增益值施加第二权重来确定的。

19.根据权利要求17所述的计算设备,其中,所述一组操作还包括向所述输入音频信号施加所述中间值,其中,所述中间值将所述输入音量水平修改为第二音量水平。

20.根据权利要求19所述的计算设备,其中,所述一组操作还包括向所述输入音频信号施加压缩值,其中,所述压缩值将所述第二音量水平修改为满足目标音量阈值的第三音量水平。

...

【技术特征摘要】

1.一种非暂时性机器可读介质,所述非暂时性机器可读介质上存储有指令,所述指令在被执行时使一个或更多个处理器执行一组操作,所述操作包括:

2.根据权利要求1所述的非暂时性机器可读介质,其中,所述目标增益值是通过向所述输入音量施加第一权重并且向所述分类增益值施加第二权重来确定的。

3.根据权利要求1所述的非暂时性机器可读介质,其中,所述一组操作还包括向所述输入音频信号施加所述中间值,其中,所述中间值将所述输入音量水平修改为第二音量水平。

4.根据权利要求3所述的非暂时性机器可读介质,其中,所述一组操作还包括向所述输入音频信号施加压缩值,其中,所述压缩值将所述第二音量水平修改为满足目标音量阈值的第三音量水平。

5.根据权利要求1所述的非暂时性机器可读介质,其中,所述一组操作还包括确定所述输入音频信号的源是否已改变。

6.根据权利要求5所述的非暂时性机器可读介质,其中,确定所述输入音频信号的源是否已改变是基于以下至少一项:(1)所述输入音频信号所关联的当前压缩器增益与所述输入音频信号所关联的先前压缩器增益的比较,(2)所述输入音频信号所关联的rms功率与所述输入音频信号所关联的先前rms功率的比较,以及(3)所述输入音频信号所关联的当前音频样本值与所述输入音频信号所关联的先前音频样本值的比较。

7.根据权利要求5所述的非暂时性机器可读介质,其中,所述一组操作还包括,响应于确定所述输入音频信号的源已改变而重置所述输入音频信号的所述中间值。

8.根据权利要求1所述的非暂时性机器可读介质,其中,所述分类组包括以下至少一项:(1)由所述输入音频信号表示的音乐的流派,(2)由所述输入音频信号表示的音乐的时间段,以及(3)由所述输入音频信号表示的音乐中存在的乐器。

9.一种方法,所述方法包括以下步骤:

10.根据权利要求9所述的方法,其中,所述目标增益值是通过向所述输入音量施加第一权重并且向所述分类增益值施加第...

【专利技术属性】
技术研发人员:M·克里默R·库弗S·D·舍夫C·A·萨默斯
申请(专利权)人:格雷斯诺特有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1