音频处理方法、装置、设备及存储介质制造方法及图纸

技术编号：41481511 阅读：14 留言：0更新日期：2024-05-30 14:31

本申请提供一种音频处理方法、装置、设备及存储介质。该方法将待处理行人警示音音频输入训练好的目标模型，得到目标模型输出的预设车速范围内部分车速下行人警示音音频标定后的增益值，其中，上述目标模型基于多个行人警示音音频和上述部分车速下相应音频标定后的增益值训练得到，从而，利用模型标定的思想，提供了一种对音频进行处理的方式，快速获得预设车速范围内部分车速下行人警示音音频标定后的增益值，进而对音频进行标定，满足用户的多样化需求，而且无需汽车厂商或专业音响工程师进行标定，简化标定过程，提高了音频标定的车速，使得用户能够简单便捷地进行行人警示音更新。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，尤其涉及一种音频处理方法、装置、设备及存储介质。

技术介绍

1、随着人们出行需求的不断提高，汽车已经成为大部分人首选的出门交通工具。对于一些汽车，如新能源汽车，在行驶过程中的噪声较低，在低速状态下，如行驶速度在30km/h以内，行人、非机动车和其他道路使用者难以感知到这些车辆的靠近，存在安全隐患。为此许多地区都制定了相关法规，要求这类汽车安装行人警示音系统来解决这一问题。

2、相关技术中，为了确保行人警示音的音频满足法规和声音质量要求，需要进行音频标定。但是音频标定中很多需要汽车制造商或专业音响工程师来执行，如需要汽车制造商或专业音响工程师来得到30km/h以内车速下行人警示音音频标定后的增益值，这限制了用户可以使用的音频，使得用户无法选择自己喜欢的行人警示音。而且只有汽车厂商或专业音响工程师后续开发了其他可替换音频，用户才能对行人警示音进行更新，过程繁琐。

技术实现思路

1、本申请实施例提供了一种音频处理方法、装置、设备及存储介质，以得到预设车速范围内部分车速下行人警示音音频标定后的增益值，对行人警示音音频进行标定。

2、第一方面，本申请实施例提供了一种音频处理方法，包括：

3、获取待处理行人警示音音频；

4、将所述待处理行人警示音音频输入目标模型，得到所述目标模型输出的预设车速范围内部分车速下行人警示音音频标定后的增益值；其中，所述目标模型基于多个行人警示音音频和所述部分车速下相应音频标定后的增益值训练得到。p>

5、在一种可能的实现方式中，在将所述待处理行人警示音音频输入目标模型，得到所述目标模型输出的预设车速范围内部分车速下行人警示音音频标定后的增益值之后，还包括：

6、基于所述部分车速下所述行人警示音音频标定后的增益值，以及预存的所述预设车速范围内各个车速与音频标定后的增益值之间的关系式，确定所述预设车速范围内各个车速下所述行人警示音音频标定后的增益值；

7、根据所述各个车速下所述行人警示音音频标定后的增益值，获得所述各个车速下标定后的行人警示音音频。

8、在一种可能的实现方式中，所述关系式中包括待求解参数；

9、所述基于所述部分车速下所述行人警示音音频标定后的增益值，以及预存的所述预设车速范围内各个车速与音频标定后的增益值之间的关系式，确定所述预设车速范围内各个车速下所述行人警示音音频标定后的增益值，包括：

10、根据所述部分车速下所述行人警示音音频标定后的增益值，获得所述关系式中待求解参数的值；

11、基于所述待求解参数的值和所述关系式，确定所述各个车速下所述行人警示音音频标定后的增益值。

12、在一种可能的实现方式中，所述根据所述各个车速下所述行人警示音音频标定后的增益值，获得所述各个车速下标定后的行人警示音音频，包括：

13、利用所述各个车速下所述行人警示音音频标定后的增益值和行人警示音算法，对所述待处理行人警示音音频进行调整，获得所述各个车速下标定后的行人警示音音频；

14、其中，所述行人警示音算法基于音频的增益值改变音频的频率与声压级。

15、在一种可能的实现方式中，所述目标模型的训练过程，包括：

16、分别将所述多个行人警示音音频输入目标模型，得到所述部分车速下每一行人警示音音频标定后的增益预测值；

17、根据所述部分车速下每一行人警示音音频标定后的增益预测值、相应车速下每一行人警示音音频标定后的增益值和损失函数，调整所述目标模型，获得训练好的所述目标模型。

18、在一种可能的实现方式中，所述目标模型包括预处理单元，以及卷积神经网络与循环神经网络混合单元。

19、所述分别将所述多个行人警示音音频输入目标模型，得到所述部分车速下每一行人警示音音频标定后的增益预测值，包括：

20、在所述预处理单元，获得每一行人警示音音频的时间、频率和声压级信息；

21、在所述卷积神经网络与循环神经网络混合单元，基于每一行人警示音音频的时间、频率和声压级信息，确定所述部分车速下每一行人警示音音频标定后的增益预测值。

22、在一种可能的实现方式中，所述根据所述部分车速下每一行人警示音音频标定后的增益预测值、相应车速下每一行人警示音音频标定后的增益值和损失函数，调整所述目标模型，获得训练好的所述目标模型，包括：

23、基于所述部分车速下每一行人警示音音频标定后的增益预测值和相应车速下每一行人警示音音频标定后的增益值之间的差异，确定所述损失函数的值；

24、判断所述损失函数的值是否大于预设阈值；

25、若所述损失函数的值大于所述预设阈值，则调整所述目标模型，并基于调整后的目标模型，重新执行所述分别将所述多个行人警示音音频输入目标模型，得到所述部分车速下每一行人警示音音频标定后的增益预测值的步骤，直至所述损失函数的值小于或等于所述预设阈值，获得训练好的所述目标模型。

26、在一种可能的实现方式中，所述目标模型基于所述多个行人警示音音频，以及所述多个行人警示音音频对应地区的所述部分车速下相应音频标定后的增益值训练得到。

27、在一种可能的实现方式中，所述目标模型包括不同地区的目标模型，其中，每个目标模型添加对应地区的地区标识；

28、所述将所述待处理行人警示音音频输入目标模型，得到所述目标模型输出的预设车速范围内部分车速下行人警示音音频标定后的增益值，包括：

29、确定所述待处理行人警示音音频对应的地区标识；

30、基于每个目标模型对应的地区标识，以及所述待处理行人警示音音频对应的地区标识，从所述不同地区的目标模型中获得对所述待处理行人警示音音频进行处理的目标模型；

31、将所述待处理行人警示音音频输入获得的目标模型，得到目标模型输出的所述预设车速范围内部分车速下行人警示音音频标定后的增益值。

32、在一种可能的实现方式中，在所述预处理单元，获得每一行人警示音音频的时间、频率和声压级信息，包括：

33、在所述预处理单元，通过短时傅里叶变换和声学参数的转换，获得每一行人警示音音频的时间、频率和声压级信息。

34、第二方面，本申请实施例提供了一种音频处理装置，包括：

35、获取模块，用于获取待处理行人警示音音频；

36、处理模块，用于将所述待处理行人警示音音频输入目标模型，得到所述目标模型输出的预设车速范围内部分车速下行人警示音音频标定后的增益值；其中，所述目标模型基于多个行人警示音音频和所述部分车速下相应音频标定后的增益值训练得到。

37、第三方面，本申请实施例提供了一种电子设备，包括存储器和处理器，存储器中存储有可在处理器上运行的计算机程序，处理器执行计算机程序时实现如第一方面任一项所述的音频处理方法。

38、第四方面，本申请实施例提供了一种计算机可读存储本文档来自技高网...

【技术保护点】

1.一种音频处理方法，其特征在于，包括：

2.根据权利要求1所述的音频处理方法，其特征在于，在将所述待处理行人警示音音频输入目标模型，得到所述目标模型输出的预设车速范围内部分车速下行人警示音音频标定后的增益值之后，还包括：

3.根据权利要求2所述的音频处理方法，其特征在于，所述关系式中包括待求解参数；

4.根据权利要求2所述的音频处理方法，其特征在于，所述根据所述各个车速下所述行人警示音音频标定后的增益值，获得所述各个车速下标定后的行人警示音音频，包括：

5.根据权利要求1至4中任一项所述的音频处理方法，其特征在于，所述目标模型的训练过程，包括：

6.根据权利要求5所述的音频处理方法，其特征在于，所述目标模型包括预处理单元，以及卷积神经网络与循环神经网络混合单元；

7.根据权利要求5所述的音频处理方法，其特征在于，所述根据所述部分车速下每一行人警示音音频标定后的增益预测值、相应车速下每一行人警示音音频标定后的增益值和损失函数，调整所述目标模型，获得训练好的所述目标模型，包括：

8.根据权利要求1至

9.根据权利要求8所述的音频处理方法，其特征在于，所述目标模型包括不同地区的目标模型，其中，每个目标模型添加对应地区的地区标识；

10.根据权利要求6所述的音频处理方法，其特征在于，在所述预处理单元，获得每一行人警示音音频的时间、频率和声压级信息，包括：

11.一种音频处理装置，其特征在于，包括：

12.一种电子设备，包括存储器和处理器，所述存储器中存储有可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至10任一项所述的音频处理方法。

13.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至10中任一项所述的音频处理方法。

...

【技术特征摘要】

1.一种音频处理方法，其特征在于，包括：

3.根据权利要求2所述的音频处理方法，其特征在于，所述关系式中包括待求解参数；

5.根据权利要求1至4中任一项所述的音频处理方法，其特征在于，所述目标模型的训练过程，包括：

6.根据权利要求5所述的音频处理方法，其特征在于，所述目标模型包括预处理单元，以及卷积神经网络与循环神经网络混合单元；

7.根据权利要求5所述的音频处理方法，其特征在于，所述根据所述部分车速下每一行人警示音音频标定后的增益预测值、相应车速下每一行人警示音音频标定后的增益值和损失函数，调整所述目标模型，获得...

【专利技术属性】
技术研发人员：闫启东，张冠男，宫宇，王运航，
申请(专利权)人：长城汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人