System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 音频处理方法、装置、电子设备以及存储介质制造方法及图纸_技高网

音频处理方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:43758497 阅读:12 留言:0更新日期:2024-12-24 16:02
本申请公开了一种音频处理方法、装置、电子设备以及存储介质。该方法包括:获取麦克风阵列采集的目标音频数据,目标音频数据为多通道音频数据;对目标音频数据进行预处理,得到预处理音频数据,预处理音频数据适于输入预先训练的音频处理模型;通过预先训练的音频处理模型对预处理音频数据进行处理,得到至少两个方向的拾音数据,预先训练的音频处理模型包括编码网络以及分别连接于编码网络的至少两个解码网络,至少两个解码网络中不同解码网络输出的拾音数据的方向不相同。本申请实施例提供的技术方案,可以使不同方向的拾音数据的分离效果更好,降低多个方向的拾音数据发生语音混淆的概率,从而提升听觉体验。

【技术实现步骤摘要】

本申请涉及音频处理,尤其涉及一种音频处理方法、装置、电子设备以及存储介质


技术介绍

1、目前,越来越多的电子设备上设有麦克风阵列,电子设备需要对麦克风采集的音频数据进行处理,以实现定向拾音,从而提供更好的听觉体验。

2、相关技术中,电子设备通过波束形成算法对麦克风阵列采集的音频数据进行处理,得到指定方向的拾音数据。波束形成算法的实现原理是通过调整每个麦克风的权重,使得来自特定方向的信号在输出端得到加强,而其他方向的信号则被抑制或抵消。

3、相关技术中,电子设备需要对多个方向进行拾音时存在因语音混淆的问题,多个方向的拾音数据分离地不干净。


技术实现思路

1、本申请提出了一种音频处理方法、装置、电子设备以及存储介质。

2、第一方面,本申请实施例提供一种音频处理方法,该方法应用于电子设备,电子设备设有麦克风阵列,方法包括:获取麦克风阵列采集的目标音频数据,目标音频数据为多通道音频数据;对目标音频数据进行预处理,得到预处理音频数据,预处理音频数据适于输入预先训练的音频处理模型;通过预先训练的音频处理模型对预处理音频数据进行处理,得到至少两个方向的拾音数据,预先训练的音频处理模型包括编码网络以及分别连接于编码网络的至少两个解码网络,至少两个解码网络中不同解码网络输出的拾音数据的方向不相同。

3、第二方面,本申请实施例提供一种音频处理装置,该装置包括:数据获取模块,用于获取麦克风阵列采集的目标音频数据,目标音频数据为多通道音频数据;预处理模块,用于对目标音频数据进行预处理,得到预处理音频数据,预处理音频数据适于输入预先训练的音频处理模型;音频处理模块,用于通过预先训练的音频处理模型对预处理音频数据进行处理,得到至少两个方向的拾音数据,预先训练的音频处理模型包括编码网络以及分别连接于编码网络的至少两个解码网络,至少两个解码网络中不同解码网络输出的拾音数据的方向不相同。

4、第三方面,本申请实施例提供一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个应用程序配置用于执行如第一方面所述的方法。

5、第四方面,本申请实施例提供一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有计算机程序指令,计算机程序指令可被处理器调用执行如第一方面所述的方法。

6、第五方面,本申请实施例提供一种计算机程序产品,当该计算机程序产品中地指令被执行时,其用于实现如第一方面所述的方法。

7、相较于现有技术,本申请实施例提供的技术方案,通过对麦克风阵列采集的多通道音频数据进行预处理,得到预处理音频数据,由音频处理模型对预处理音频数据进行音频处理,得到至少两个方向的拾音数据,其中,音频处理模型包括至少两个解码网络,不同的解码网络用于输出不同方向的拾音数据,上述至少两个解码网络彼此独立,互不干扰,因此基于音频处理模型来实现多方向拾音时,可以使不同方向的拾音数据的分离效果更好,降低多个方向的拾音数据发生语音混淆的概率,从而提升听觉体验。

本文档来自技高网...

【技术保护点】

1.一种音频处理方法,其特征在于,应用于电子设备,所述电子设备设有麦克风阵列,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过所述预先训练的音频处理模型对所述预处理音频数据进行处理,得到至少两个方向的拾音数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述解码网络包括顺次连接的掩膜层、第一运算层、池化层、第二运算层;不同解码网络所包括的掩码层对应的掩膜矩阵不相同;

4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述音频处理模型的训练过程包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述训练音频数据对应的拾音结果以及所述训练音频数据的标签信息,确定相对误差,包括:

6.根据权利要求4所述的方法,其特征在于,所述获取多个训练音频数据包括:

7.根据权利要求1至3中任意一项所述的方法,其特征在于,所述对所述目标音频数据进行预处理,得到预处理音频数据,包括:

8.一种音频处理装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括:</p>

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序指令,所述计算机程序指令可被处理器调用执行如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种音频处理方法,其特征在于,应用于电子设备,所述电子设备设有麦克风阵列,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过所述预先训练的音频处理模型对所述预处理音频数据进行处理,得到至少两个方向的拾音数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述解码网络包括顺次连接的掩膜层、第一运算层、池化层、第二运算层;不同解码网络所包括的掩码层对应的掩膜矩阵不相同;

4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述音频处理模型的训练过程包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所...

【专利技术属性】
技术研发人员:黎荣晋陈东鹏张伟彬李亚桐
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1