System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 远场拾音方法、装置、设备及介质制造方法及图纸_技高网

远场拾音方法、装置、设备及介质制造方法及图纸

技术编号:43716784 阅读:5 留言:0更新日期:2024-12-20 12:47
本申请公开了一种远场拾音方法、装置、设备及介质,属于远场拾音技术领域。本申请聚焦提升远距离拾音质量,提升语音识别或翻译效果,提出一种远场拾音方法的技术方案,首先,在确定需要对获取到的原始音频进行音频处理之后,定位原始音频的声源位置,并基于声源位置和采集原始音频的麦克风位置生成音频波束;然后,在确定音频波束存在高噪之后,对音频波束进行噪声抑制,从而输出目标音频。基于麦克风阵列的信号处理技术,自动估计目标说话人方位,主波束聚焦说话人方向并抑制其他干扰,并通过降噪模块进一步消除噪声,提升语音清晰度。以此,识别风噪、高噪、安静或小噪声场景以进行不同的音效处理,更为细致地提升不同场景下的语音识别正确率。

【技术实现步骤摘要】

本申请涉及远场拾音的,尤其涉及一种远场拾音方法、远场拾音装置、电子设备及计算机可读存储介质。


技术介绍

1、目前,生活中很多应用场景下的目标声源的声音的位置在距离麦克风2米以上的距离,比如常见的带有声音采集系统的头戴设备或穿戴设备,智能语音音箱等。当目标声源如讲话的人站在离麦克风较远的位置的时候,比较突出的一个问题是目标声音的信噪比和直接混响比都很低,远场拾音的效果较差。


技术实现思路

1、本申请的主要目的在于提供一种远场拾音方法、远场拾音装置、电子设备及计算机可读存储介质,旨在解决难以高效准确实现远场拾音的技术问题。

2、为实现上述目的,本申请提供一种远场拾音方法,所述方法包括:

3、获取原始音频,并确定是否需要对所述原始音频进行音频处理;

4、在确定需要对所述原始音频进行音频处理之后,定位所述原始音频的声源位置,基于所述声源位置和采集所述原始音频的麦克风位置生成音频波束;

5、在确定所述音频波束存在高噪之后,对所述音频波束进行噪声抑制,输出目标音频。

6、示例性的,所述确定是否需要对所述原始音频进行音频处理的步骤,包括:

7、对所述原始音频进行语音端点检测以及风噪检测;

8、基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理。

9、示例性的,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:

10、若所述第一检测结果为存在语音端点,且所述第二检测结果为不存在风噪,则确定需要对所述原始音频进行音频处理。

11、示例性的,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:

12、若所述第一检测结果为存在语音端点,且所述第二检测结果为存在风噪时,则对所述原始音频进行风噪降噪处理,输出目标音频。

13、示例性的,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:

14、若所述第一检测结果为不存在语音端点,则确定不需要对所述原始音频进行音频处理。

15、示例性的,所述定位所述原始音频的声源位置的步骤,包括:

16、确定所述原始音频的声波入射角度信息,并确定所述声波入射角度信息为所述原始音频的声源位置。

17、示例性的,所述基于所述声源位置和采集所述原始音频的麦克风位置生成音频波束的步骤之后,包括:

18、在确定所述音频波束不存在高噪之后,输出所述原始音频为目标音频。

19、本申请还提供一种远场拾音装置,所述装置包括:

20、确定模块,用于获取原始音频,并确定是否需要对所述原始音频进行音频处理;

21、生成模块,用于在确定需要对所述原始音频进行音频处理之后,定位所述原始音频的声源位置,基于所述声源位置和采集所述原始音频的麦克风位置生成音频波束;

22、输出模块,用于在确定所述音频波束存在高噪之后,对所述音频波束进行噪声抑制,输出目标音频。

23、本申请还提供一种电子设备,所述电子设备包括:存储器、处理器、及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的远场拾音方法的步骤。

24、本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的远场拾音方法的步骤。

25、本申请实施例提出的一种远场拾音方法、远场拾音装置、电子设备及计算机可读存储介质,获取原始音频,并确定是否需要对所述原始音频进行音频处理;在确定需要对所述原始音频进行音频处理之后,定位所述原始音频的声源位置,基于所述声源位置和采集所述原始音频的麦克风位置生成音频波束;在确定所述音频波束存在高噪之后,对所述音频波束进行噪声抑制,输出目标音频。

26、本申请聚焦提升远距离拾音质量,提升语音识别或翻译效果,提出一种远场拾音方法的技术方案,首先,在确定需要对获取到的原始音频进行音频处理之后,定位原始音频的声源位置,并基于声源位置和采集原始音频的麦克风位置生成音频波束;然后,在确定音频波束存在高噪之后,对音频波束进行噪声抑制,从而输出目标音频。

27、该方案基于麦克风阵列的信号处理技术,自动估计目标说话人方位,主波束聚焦说话人方向并抑制其他干扰,并通过降噪模块进一步消除噪声,提升语音清晰度。以此,识别风噪、高噪、安静或小噪声场景以进行不同的音频处理,更为细致地提升不同场景下的语音识别正确率。

本文档来自技高网...

【技术保护点】

1.一种远场拾音方法,其特征在于,所述方法包括:

2.如权利要求1所述的远场拾音方法,其特征在于,所述确定是否需要对所述原始音频进行音频处理的步骤,包括:

3.如权利要求2所述的远场拾音方法,其特征在于,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:

4.如权利要求2所述的远场拾音方法,其特征在于,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:

5.如权利要求2所述的远场拾音方法,其特征在于,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:

6.如权利要求1所述的远场拾音方法,其特征在于,所述定位所述原始音频的声源位置的步骤,包括:

7.如权利要求1所述的远场拾音方法,其特征在于,所述基于所述声源位置和采集所述原始音频的麦克风位置生成音频波束的步骤之后,包括:

8.一种远场拾音装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括:存储器、处理器、及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的远场拾音方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的远场拾音方法的步骤。

...

【技术特征摘要】

1.一种远场拾音方法,其特征在于,所述方法包括:

2.如权利要求1所述的远场拾音方法,其特征在于,所述确定是否需要对所述原始音频进行音频处理的步骤,包括:

3.如权利要求2所述的远场拾音方法,其特征在于,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:

4.如权利要求2所述的远场拾音方法,其特征在于,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:

5.如权利要求2所述的远场拾音方法,其特征在于,所述基于所述语音端点检测的第一检测结果和所述风噪检测的第二检测结果,确定是否需要对所述原始音频进行音频处理的步骤,包括:...

【专利技术属性】
技术研发人员:侯天峰
申请(专利权)人:歌尔科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1