System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音拾取方法、装置、电子设备及计算机可读存储介质制造方法及图纸_技高网

语音拾取方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:43278487 阅读:0 留言:0更新日期:2024-11-12 16:03
本发明专利技术提出的一种语音拾取方法、装置、电子设备及计算机可读存储介质,方法包括步骤:获取第一音频信号与第二音频信号,并将第一音频信号转换为第一频域信号,将第二音频信号转换为第二频域信号;计算第一频域信号核第二频域信号间的瞬时相位差;根据瞬时相位差计算音频信号中语音存在的先验概率;根据先验概率和合成信号计算音频信号中语音存在的后验概率;根据后验概率计算语音频谱增益;根据语音频谱增益与合成信号生成目标音频信号。通过第一麦克风与第二麦克风之间的瞬时相位差计算先验概率,基于先验概率得到的后验概率能够基于实际语音场景计算语音频谱增益,实现了对于环境干扰的抑制,提高了拾音性能。

【技术实现步骤摘要】

本专利技术涉及拾音领域,尤其涉及一种语音拾取方法、装置、电子设备及计算机可读存储介质


技术介绍

1、从噪声环境中提取干净的目标语音是一个被广泛研究的课题。现有技术中,通常通过麦克风阵列来在保证目标语音不失真的前提下获得明显的干扰噪声抑制效果;然而,收到结构布局、轻量化、成本、走线等原因影响,使得麦克风阵列的实际设置无法满足理论要求,影响拾音性能。


技术实现思路

1、本专利技术的主要目的在于提出一种语音拾取方法、装置、电子设备及计算机可读存储介质,旨在解决现有技术中拾音性能差的问题。

2、为实现上述目的,本专利技术提供一种语音拾取方法,所述方法包括步骤:

3、获取第一音频信号与第二音频信号,并将所述第一音频信号转换为第一频域信号,将所述第二音频信号转换为第二频域信号;其中,所述第一音频信号由第一麦克风采集得到,所述第二音频信号由第二麦克风采集得到;

4、计算所述第一频域信号和所述第二频域信号间的瞬时相位差;

5、根据所述瞬时相位差计算音频信号中语音存在的先验概率;

6、将所述第一频域信号与所述第二频域信号合成得到合成信号;

7、根据所述先验概率和所述合成信号计算音频信号中语音存在的后验概率;

8、根据所述后验概率计算语音频谱增益;

9、根据所述语音频谱增益与所述合成信号生成目标音频信号。

10、可选地,所述根据所述第一频域信号、所述第二频域信号计算所述第一麦克风与所述第二麦克风的瞬时相位差包括:

11、根据所述第一频域信号计算所述第一麦克风的第一瞬时相位角,根据所述第二频域信号计算所述第二麦克风的第二瞬时相位角;

12、计算所述第一瞬时相位角与所述第二瞬时相位角的差值,得到所述瞬时相位差。

13、可选地,所述第一频域信号包括多个第一频域帧信号,所述第二频域信号包括多个第二频域帧信号,所述根据所述瞬时相位差计算频域信号的先验概率包括:

14、获取标准相位差,并比较所述标准相位差与所述瞬时相位差确定语音指示函数;

15、获取与每一所述第一频域帧信号的上一频域帧信号,以及每一所述第二频域帧信号的上一频域帧信号均对应的上一帧平滑指示函数;

16、通过所述语音指示函数与所述上一帧平滑指示函数,确定每一所述第一频域帧信号和每一所述第二频域帧信号均对应的目标帧平滑指示函数;

17、根据所述目标帧平滑指示函数计算所述先验概率。

18、可选地,所述根据所述先验概率和所述合成信号计算音频信号中语音存在的后验概率之前,所述方法还包括:

19、根据预设导向矢量、所述第一频域信号与所述第二频域信号,确定空间中音频信号的后验波束范围;

20、所述根据所述先验概率和所述合成信号计算音频信号中语音存在的后验概率包括:

21、根据所述先验概率、所述后验波束范围和所述合成信号计算音频信号中语音存在的后验概率。

22、可选地,所述根据预设导向矢量、所述第一频域信号与所述第二频域信号,确定空间中音频信号的后验波束范围包括:

23、确定所述第一频域信号与所述第二频域信号在不同角度范围的角度数据;

24、针对每一所述角度范围,根据对应的所述角度数据与所述导向矢量计算得到区域能量;

25、将区域能量最大的角度范围作为后验波束范围。

26、可选地,所述后验概率包括第一后验概率以及第二后验概率;所述根据所述先验概率、所述后验波束范围和所述合成信号计算音频信号中语音存在的后验概率包括:

27、根据所述合成信号计算后验信噪比最小值以及噪声功率谱;

28、根据所述后验信噪比最小值、所述先验概率以及所述后验波束范围计算语音缺失的第一后验概率;

29、根据所述噪声功率谱以及所述合成信号计算后验信噪比以及先验信噪比;

30、根据所述第一后验概率、后验信噪比、先验信噪比计算语音存在的第二后验概率。

31、可选地,所述根据所述后验概率计算语音频谱增益包括:

32、根据所述后验信噪比最小值以及所述先验信噪比得到一般增益;

33、获取最小增益;

34、根据所述最小增益、所述一般增益以及所述后验概率得到计算所述语音频谱增益。

35、可选地,所述根据所述语音频谱增益与所述合成信号生成目标音频信号包括:

36、将所述语音频谱增益与所述合成信号相乘得到输出频谱;

37、对所述输出频谱进行反傅里叶变化得到所述目标音频信号。

38、为实现上述目的,本专利技术还提供一种语音拾取装置,所述语音拾取装置包括:

39、第一获取模块,用于获取第一音频信号与第二音频信号,并将所述第一音频信号转换为第一频域信号,将所述第二音频信号转换为第二频域信号;其中,所述第一音频信号由第一麦克风采集得到,所述第二音频信号由第二麦克风采集得到;

40、第一计算模块,用于计算所述第一频域信号和所述第二频域信号间的瞬时相位差;

41、第二计算模块,用于根据所述瞬时相位差计算音频信号中语音存在的先验概率;

42、第一合成模块,用于将所述第一频域信号与所述第二频域信号合成得到合成信号;

43、第三计算模块,用于根据所述先验概率和所述合成信号计算音频信号中语音存在的后验概率;

44、第四计算模块,用于根据所述后验概率计算语音频谱增益;

45、第一生成模块,用于根据所述语音频谱增益与所述合成信号生成目标音频信号。

46、为实现上述目的,本专利技术还提供一种电子设备,所述电子设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的语音拾取方法的步骤。

47、为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的语音拾取方法的步骤。

48、本专利技术提出的一种语音拾取方法、装置、电子设备及计算机可读存储介质,获取第一音频信号与第二音频信号,并将所述第一音频信号转换为第一频域信号,将所述第二音频信号转换为第二频域信号;其中,所述第一音频信号由第一麦克风采集得到,所述第二音频信号由第二麦克风采集得到;计算所述第一频域信号和所述第二频域信号间的瞬时相位差;根据所述瞬时相位差计算音频信号中语音存在的先验概率;将所述第一频域信号与所述第二频域信号合成得到合成信号;根据所述先验概率和所述合成信号计算音频信号中语音存在的后验概率;根据所述后验概率计算语音频谱增益;根据所述语音频谱增益与所述合成信号生成目标音频信号。通过第一麦克风与第二麦克风之间的瞬时相位差计算先验概率,从而能够基于语音拾取方位准确确定语音存在的概率,进而基于先验概率得到的后验概率能够基于实际语音场景计算本文档来自技高网...

【技术保护点】

1.一种语音拾取方法,其特征在于,所述语音拾取方法包括:

2.如权利要求1所述的语音拾取方法,其特征在于,所述根据所述第一频域信号、所述第二频域信号计算所述第一麦克风与所述第二麦克风的瞬时相位差包括:

3.如权利要求1所述的语音拾取方法,其特征在于,所述第一频域信号包括多个第一频域帧信号,所述第二频域信号包括多个第二频域帧信号,所述根据所述瞬时相位差计算频域信号的先验概率包括:

4.如权利要求1所述的语音拾取方法,其特征在于,所述根据所述先验概率和所述合成信号计算音频信号中语音存在的后验概率之前,所述方法还包括:

5.如权利要求4所述的语音拾取方法,其特征在于,所述根据预设导向矢量、所述第一频域信号与所述第二频域信号,确定空间中音频信号的后验波束范围包括:

6.如权利要求4所述的语音拾取方法,其特征在于,所述后验概率包括第一后验概率以及第二后验概率;所述根据所述先验概率、所述后验波束范围和所述合成信号计算音频信号中语音存在的后验概率包括:

7.如权利要求6所述的语音拾取方法,其特征在于,所述根据所述后验概率计算语音频谱增益包括:

8.如权利要求1所述的语音拾取方法,其特征在于,所述根据所述语音频谱增益与所述合成信号生成目标音频信号包括:

9.一种语音拾取装置,其特征在于,所述语音拾取装置包括:

10.一种电子设备,其特征在于,所述电子设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的语音拾取方法的步骤。

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的语音拾取方法的步骤。

...

【技术特征摘要】

1.一种语音拾取方法,其特征在于,所述语音拾取方法包括:

2.如权利要求1所述的语音拾取方法,其特征在于,所述根据所述第一频域信号、所述第二频域信号计算所述第一麦克风与所述第二麦克风的瞬时相位差包括:

3.如权利要求1所述的语音拾取方法,其特征在于,所述第一频域信号包括多个第一频域帧信号,所述第二频域信号包括多个第二频域帧信号,所述根据所述瞬时相位差计算频域信号的先验概率包括:

4.如权利要求1所述的语音拾取方法,其特征在于,所述根据所述先验概率和所述合成信号计算音频信号中语音存在的后验概率之前,所述方法还包括:

5.如权利要求4所述的语音拾取方法,其特征在于,所述根据预设导向矢量、所述第一频域信号与所述第二频域信号,确定空间中音频信号的后验波束范围包括:

6.如权利要求4所述的语音拾取方法,其特征在于,所述后验概率包括第一后验概率...

【专利技术属性】
技术研发人员:陈国明许国军
申请(专利权)人:立讯精密科技南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1