System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及音频处理,特别是涉及一种声源定位方法、设备及存储介质。
技术介绍
1、声源定位是一种利用音频信号的物理特性,如达到时间差,相位差,强度差等来确定声源方位的信息技术,这项技术在多个领域有着广泛的应用,如,环境感知、视频会议、机器交互等领域。举例说明,在环境感知领域,声源定位可以用于识别和定位异常声音的方位,以进行记录或告警;在视频会议领域,声源定位技术可以用于确定主讲人的空间方位信息,通过与摄像头进行联动,提高线上会议的沟通效率;在机器交互领域,声源定位技术可以帮助机器理解和响应指令,提高交互的效率和准确性。
2、但是,由于应用场景一般较为复杂,特别是存在混响和噪声的场景下采集到的音频质量较差,会影响声源定位的准确性。
技术实现思路
1、为了解决上述技术问题,本申请至少提供一种声源定位方法、设备及存储介质。
2、本申请第一方面提供了一种声源定位方法,方法包括:对麦克风阵列中每个麦克风接收到的音频信号进行傅里叶变换,分别得到每个麦克风对应的频域信号;将麦克风阵列中任意两个麦克风组成麦克风对,计算麦克风对含有的两个麦克风分别对应的频域信号中当前计算频点之间的协方差矩阵;基于协方差矩阵,计算得到麦克风对含有的两个麦克风之间的相关性参数,利用每个麦克风对的相关性参数计算得到第一相关系数;以及,基于麦克风对中两个麦克风之间的距离和当前计算频点的角频率,计算得到弥散场噪声参数,利用每个麦克风对的弥散场噪声参数计算得到第二相关系数;比较第一相关系数和第二相关系数分
3、在一实施例中,利用每个麦克风对的相关性参数计算得到第一相关系数,包括:基于每个麦克风对的相关性参数构建得到第一相关性矩阵;选取第一相关性矩阵的最大特征值,得到第一特征值;利用第一特征值计算得到第一相关系数;其中,第一特征值的绝对值与第一相关系数呈正比。
4、在一实施例中,利用每个麦克风对的弥散场噪声参数计算得到第二相关系数,包括:基于每个麦克风对的弥散场噪声参数构建得到第二相关性矩阵;选取第二相关性矩阵的最大特征值,得到第二特征值;利用第一特征值和第二特征值计算得到第二相关系数;其中,第一特征值和第二特征值之间的差值的绝对值与第二相关系数呈正比,第一特征值与第二相关系数呈反比。
5、在一实施例中,方法还包括:对每个麦克风对的相关性参数进行求和计算,得到求和结果;结合求和结果和弥散场噪声参数,计算得到第三相关系数;比较第一相关系数和第二相关系数分别与预设阈值之间的大小关系,得到比较结果,包括:比较第一相关系数、第二相关系数和第三相关系数分别与预设阈值之间的大小关系,得到比较结果。
6、在一实施例中,预设阈值包括第一门限值、第二门限值和第三门限值;比较第一相关系数、第二相关系数和第三相关系数分别与预设阈值之间的大小关系,得到比较结果,包括:分别比较第一相关系数和第一门限值之间的大小关系、比较第二相关系数和第二门限值之间的大小关系、比较第三相关系数和第三门限值之间的大小关系,得到比较结果;将比较结果满足预设条件的当前计算频点作为有效频点,包括:选取第一相关系数大于第一门限值、第二相关系数大于第二门限值、第三相关系数大于第三门限值的当前计算频点,得到有效频点。
7、在一实施例中,结合求和结果和弥散场噪声参数,计算得到第三相关系数,包括:采用下述公式计算第三相关系数:
8、
9、其中,x表示求和结果,y表示弥散场噪声参数,r{x}表示取x的实部。
10、在一实施例中,利用每个麦克风对的相关性参数计算得到第一相关系数,包括:对每个麦克风对的相关性参数进行求和计算,得到求和结果;结合求和结果和弥散场噪声参数,计算得到第一相关系数;利用每个麦克风对的弥散场噪声参数计算得到第二相关系数,包括:基于每个麦克风对的相关性参数构建得到第一相关性矩阵,选取第一相关性矩阵的最大特征值,得到第一特征值;基于每个麦克风对的弥散场噪声参数构建得到第二相关性矩阵,选取第二相关性矩阵的最大特征值,得到第二特征值;利用第一特征值和第二特征值计算得到第二相关系数;其中,第一特征值和第二特征值之间的差值的绝对值与第二相关系数呈正比,第一特征值与第二相关系数呈反比。
11、在一实施例中,利用每个麦克风对的相关性参数计算得到第一相关系数,包括:基于每个麦克风对的相关性参数构建得到第一相关性矩阵,选取第一相关性矩阵的最大特征值,得到第一特征值;利用第一特征值计算得到第一相关系数;其中,第一特征值的绝对值与第一相关系数呈正比;利用每个麦克风对的弥散场噪声参数计算得到第二相关系数,包括:对每个麦克风对的相关性参数进行求和计算,得到求和结果;结合求和结果和弥散场噪声参数,计算得到第二相关系数。
12、本申请第二方面提供了一种声源定位装置,装置包括:音频预处理模块,用于对麦克风阵列中每个麦克风接收到的音频信号进行傅里叶变换,分别得到每个麦克风对应的频域信号;协方差计算模块,用于将麦克风阵列中任意两个麦克风组成麦克风对,计算麦克风对含有的两个麦克风分别对应的频域信号中当前计算频点之间的协方差矩阵;相关系数计算模块,用于基于协方差矩阵,计算得到麦克风对含有的两个麦克风之间的相关性参数,利用每个麦克风对的相关性参数计算得到第一相关系数;以及,基于麦克风对中两个麦克风之间的距离和当前计算频点的角频率,计算得到弥散场噪声参数,利用每个麦克风对的弥散场噪声参数计算得到第二相关系数;阈值比较模块,用于比较第一相关系数和第二相关系数分别与预设阈值之间的大小关系,得到比较结果;定位模块,用于将比较结果满足预设条件的当前计算频点作为有效频点,利用所有有效频点进行声源定位。
13、本申请第三方面提供了一种电子设备,包括存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述声源定位方法。
14、本申请第四方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述声源定位方法。
15、上述方案,通过对麦克风阵列中每个麦克风接收到的音频信号进行傅里叶变换,分别得到每个麦克风对应的频域信号;将麦克风阵列中任意两个麦克风组成麦克风对,计算麦克风对含有的两个麦克风分别对应的频域信号中当前计算频点之间的协方差矩阵;基于协方差矩阵,计算得到麦克风对含有的两个麦克风之间的相关性参数,利用每个麦克风对的相关性参数计算得到第一相关系数;以及,基于麦克风对中两个麦克风之间的距离和当前计算频点的角频率,计算得到弥散场噪声参数,利用每个麦克风对的弥散场噪声参数计算得到第二相关系数;比较第一相关系数和第二相关系数分别与预设阈值之间的大小关系,得到比较结果;将比较结果满足预设条件的当前计算频点作为有效频点,利用所有有效频点进行声源定位,可以多维度考虑麦克风之间的相关系数,以联合多维度信息确定当前时间帧内的有效频点,可以提高挑选出本文档来自技高网...
【技术保护点】
1.一种声源定位方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述利用每个麦克风对的相关性参数计算得到第一相关系数,包括:
3.根据权利要求2所述的方法,其特征在于,所述利用所述每个麦克风对的弥散场噪声参数计算得到第二相关系数,包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述预设阈值包括第一门限值、第二门限值和第三门限值;所述比较所述第一相关系数、所述第二相关系数和第三相关系数分别与预设阈值之间的大小关系,得到比较结果,包括:
6.根据权利要求4所述的方法,其特征在于,所述结合所述求和结果和所述弥散场噪声参数,计算得到第三相关系数,包括:
7.根据权利要求1所述的方法,其特征在于,所述利用每个麦克风对的相关性参数计算得到第一相关系数,包括:
8.根据权利要求1所述的方法,其特征在于,所述利用每个麦克风对的相关性参数计算得到第一相关系数,包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器和处
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有程序指令,所述程序指令能够被处理器执行以实现如权利要求1-8任一项所述方法中的步骤。
...【技术特征摘要】
1.一种声源定位方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述利用每个麦克风对的相关性参数计算得到第一相关系数,包括:
3.根据权利要求2所述的方法,其特征在于,所述利用所述每个麦克风对的弥散场噪声参数计算得到第二相关系数,包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述预设阈值包括第一门限值、第二门限值和第三门限值;所述比较所述第一相关系数、所述第二相关系数和第三相关系数分别与预设阈值之间的大小关系,得到比较结果,包括:
6.根据权利要求4所述的方法,其特征在于,所述...
【专利技术属性】
技术研发人员:黄景标,方瑞东,林聚财,毛亚朋,薛晗,黄威震,王国龙,张海哲,殷俊,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。