声源方向估计设备和声源方向估计方法技术

技术编号:11952894 阅读:86 留言:0更新日期:2015-08-27 00:49
本发明专利技术提供声源方向估计设备和声源方向估计方法。根据实施例,声源方向估计设备包含获取单元、生成器、比较器和估计器。获取单元被配置成从多个传声器获取多个信道的声信号。生成器被配置成对于每个预定频率窗,计算多个信道的声信号的相位差,以生成相位差分布。比较器被配置成将相位差分布与预先对于每个方向生成的模板进行比较,并且按照相位差分布和每个方向的模板之间的相似性来计算分数。估计器被配置成基于计算出的分数来估计声源的方向。

【技术实现步骤摘要】
【专利说明】 相关申请的交叉引用 该个申请基于并且要求2014年2月26日提交的第2014-036032号日本专利申请 的优先权的权益;其全部内容通过引用被结合于此。
此处描述的实施例一般设及。
技术介绍
作为在不依赖从声源到传声器的距离的情况下,用于精确地估计声源方向的技 术,存在有利用从多个信道的声信号生成的相位差分布的技术。相位差分布是表示用于多 个信道的声信号的各个频率的相位差的分布,并且按照收集来自多个信道的声信号的声音 的传声器之间的距离,具有依赖于声源的方向的特定图案。即使当多个信道的声信号的声 压级差小时,该个图案也不变。为此,即使当声源被定位成远离导致多个信道的声信号的声 压级差变小的传声器时,相位差分布的使用也能够使得声源的方向能够被精确地估计。 但是,在使用相位差分布来估计声源的方向的传统技术中,从相位差分布获得方 向的处理所需的计算量是大的,从而阻碍了利用具有低计算能力的设备来实时地估计声源 的方向。为此,需要的是,W低的计算量来进行使用相位差分布的声源方向的估计。
技术实现思路
实施例的目的是提供一种声源方向估计设备,该声源方向估计设备能够W低的计 算量,估计使用相位差分布的声源方向。 根据实施例,声源方向估计设备包含获取单元、生成器、比较器和估计器。获取单 元被配置成从多个传声器获取多个信道的声信号。生成器被配置成对于每个预定频率区, 计算多个信道的声信号的相位差,W生成相位差分布。比较器被配置成将相位差分布与预 先对于每个方向生成的模板进行比较,并且按照相位差分布和每个方向的模板之间的相似 性来计算分数。估计器被配置成基于计算出的分数来估计声源的方向。[000引根据上述声源方向估计设备,能够W低的计算量估计使用相位差分布的声源方 向。【附图说明】 图1是图解根据第一实施例的声源方向估计设备的功能配置实例的框图; 图2是图解相位差分布的实例的图; 图3是图解量化的相位差分布的实例的图; 图4是模板中使用的各个方向的相位差分布的实例的图; 图5A到5C是各自图解通过量化各个方向的相位差分布所生成的模板的实例的 图; 图6是图解对于每个方向计算的分数的实例的图; 图7是图解通过根据第一实施例的声源方向估计设备的处理过程的实例的流程 图; 图8是图解根据第二实施例的声源方向估计设备的功能配置实例的框图; 图9是图解通过根据第二实施例的声源方向估计设备的处理过程的实例的流程 图;[001引图10是图解根据第S实施例的声源方向估计设备的功能配置实例的框图; 图11是图解通过根据第=实施例的声源方向估计设备的处理过程的实例的流程 图; 图12是图解根据第四实施例的声源方向估计设备的功能配置实例的框图; 图13是图解分数波形的实例的图; 图14是图解通过根据第四实施例的声源方向估计设备的处理过程的实例的流程 图; 图15是图解根据第五实施例的声源方向估计设备的功能配置实例的框图; 图16是图解分数波形的实例的图; 图17是图解通过根据第五实施例的声源方向估计设备的处理过程的实例的流程 图; 图18是说明不能区分声源的方向的实例的图; 图19是图解变形例中的传声器的布置的实例的图;[002引图20图解从分数转换的全方向分数的实例; 图21图解从分数转换的全方向分数的实例; 图22图解从分数转换的全方向分数的实例;W及 图23是图解其中全方向分数被合并的合并分数的实例的图。【具体实施方式】 第一实施例 图1是图解根据第一实施例的声源方向估计设备的功能配置实例的框图。如图1 中图的,根据本实施例的声源方向估计设备包含获取单元11、生成器12、比较器13、存储器 14、估计器15W及输出单元16。 获取单元11从构成传声器阵列的多个传声器中获取多个信道的声信号。在本实 施例中,如图1中图解的,从两个传声器Ml和M2中获取两个信道的声信号。构成传声器阵 列的两个传声器Ml和M2具有固定的相对位置关系,并且该两个传声器之间的距离不会改 变。当声源是人(说话者)时,例如,声信号是诸如说话者的谈话的语音信号。 生成器12对于每个预定频率窗(化equency bin),计算由获取单元11获取到的多 个信道的声信号的相位差,W生成相位差分布。具体地,生成器12经由快速傅里叶变换(FFT)等等,将获取单元11获取到的两个 信道的每个声信号从时域信号转换成频域信号。然后,生成器12根据下面的等式(1),对于 每个信号频率,计算两个信道的相位差4 (?),从而生成相位差分布。 (1)【主权项】1. 一种声源方向估计设备,其特征在于,包括: 获取单元,所述获取单元被配置成从多个传声器获取多个信道的声信号; 生成器,所述生成器被配置成对于每个预定频率窗,计算所述多个信道的所述声信号 的相位差,以生成相位差分布; 比较器,所述比较器被配置成将所述相位差分布与预先对于每个方向生成的模板进行 比较,并且按照所述相位差分布和每个方向的所述模板之间的相似性来计算分数;以及 估计器,所述估计器被配置成基于计算出的所述分数来估计声源的方向。2. 如权利要求1所述的设备,其特征在于, 所述比较器被配置成计算每个分数,以致当所述相位差分布和所述模板之间的所述相 似性较高时,与所述模板相对应的方向的所述每个分数变得较高,以及 所述估计器被配置成估计声源的所述方向是所述分数高的方向。3. 如权利要求2所述的设备,其特征在于, 所述比较器包含 量化器,所述量化器被配置成对所述相位差分布进行量化;以及 分数计算器,所述分数计算器被配置成将所述量化的相位差分布与通过对预先对于每 个方向计算出的相位差分布进行所述量化所获得的所述模板进行比较,并且计算所述相位 差分布中的所述量化的相位差和所述模板中的所述量化的相位差一致的频率窗的数目,作 为所述分数。4. 如权利要求2所述的设备,其特征在于, 所述比较器包含 量化器,所述量化器被配置成对所述相位差分布进行量化; 设定单元,所述设定单元被配置成基于所述声信号对于每个频率窗设定附加分数;以 及 分数计算器,所述分数计算器被配置成将所述量化的相位差分布与通过对预先对于每 个方向计算出的相位差分布进行所述量化所获得的所述模板进行比较,并且计算对于所述 相位差分布中的所述量化的相位差和所述模板中的所述量化的相位差一致的各个频率窗 所设定的所述附加分数的总和,作为所述分数。5. 如权利要求4所述的设备,其特征在于,所述设定单元被配置成按照每个频率窗中 的声信号的对数幂的大小来设定附加分数。6. 如权利要求4所述的设备,其特征在于,所述设定单元被配置成按照每个频率窗中 的声信号的信号/噪声比的大小来设定所述附加分数。7. 如权利要求2到6中任一项所述的设备,其特征在于,所述估计器被配置成生成具有 以方向角的次序排列的所述分数的分数波形,检测所述分数波形的局部最大值,在检测到 的所述局部最大值之中,以所述分数递减的次序选择指定数目的局部最大值,并且估计声 源的所述方向是与各个选择出的局部最大值相对应的方向。8. 如权利要求2到6中任一项所述的设备,其特征在于,所述估计器被配置成生成具有 以方向角的次序排列的所述分数的分数波形,检测所述分数波形的局部最大值,在检测到 的所本文档来自技高网...

【技术保护点】
一种声源方向估计设备,其特征在于,包括:获取单元,所述获取单元被配置成从多个传声器获取多个信道的声信号;生成器,所述生成器被配置成对于每个预定频率窗,计算所述多个信道的所述声信号的相位差,以生成相位差分布;比较器,所述比较器被配置成将所述相位差分布与预先对于每个方向生成的模板进行比较,并且按照所述相位差分布和每个方向的所述模板之间的相似性来计算分数;以及估计器,所述估计器被配置成基于计算出的所述分数来估计声源的方向。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:丁宁木田祐介
申请(专利权)人:株式会社东芝
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1