基于麦克风阵列的动态数量声源跟踪方法技术

技术编号：13278253 阅读：149 留言：0更新日期：2016-05-19 03:00

本发明专利技术涉及一种基于麦克风阵列的多声源跟踪方法，所述方法包括：利用波束形成算法处理麦克风阵列接收信号并计算空间谱；计算空间谱峰与跟踪声源的匹配概率以实现两者的数据关联；根据匹配结果更新各个跟踪声源的粒子权值并更新声源位置；检测谱峰判定为新声源的概率，激活新声源粒子滤波器并评估其存在可能性；监测跟踪声源活跃状态并删除非活跃声源。采用本发明专利技术可以实现动态声源数量的多目标实时跟踪，在人机交互、远程会议及虚拟现实等复杂场景中都有广泛的应用。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及的是一种阵列音频信号处理领域的方法，尤其涉及一种基于数据关联和粒子滤波的多声源跟踪方法。
技术介绍
在声源定位与跟踪的许多应用中，如人机交互、远程会议、虚拟现实等，都需要对应用场景中的说话人进行定位与跟踪。由于实际应用场景中存在噪声，回响以及其他声源的干扰，如何在复杂环境下完成对说话人实时的定位与跟踪并保证系统的鲁棒性一直是研究的热点。除此之外，由于语音信号本身的非平稳特性，声源沉默与活跃状态的随机性，更使得这一问题更具有挑战性。目前，对于单声源的定位与跟踪技术已经非常成熟，主要采用基于TD0A的声源定位算法与基于粒子滤波的声源跟踪算法。对于多声源定位的问题，目前存在的主流方法主要分为两类:基于可控波束形成的方法和基于现代高分辨率谱估计的方法，其中，后者需要对声源数量具有先验假设，而前者没有这种限制。对于多声源跟踪的问题，由于存在观测与跟踪目标的匹配模糊问题，所以在对多个跟踪目标位置更新之前，需要对观测进行分类。目前存在的多声源跟踪算法主要采用最近邻的原则对观测与跟踪声源进行匹配。然而，这种处理方式忽略了实际情况下存在的很多其他可能性。并且，现有的多声源跟踪方法应用的场景是一种较为理想的环境，即，假设声源数量可知且在跟踪过程中不会变化，这意味着说话人在跟踪过程中会不间断地说话，这种限制使得现有的多声源跟踪算法难以应用于实际的场景。
技术实现思路
本专利技术针对现有技术存在的上述不足，提供一种基于数据关联和粒子滤波的多声源跟踪方法，既可提升声源定位与跟踪的准确度，又可以实现动态声源数量的目标跟踪，...
<a href="http://www.xjishu.com/zhuanli/55/CN105590021.html" title="基于麦克风阵列的动态数量声源跟踪方法原文来自X技术">基于麦克风阵列的动态数量声源跟踪方法</a>

【技术保护点】
一种基于麦克风阵列的动态数量声源跟踪方法，其特征在于，包括以下步骤：S1、接收音频信号，计算空间谱，检测空间谱谱峰位置，得到观测值；S2、根据所述观测值与当前时刻的K个跟踪声源进行数据关联，计算空间谱峰与跟踪声源的匹配概率；S3、检查当前时刻粒子滤波器或检查当前时刻跟踪目标数量；若所述粒子滤波器已经初始化或所述跟踪目标数量不等于0，进入步骤S4；若所述粒子滤波器尚未初始化或所述跟踪目标数量等于0，进入步骤S8；S4、评估试用声源存在概率并删除伪声源，监测跟踪声源活跃状态并删除非活跃声源；S5、根据谱峰‑声源匹配边缘后验概率定义声源的似然函数，并更新各声源的粒子权重；S6、根据所述粒子权重和粒子位置计算当前时刻各声源的位置；S7、根据贝叶斯推断预测各声源的先验活跃概率；S8、检测各谱峰的匹配概率，若所述各谱峰的匹配概率大于预设的判定阈值，激活新声源；S9、预测下一个时刻各声源粒子状态；S10、判断各声源的有效粒子数量，若所述有效粒子数量少于预设的粒子数量值，则重新采样所述声源的粒子，并进入步骤S1；反之，进入步骤S1。

【技术特征摘要】

【专利技术属性】
技术研发人员：江晓波，蒋三新，应忍冬，刘佩林，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人