本申请实施例涉及一种声源定位方法、装置、设备和存储介质。该方法包括:获取初始声源数据;对初始声源数据进行处理,生成多个声源数据组;生成每个声源数据组对应的初始定位数据;基于各初始定位数据的数据波动指标值和各初始定位数据,生成目标定位数据。通过上述技术方案,实现了在麦克风阵列转动过程中进行声源定位,提高了声源定位结果的准确性。提高了声源定位结果的准确性。提高了声源定位结果的准确性。
【技术实现步骤摘要】
声源定位方法、装置、设备和存储介质
[0001]本申请涉及音频处理
,尤其涉及一种声源定位方法、装置、设备和存储介质。
技术介绍
[0002]声源定位技术是确定一个声音在空间来源位置的技术,其主要是根据声音到达各麦克风之间存在时间差及声级差的原理对声音进行定位。
[0003]目前,针对麦克风阵列的声源定位算法主要有时间到达差(TDOA,Time Difference of Arrival)、波束形成(Beamforming)和声全息(Holography)等几大类。
[0004]但是,上述各种声源定位算法都是基于麦克风阵列位置固定的假设完成的,当这些算法应用到实际产品后,声源定位结果的准确性往往会大大的下降。
技术实现思路
[0005]为了解决上述声源定位算法应用于实际产品后声源定位准确性降低的问题,本申请提供了一种声源定位方法、装置、设备和存储介质。
[0006]第一方面,本申请实施例提供了一种声源定位方法,该方法包括:
[0007]获取初始声源数据;
[0008]对所述初始声源数据进行处理,生成多个声源数据组;
[0009]生成每个所述声源数据组对应的初始定位数据;
[0010]基于各所述初始定位数据的数据波动指标值和各所述初始定位数据,生成目标定位数据。
[0011]在一些实施例中,所述基于各所述初始定位数据的数据波动指标值和各所述初始定位数据,生成目标定位数据包括:
[0012]基于各所述初始定位数据,确定数据变化趋势值和数据离散指标值,作为所述数据波动指标值;
[0013]基于所述数据变化趋势值和所述数据离散指标值,从各所述初始定位数据中确定多个候选定位数据;
[0014]基于各所述候选定位数据,生成所述目标定位数据。
[0015]在一些实施例中,所述基于各所述初始定位数据,确定数据变化趋势值和数据离散指标值包括:
[0016]对各所述初始定位数据进行线性拟合,获得各所述初始定位数据对应的线性斜率,作为所述数据变化趋势值;
[0017]确定各所述初始定位数据的方差,作为所述数据离散指标值。
[0018]在一些实施例中,所述基于所述数据变化趋势值和所述数据离散指标值,从各所述初始定位数据中确定多个候选定位数据包括:
[0019]若确定所述线性斜率的绝对值大于预设斜率阈值,且所述方差大于预设方差阈
值,则从各所述初始定位数据中以优先级从高到低的顺序选择预设数量的所述初始定位数据,作为各所述候选定位数据;其中,所述优先级由数据获取时间距离当前时刻的时间差确定。
[0020]在一些实施例中,所述基于所述数据变化趋势值和所述数据离散指标值,从各所述初始定位数据中确定多个候选定位数据包括:
[0021]若确定所述线性斜率的绝对值大于预设斜率阈值,且所述方差小于或等于预设方差阈值,或者,确定所述线性斜率的绝对值小于或等于所述预设斜率阈值,则将各所述初始定位数据确定为各所述候选定位数据。
[0022]在一些实施例中,所述对所述初始声源数据进行处理,生成多个声源数据组包括:
[0023]对所述初始声源数据进行分帧处理,获得各单帧声源数据;
[0024]对每个所述单帧声源数据进行加窗处理,生成各所述声源数据组。
[0025]在一些实施例中,所述基于各所述声源数据组,生成每个所述声源数据组对应的初始定位数据包括:
[0026]利用麦克风阵列对应的预设声源定位算法,对每个所述声源数据组进行声源定位处理,生成相应声源数据组对应的所述初始定位数据。
[0027]第二方面,本申请实施例还提供了一种声源定位装置,该装置包括:
[0028]初始声源数据获取模块,用于获取初始声源数据;
[0029]声源数据组生成模块,用于对所述初始声源数据进行处理,生成多个声源数据组;
[0030]初始定位数据生成模块,用于基于各所述声源数据组,生成每个所述声源数据组对应的初始定位数据;
[0031]目标定位数据确定模块,用于基于各所述初始定位数据的数据波动指标值和各所述初始定位数据,生成目标定位数据。
[0032]在一些实施例中,目标定位数据确定模块包括:
[0033]数据波动指标值确定子模块,用于基于各所述初始定位数据,确定数据变化趋势值和数据离散指标值,作为所述数据波动指标值;
[0034]候选定位数据确定子模块,用于基于所述数据变化趋势值和所述数据离散指标值,从各所述初始定位数据中确定多个候选定位数据;
[0035]目标定位数据生成子模块,用于基于各所述候选定位数据,生成所述目标定位数据。
[0036]在一些实施例中,数据波动指标值确定子模块具体用于:
[0037]对各所述初始定位数据进行线性拟合,获得各所述初始定位数据对应的线性斜率,作为所述数据变化趋势值;
[0038]确定各所述初始定位数据的方差,作为所述数据离散指标值。
[0039]在一些实施例中,候选定位数据确定子模块具体用于:
[0040]若确定所述线性斜率的绝对值大于预设斜率阈值,且所述方差大于预设方差阈值,则从各所述初始定位数据中以优先级从高到低的顺序选择预设数量的所述初始定位数据,作为各所述候选定位数据;其中,所述优先级由数据获取时间距离当前时刻的时间差确定。
[0041]在一些实施例中,候选定位数据确定子模块还具体用于:
[0042]若确定所述线性斜率的绝对值大于预设斜率阈值,且所述方差小于或等于预设方差阈值,或者,确定所述线性斜率的绝对值小于或等于所述预设斜率阈值,则将各所述初始定位数据确定为各所述候选定位数据。
[0043]在一些实施例中,声源数据组生成模块具体用于:
[0044]对所述初始声源数据进行分帧处理,获得各单帧声源数据;
[0045]对每个所述单帧声源数据进行加窗处理,生成各所述声源数据组。
[0046]在一些实施例中,初始定位数据生成模块具体用于:
[0047]利用麦克风阵列对应的预设声源定位算法,对每个所述声源数据组进行声源定位处理,生成相应声源数据组对应的所述初始定位数据。
[0048]第三方面,本申请实施例还提供了一种电子设备,该电子设备包括:
[0049]处理器和存储器;
[0050]所述处理器通过调用所述存储器存储的程序或指令,用于执行本申请任意实施例中所说明的声源定位方法的步骤。
[0051]第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或所述指令使计算机执行本申请任意实施例中所说明的声源定位方法的步骤。
[0052]本申请实施例提供的声源定位方案,通过对初始声源数据进行处理,生成多个声源数据组,并对每个声源数据组进行声源定位计算,得到对应的初始定位数据,且基于各初始定位数据的数据波动指标值,综合计算各个初始定位数据本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种声源定位方法,其特征在于,包括:获取初始声源数据;对所述初始声源数据进行处理,生成多个声源数据组;生成每个所述声源数据组对应的初始定位数据;基于各所述初始定位数据的数据波动指标值和各所述初始定位数据,生成目标定位数据。2.根据权利要求1所述的方法,其特征在于,所述基于各所述初始定位数据的数据波动指标值和各所述初始定位数据,生成目标定位数据包括:基于各所述初始定位数据,确定数据变化趋势值和数据离散指标值,作为所述数据波动指标值;基于所述数据变化趋势值和所述数据离散指标值,从各所述初始定位数据中确定多个候选定位数据;基于各所述候选定位数据,生成所述目标定位数据。3.根据权利要求2所述的方法,其特征在于,所述基于各所述初始定位数据,确定数据变化趋势值和数据离散指标值包括:对各所述初始定位数据进行线性拟合,获得各所述初始定位数据对应的线性斜率,作为所述数据变化趋势值;确定各所述初始定位数据的方差,作为所述数据离散指标值。4.根据权利要求3所述的方法,其特征在于,所述基于所述数据变化趋势值和所述数据离散指标值,从各所述初始定位数据中确定多个候选定位数据包括:若确定所述线性斜率的绝对值大于预设斜率阈值,且所述方差大于预设方差阈值,则从各所述初始定位数据中以优先级从高到低的顺序选择预设数量的所述初始定位数据,作为各所述候选定位数据;其中,所述优先级由数据获取时间距离当前时刻的时间差确定。5.根据权利要求3所述的方法,其特征在于,所述基于所述数据变化趋势值和所述数据离散指标值,从各所述初始定位数据中确定多个候选定位数据包括:若确定所...
【专利技术属性】
技术研发人员:李良斌,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。