声源音频的管理方法、装置、设备和存储介质制造方法及图纸

技术编号:30402718 阅读:18 留言:0更新日期:2021-10-20 10:48
本发明专利技术实施例公开了一种声源音频的管理方法、装置、设备和存储介质。该声源音频的管理方法由音频采集端执行,包括:通过音频采集器获取音频信息,根据音频信息确定至少一个候选声源;其中,音频采集器设置于音频采集端;定位候选声源的声源位置;根据从管理端接收的目标增强区域,判断候选声源的声源位置是否在目标增强区域中;若是,则确定在目标增强区域中的候选声源为目标声源,并确定目标声源的音频信息增强系数;音频信息增强系数用于供管理端对目标声源的音频信息进行增强处理。通过配置感兴趣区域,对感兴趣区域中的声源音频进行增强,实现提高对采集音频信息中感兴趣音频的提取准确性,更好地进行音频追踪。更好地进行音频追踪。更好地进行音频追踪。

【技术实现步骤摘要】
声源音频的管理方法、装置、设备和存储介质


[0001]本专利技术实施例涉及音频跟踪
,尤其涉及一种声源音频的管理方法、装置、设备和存储介质。

技术介绍

[0002]随着时代发展,完整的音频监控系统被广泛应用在公共设施中,音频监控已经成为安防监控行业的新亮点。但同时也对音视频的监控提出了更多要求,如语音对讲,语音识别,音视频同步,声音定位以及音频场景分析等。然而在复杂环境中采集到的音频信号中往往会含有多个声源的音频数据,不利于对监控场景的精确监控。
[0003]目前采用成熟的TDOA算法和ILD算法,可以实现在二维平面内的声音定位。根据声音定位结果控制音频采集装置转动,使其一直对准声源所在位置,达成音频控制PTZ持续跟踪。比如在园区中,通过声音定位跟踪技术,在监控区域出现异常声响时对准声音位置并跟踪。
[0004]目前麦克风阵列若需要对声音进行定向增强,一般是通过传统的声源定位算法和定向增强算法计算出声源的方向,同时对声源的方向进行声音增强。然而对声源的方向进行声音增强同时也会造成对声源方向中的非目标声源声音进行增强,造成获取到增强声音中包含噪声,严重影响对采集音频信号中重要信息的提取准确性。

技术实现思路

[0005]本专利技术实施例提供一种声源音频的管理方法、装置、设备和存储介质,通过配置感兴趣区域,对感兴趣区域中的声源音频进行增强,实现提高对采集音频信息中感兴趣音频的提取准确性。
[0006]第一方面,本专利技术实施例提供了一种声源音频的管理方法,包括:
[0007]通过音频采集器获取音频信息,根据所述音频信息确定至少一个候选声源;其中,所述音频采集器设置于音频采集端;
[0008]定位所述候选声源的声源位置;
[0009]根据从管理端接收的目标增强区域,判断所述候选声源的声源位置是否在所述目标增强区域中;
[0010]若是,则确定在所述目标增强区域中的候选声源为目标声源,并确定所述目标声源的音频信息增强系数;所述音频信息增强系数用于供所述管理端对目标声源的音频信息进行增强处理。
[0011]第二方面,本专利技术实施例还提供了一种声源音频的管理装置,包括:
[0012]候选声源确定模块,用于通过音频采集器获取音频信息,根据所述音频信息确定至少一个候选声源;其中,所述音频采集器设置于音频采集端;
[0013]声源位置定位模块,用于定位所述候选声源的声源位置;
[0014]声源位置判断模块,用于根据从管理端接收的目标增强区域,判断所述候选声源
的声源位置是否在所述目标增强区域中;
[0015]音频信息增强系数确定模块,用于若所述声源位置判断模块判断为是,则确定在所述目标增强区域中的候选声源为目标声源,并确定所述目标声源的音频信息增强系数;所述音频信息增强系数用于供所述管理端对目标声源的音频信息进行增强处理。
[0016]第三方面,本专利技术实施例还提供了一种设备,包括:
[0017]一个或多个处理器;
[0018]存储装置,用于存储一个或多个程序,
[0019]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术任一实施例所述的声源音频的管理方法。
[0020]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任一实施例所述的声源音频的管理方法。
[0021]本专利技术实施例基于获取到的音频信息确定声源位置,并根据声源位置与目标增强区域的位置关系确定需要进行增强处理的目标声源,并确定目标声源的音频信息增强系数。通过配置感兴趣区域,对感兴趣区域中的声源音频进行增强,实现提高对采集音频信息中感兴趣音频的提取准确性,更好地进行音频追踪。
附图说明
[0022]图1(a)是本专利技术实施例一中的声源音频的管理方法的流程图;
[0023]图1(b)是本专利技术实施例一中利用声源定位技术得到的定位结果示意图;
[0024]图2(a)是本专利技术实施例二中的声源音频的管理方法的流程图;
[0025]图2(b)是本专利技术实施例中对候选声源的音频信息进行分区存储的码流数据结构示意图;
[0026]图2(c)是本专利技术实施例中携带码流私有SEI信息的音频码流数据结构示意图;
[0027]图3是本专利技术实施例三中的声源音频的管理装置的结构示意图;
[0028]图4是本专利技术实施例四中的设备的结构示意图。
具体实施方式
[0029]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0030]实施例一
[0031]图1(a)是本专利技术实施例一中的声源音频的管理方法的流程图,本实施例可适用于对感兴趣区域的音频进行增强,便于提高信息提取的准确性情况。该方法可以由声源音频的管理装置来执行,该装置可以采用软件和/或硬件的方式实现,并可配置在设备中,例如设备可以是后台服务器等具有通信和计算能力的设备。如图1(a)所示,该方法具体包括:
[0032]步骤101、通过音频采集器获取音频信息,根据所述音频信息确定至少一个候选声源;其中,所述音频采集器设置于音频采集端。
[0033]其中,音频采集器用于采集其安装位置周围的音频信息,例如采用麦克风收集声音信息。候选声源是指音频采集器采集到的音频信息的来源。音频采集端用于对音频采集
器获取到的音频信息进行保存并且可以进行相应的处理,如将音频信息进行编码,发送至后台管理端。
[0034]在本申请中,为了保证获取到的音频信息的清晰度以及后续对音频信息处理的准确性,采用至少两个音频采集器获取音频信息,并将至少两个音频采集器设置在不同的位置。根据获取到的音频信息中的内容,确定音频信息中包括的满足确定条件的声源,作为候选声源;例如说声音响度达到响度阈值的声源为满足确定条件的声源,以此排除声音信号弱的声源,提高对声源处理的效率。由于在本专利技术中是利用采集到的音频信息确定候选声源,因此在本专利技术中对于音频采集器的数量并不限制,通过一个音频采集器或者多个音频采集器获取音频信息均在本专利技术的保护范围内。
[0035]示例性的,在本专利技术实施例中,采用两个麦克风采集音频信息,并根据音频信息中的信号能量信息确定该段音频信息中共有三个发声点,将这三个发声点作为候选声源。例如,可以根据音频信号到达麦克风的距离区分不同的候选声源。
[0036]步骤102、定位所述候选声源的声源位置。
[0037]采用声源定位技术确定候选声源的声源位置。示例性的,采用TDOA技术(Time Difference of Arrival,到达时间差)和ILD(Interaural Level Difference,耳间强度差)对音频信息进行声源定位确定候选声源的位置信息。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声源音频的管理方法,其特征在于,由音频采集端执行,包括:通过音频采集器获取音频信息,根据所述音频信息确定至少一个候选声源;其中,所述音频采集器设置于音频采集端;定位所述候选声源的声源位置;根据从管理端接收的目标增强区域,判断所述候选声源的声源位置是否在所述目标增强区域中;若是,则确定在所述目标增强区域中的候选声源为目标声源,并确定所述目标声源的音频信息增强系数;所述音频信息增强系数用于供所述管理端对目标声源的音频信息进行增强处理。2.根据权利要求1所述的方法,其特征在于,在定位所述候选声源的声源位置之后,所述方法还包括:根据所述至少一个候选声源的声源位置,对所述至少一个候选声源进行标记,得到标记结果;缓存并发送携带所述标记结果的音频信息,用于供管理端根据携带所述标记结果的音频信息确定目标增强区域;其中,携带所述标记结果的音频信息是根据标记结果将所述候选声源进行分区缓存的。3.根据权利要求2所述的方法,其特征在于,携带所述标记结果的音频信息中还缓存有所述候选声源的声源位置。4.根据权利要求1所述的方法,其特征在于,确定所述目标声源的音频信息增强系数,包括:根据所述目标声源与目标增强区域之间的位置关系,确定目标声源的音频信息增强系数。5.根据权利要求4所述的方法,其特征在于,根据所述目标声源与目标增强区域之间的位置关系,确定目标声源的音频信息增强系数,包括:具体采用如下公式计算:具体采用如下公式计算:其中,d
i
表示第i个目标声源的声源位置距离所述目标增强区域的中心位置的距离,(x
i
,y
i
)表示第i个目标声源的声源位置,(x
s
,y
s
)表示所述目标增强区域的中心位置;w
i

【专利技术属性】
技术研发人员:傅丽琴陈继东詹国松陈希平
申请(专利权)人:浙江宇视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1