一种多通道音频信号获取方法、装置及系统制造方法及图纸

技术编号:32851944 阅读:13 留言:0更新日期:2022-03-30 19:09
本发明专利技术实施例公开了一种多通道音频信号获取方法、装置及系统,可以采用分布式音频信号之间的关系,对环境声进行抑制处理,提高音频信号的录音效果。包括:获取主设备对目标拍摄物进行视频拍摄时所采集的主音频信号,并进行第一多通道渲染,得到环境多通道音频信号;以及获取目标拍摄物上的附加设备采集的音频信号,并确定第一附加音频信号;对第一附加音频信号和主音频信号进行环境声抑制处理,得到目标音频信号;对目标音频信号进行第二多通道渲染,得到目标多通道音频信号;将环境多通道音频信号和目标多通道音频信号进行混合,得到混合多通道音频信号。混合多通道音频信号。混合多通道音频信号。

【技术实现步骤摘要】
一种多通道音频信号获取方法、装置及系统


[0001]本专利技术涉及音频
,尤其涉及一种多通道音频信号获取方法、装置及系统。

技术介绍

[0002]随着技术的进步,人们对移动设备的摄影和录音效果提出了更高的需求。目前随着真无线立体声(true wireless stereo,TWS)蓝牙耳机的普及,出现了一种分布式音频捕获方案,该方案利用TWS蓝牙耳机上的麦克风,捕捉远离用户的高质量特写音频信号,并和主设备上的麦克风阵列采集的空间音频信号进行混合和双耳渲染,模拟了空间声场中的点状听觉目标,营造了一种更真实的沉浸式体验。但是这种方案只是将分布式的音频信号进行混合,并未对环境声进行抑制,在使用移动设备在有多个声源的场合或者比较嘈杂的环境中进行视频拍摄时,用户真正感兴趣的声音会和各个不相关声源混合在一起,甚至淹没在背景噪声之中,因此现有方案可能会由于环境声的影响,使得音频信号的录音效果较差。

技术实现思路

[0003]本专利技术实施例提供了一种多通道音频信号获取方法、装置及系统,可以采用分布式音频信号之间的关系,对环境声进行抑制处理,提高音频信号的录音效果。
[0004]为了解决上述技术问题,本专利技术实施例是这样实现的:
[0005]第一方面,本专利技术实施例提供一种多通道音频信号获取方法,包括:
[0006]获取主设备拍摄视频时采集的主音频信号,并进行多通道渲染,得到环境多通道音频信号;
[0007]获取附加设备采集的音频信号,并确定第一附加音频信号;其中,附加设备与目标拍摄物之间的距离小于第一阈值;
[0008]通过第一附加音频信号和主音频信号进行环境声抑制处理,得到目标音频信号;
[0009]对目标音频信号进行多通道渲染,得到目标多通道音频信号;
[0010]将环境多通道音频信号和目标多通道音频信号进行混合,得到混合多通道音频信号。
[0011]第二方面,提供一种多通道音频信号获取装置,包括:
[0012]获取模块,用于获取主设备对目标拍摄物进行视频拍摄时所采集的主音频信号,并进行第一多通道渲染,得到环境多通道音频信号;获取附加设备采集的音频信号,并确定第一附加音频信号,其中,所述附加设备与所述目标拍摄物之间的距离小于第一阈值;
[0013]处理模块,用于通过第一附加音频信号和主音频信号进行环境声抑制处理,得到目标音频信号;
[0014]对目标音频信号进行多通道渲染,得到目标多通道音频信号;
[0015]将环境多通道音频信号和目标多通道音频信号进行混合,得到混合多通道音频信号。
[0016]第三方面,提供一种终端设备,包括:处理器、存储器及存储在存储器上并可在处
理器上运行的计算机程序,计算机程序被处理器执行时实现如第一方面的多通道音频信号获取方法。
[0017]第四方面,提供一种终端设备,包括:如第二方面的多通道音频信号获取装置和主设备,
[0018]主设备,用于在拍摄视频时采集主音频信号,并将主音频信号发送至多通道音频信号获取装置。
[0019]第五方面,提供一种多通道音频信号获取系统,该系统包括:如第二方面的多通道音频信号获取装置、主设备和附加设备,主设备和附加设备分别与多通道音频信号建立通信连接;
[0020]主设备,用于在拍摄视频时采集主音频信号,并将主音频信号发送至多通道音频信号获取装置;
[0021]附加设备,用于采集第二附加音频信号,并将第二附加音频信号发送至多通道音频信号获取装置;
[0022]其中,所述附加设备与所述目标拍摄物之间的距离小于第一阈值。
[0023]第六方面,提供一种计算机可读存储介质,包括:计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如第一方面的多通道音频信号获取方法。
[0024]本专利技术实施例中,可以获取主设备拍摄视频时采集的主音频信号,并进行多通道渲染,得到环境多通道音频信号;以及获取与目标拍摄物之间的距离小于第一阈值的附加设备采集的音频信号,确定第一附加音频信号;通过第一附加音频信号和主音频信号进行环境声抑制处理,得到目标音频信号;对目标音频信号进行多通道渲染,得到目标多通道音频信号;将环境多通道音频信号和目标多通道音频信号进行混合,得到混合多通道音频信号。通过该方案,可以从主设备和附加设备处获取分布式音频信号,并且可以利用分布式音频信号之间的关系,根据附加设备采集的音频信号所得到的第一附加音频信号和主设备采集的主音频信号,进行环境声抑制处理,以抑制录音过程中的环境声,得到目标多通道音频信号,然后在将环境多通道音频信号(对主音频信号进行多通道渲染得到的)与目标多通道音频信号进行混合时,不仅实现了将分布式的音频信号进行混合,模拟了空间声场中的点状听觉目标,并且还对环境声进行了抑制,从而可以提高音频信号的录音效果。
附图说明
[0025]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,还可以根据这些附图获得其它的附图。
[0026]图1所示为本专利技术实施例提供的一种多通道音频信号获取系统的示意图;
[0027]图2A所示为本专利技术实施例提供的一种多通道音频信号获取方法的示意图一;
[0028]图2B所示为本专利技术实施例提供的一种终端设备的界面示意图;
[0029]图3所示为本专利技术实施例提供的一种多通道音频信号获取方法的示意图二;
[0030]图4所示为本专利技术实施例提供的一种多通道音频信号获取装置的示意图;
[0031]图5所示为本专利技术实施例提供的一种终端设备的结构示意图;
[0032]图6所示为本专利技术实施例提供的一种终端设备的硬件结构示意图。
具体实施方式
[0033]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]在本专利技术实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本专利技术实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。此外,在本专利技术实施例的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
[0035]本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
[0036]本专利技术实施例提供一种多通道音频信号获取方法、装置及系统,可以应用在视频拍摄场景中,尤其可以应用在多个声源的场合或者比较嘈杂的环境中进行视频拍摄,可以实现将分布式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多通道音频信号获取方法,其特征在于,包括:获取主设备对目标拍摄物进行视频拍摄时所采集的主音频信号,并进行第一多通道渲染,得到环境多通道音频信号;获取附加设备所采集的音频信号,确定第一附加音频信号,其中,所述附加设备与所述目标拍摄物之间的距离小于第一阈值;对所述第一附加音频信号和所述主音频信号进行环境声抑制处理,得到目标音频信号;对所述目标音频信号进行第二多通道渲染,得到目标多通道音频信号;以及将所述环境多通道音频信号和所述目标多通道音频信号进行混合,得到混合多通道音频信号。2.根据权利要求1所述的方法,其特征在于,所述将所述环境多通道音频信号和目标多通道音频信号进行混合,得到混合多通道音频信号,包括:根据所述主设备的拍摄参数,确定所述环境多通道音频信号的第一增益和所述目标多通道音频信号的第二增益;根据所述第一增益与所述第二增益,将所述环境多通道音频信号和目标多通道音频信号进行混合,得到混合多通道音频信号。3.根据权利要求1所述的方法,其特征在于,所述获取主设备对目标拍摄物进行视频拍摄时所采集的主音频信号,并进行第一多通道渲染,得到环境多通道音频信号,包括:获取所述主设备上的麦克风阵列采集的主音频信号;根据所述主设备上的麦克风阵列阵型生成第一多通道传递函数;根据所述第一多通道传递函数,对所述主音频信号进行第一多通道渲染得到所述环境多通道音频信号。4.根据权利要求1所述的方法,其特征在于,所述获取附加设备所采集的音频信号,确定第一附加音频信号,包括:获取所述附加设备采集的第二附加音频信号,将所述第二附加音频信号确定为所述第一附加音频信号;或者,获取所述附加设备采集的第二附加音频信号,将所述第二附加音频信号与所述主音频信号在时域上对齐,得到所述第一附加音频信号。5.根据权利要求4所述的方法,其特征在于,所述将所述第二附加音频信号与所述主音频信号在时域上对齐,得到所述第一附加音频信号,包括:获取所述目标拍摄物与所述主设备之间的目标方位角;确定所述主音频信号与所述第二附加音频信号之间的目标时延;根据所述目标时延,将所述第二附加音频信号与所述主音频信号在时域上对齐,得到所述第一附加音频信号。6.根据权利要求1所述的方法,其特征在于,所述对所述目标音频信号进行第二多通道渲染,得到目标多通道音频信号,包括:获取所述目标拍摄物与所述主设备之间的目标距离和目标方位角;根据所述目标距离和所述目标方位角,生成第二多通道传递函数;根据所述第二多通道传递函数对所述目标音频信号进行第二多通道渲染,得到目标多
通道音频信号。7.根据权利要求6所述的方法,其特征在于,当检测到所述目标拍摄物处于所述主设备的拍摄视野内时,所述获取所述目标拍摄物与所述主设备之间的目标方位角,包括:根据所述主设备获取的视频信息和拍摄参数,确定所述目标拍摄物与所述主设备之间的第一方位角;获取所述第二附加音频信号的第一活跃时间和第一距离,所述第一距离为上一次确定的所述目标拍摄物与所述主设备之间的目标距离;根据所述第一活跃时间和所述第一距离,确定所述主音频信号的第二活跃时间;使用所述第二活跃时间内的主音频信号进行到达角估计,得到所述目标拍摄物与所述主设备之间的第二方位角;将所述第一方位角与所述第二方位角进行平滑处理,得到所述目标方位角。8.根据权利要求7或所述的方法,其特征在于,所述获取所述目标拍摄物与所述主设备之间的目标距离,包括:根据所述主设备获取的视频信息,确定所述目标拍摄物与所述主设备之间的第二距离;根据所述第二距离和声速,计算得到第二时延;对所述主音频信号进行朝向所述目标方位角的波束形成处理,得到波束形成信号;确定所述波束形成信号与所述第二附加音频信号之间的第一时延;将所述第二时延与所述第一时延进行平滑处理,得到目标时延;根据所述目标时延和声速,计算所述目标距离。9.根据权利要求1至8中任一项所述的方法,其特征在于,当检测到所述目标拍摄物处于所述主设备的拍摄视野内时,所述通过所述第一附加音频信号和所述主音频信号进行环境声抑制处理,得到目标音频信号,包括:根据所述主设备的拍摄视野,对所述主音频信号在所述拍摄视野以外区域进行空间滤波,得到反向聚焦音频信号;将所述反向聚焦音频信号作为参考信...

【专利技术属性】
技术研发人员:王文东
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1