一种音频数据处理方法以及相关设备技术

技术编号:19829283 阅读:26 留言:0更新日期:2018-12-19 17:07
本发明专利技术实施例公开了一种音频数据处理方法以及相关设备,其中方法包括:获取至少两个原始音频数据,将各原始音频数据分别输入至对应的滤波器组;每个滤波器组均包括基于第一声道的滤波器和基于第二声道的滤波器;不同的滤波器组输出的音频数据对应的三维方位互不相同;基于第一声道的滤波器输出第一声道音频数据;基于第二声道的滤波器输出第二声道音频数据;将输出的多个第一声道音频数据进行混音,得到第一声道混音数据,并将输出的多个第二声道音频数据进行混音,得到第二声道混音数据;对第一声道混音数据和第二声道混音数据进行播放。采用本发明专利技术,可以为不同的原始音频数据设置不同的声音方位感,以丰富音频播放效果。

【技术实现步骤摘要】
一种音频数据处理方法以及相关设备
本专利技术涉及计算机
,尤其涉及一种音频数据处理方法以及相关设备。
技术介绍
目前的FIR(FiniteImpulseResponse,有限冲激响应)滤波器是数字信号处理系统中最基本的元件,它可以在保证任意幅频特性的同时具有严格的线性相频特性,同时其单位抽样响应是有限长的,因而滤波器是稳定的系统。因此,FIR滤波器在通信、图像处理、模式识别等领域都有着广泛的应用目前的FIR滤波器在滤波过程中,通常有两种处理方式:直接线性卷积和快速卷积。直接线性卷积的计算结构是点入点出,无须组帧,因此不会带来组帧所造成的时延,但是当FIR滤波器中的单位冲激响应的长度过长时,直接线性卷积将会带来巨大的运算量。虽然采用快速卷积可以减少许多运算量,但是在快速卷积的过程中需要进行组帧,即需要等到输入数据的长度与单位冲激响应的长度相近似的时候才能开始运算,因此,当单位冲激响应的长度过长时,组帧所造成的时延将会很大,导致快速卷积无法在有实时性要求的场合进行使用。
技术实现思路
本专利技术实施例提供一种音频数据处理方法以及相关设备,可以在滤波过程中对运算量和组帧延时进行均衡控制,以提高滤波处理效率。本专利技术实施例的第一方面提供了一种数据滤波方法,包括:获取输入到第一滤波器的输入样点,并累计由多个输入样点所构成的输入序列的长度;所述第一滤波器包括第一单位冲激响应;若所述输入序列的长度达到预设的组帧延时长度,则对所述输入序列和所述第一单位冲激响应进行基于长短序列的分段快速卷积计算,得到所述输入序列对应的输出结果;所述第一单位冲激响应的长度大于所述组帧延时长度;所述输入序列为短序列,所述第一单位冲激响应为长序列。其中,所述若所述输入序列的长度达到预设的组帧延时长度,则对所述输入序列和所述第一单位冲激响应进行基于长短序列的分段快速卷积计算,得到所述输入序列对应的输出结果,包括:若所述输入序列的长度达到预设的组帧延时长度,则根据所述组帧延时长度对所述第一单位冲激响应进行分段,得到多个单位冲激响应分段;各单位冲激响应分段的长度与所述组帧延时长度之间的差值均处于预设的差值区间内;将所述输入序列分别与所述各单位冲激响应分段进行快速卷积计算,得到所述各单位冲激响应分段分别对应的线性卷积结果;将所述各单位冲激响应分段分别对应的线性卷积结果进行相加,得到所述输入序列对应的输出结果。其中,所述组帧延时长度大于或等于32。其中,所述输入序列为第一通话设备发送的第一原始通话数据,所述输出结果为所述第一滤波器输出的第一声道通话数据;则所述方法还包括:若同步输入至第二滤波器的所述输入序列的长度达到所述组帧延时长度,则对所述输入序列和所述第二滤波器的第二单位冲激响应进行基于长短序列的分段快速卷积计算,得到所述输入序列对应的第二声道通话数据;所述第二单位冲激响应的长度大于所述组帧延时长度;所述输入序列为短序列,所述第二单位冲激响应为长序列;对所述输入序列对应的第一声道通话数据和第二声道通话数据进行播放。其中,所述对所述输入序列对应的第一声道通话数据和第二声道通话数据进行播放,包括:若在接收到所述第一原始通话数据的同时,还接收到第二通话设备发送的第二原始通话数据,则将所述输入序列对应的第一声道通话数据与所述第二通话设备对应的第一声道通话数据进行混音,得到第一声道混音数据;所述第二通话设备对应的第一声道通话数据是由第三滤波器对所述第二原始通话数据进行基于长短序列的分段快速卷积后输出得到;将所述输入序列对应的第二声道通话数据与所述第二通话设备对应的第二声道通话数据进行混音,得到第二声道混音数据;所述第二通话设备对应的第二声道通话数据是由第四滤波器对所述第二原始通话数据进行基于长短序列的分段快速卷积后输出得到;对所述第一声道混音数据和所述第二声道混音数据进行播放。本专利技术实施例的第二方面提供了一种多人语音通话方法,包括:获取至少两个通话设备发送的原始通话数据,将各通话设备发送的原始通话数据分别输入至对应的滤波器组;每个滤波器组均包括基于第一声道的滤波器和基于第二声道的滤波器;不同的滤波器组输出的音频数据对应的三维方位互不相同;通过所述基于第一声道的滤波器对所输入的原始通话数据进行三维音频处理,并输出第一声道通话数据;通过所述基于第二声道的滤波器对所输入的原始通话数据进行三维音频处理,并输出第二声道通话数据;将输出的多个第一声道通话数据进行混音,得到第一声道混音数据,并将输出的多个第二声道通话数据进行混音,得到第二声道混音数据;对所述第一声道混音数据和所述第二声道混音数据进行播放。其中,所述通过所述基于第一声道的滤波器对所输入的原始通话数据进行三维音频处理,并输出第一声道通话数据,包括:累计输入到所述基于第一声道的滤波器的原始通话数据所构成的输入序列的长度;若所述输入序列的长度达到预设的组帧延时长度,则根据所述组帧延时长度对所述基于第一声道的滤波器的单位冲激响应进行分段,得到多个单位冲激响应分段;各单位冲激响应分段的长度与所述组帧延时长度之间的差值均处于预设的差值区间内;所述单位冲激响应的长度大于所述组帧延时长度;将所述输入序列分别与所述各单位冲激响应分段进行快速卷积计算,得到所述各单位冲激响应分段分别对应的线性卷积结果;将所述各单位冲激响应分段分别对应的线性卷积结果进行相加,得到所述输入序列对应的第一声道通话数据。其中,所述通过所述基于第二声道的滤波器对所输入的原始通话数据进行三维音频处理,并输出第二声道通话数据,包括:累计已输入到所述基于第二声道的滤波器的原始通话数据所构成的输入序列的长度;若所述输入序列的长度达到预设的组帧延时长度,则根据所述组帧延时长度对所述基于第二声道的滤波器的单位冲激响应进行分段,得到多个单位冲激响应分段;各单位冲激响应分段的长度与所述组帧延时长度之间的差值均处于预设的差值区间内;所述单位冲激响应的长度大于所述组帧延时长度;将所述输入序列分别与所述各单位冲激响应分段进行快速卷积计算,得到所述各单位冲激响应分段分别对应的线性卷积结果;将所述各单位冲激响应分段分别对应的线性卷积结果进行相加,得到所述输入序列对应的第二声道通话数据。其中,所述组帧延时长度大于或等于32。本专利技术实施例的第三方面提供了一种数据滤波装置,包括:累计模块,用于获取输入到第一滤波器的输入样点,并累计由多个输入样点所构成的输入序列的长度;所述第一滤波器包括第一单位冲激响应;第一滤波模块,用于若所述输入序列的长度达到预设的组帧延时长度,则对所述输入序列和所述第一单位冲激响应进行基于长短序列的分段快速卷积计算,得到所述输入序列对应的输出结果;所述第一单位冲激响应的长度大于所述组帧延时长度;所述输入序列为短序列,所述第一单位冲激响应为长序列。其中,所述第一滤波模块包括:分段单元,用于若所述输入序列的长度达到预设的组帧延时长度,则根据所述组帧延时长度对所述第一单位冲激响应进行分段,得到多个单位冲激响应分段;各单位冲激响应分段的长度与所述组帧延时长度之间的差值均处于预设的差值区间内;快速卷积单元,用于将所述输入序列分别与所述各单位冲激响应分段进行快速卷积计算,得到所述各单位冲激响应分段分别对应的线性卷积结果;所述快速卷积单元,还用于将所述各单位冲激响应分段分本文档来自技高网...

【技术保护点】
1.一种音频数据处理方法,其特征在于,包括:获取至少两个原始音频数据,将各原始音频数据分别输入至对应的滤波器组;每个滤波器组均包括基于第一声道的滤波器和基于第二声道的滤波器;不同的滤波器组输出的音频数据对应的三维方位互不相同;通过所述基于第一声道的滤波器对所输入的原始音频数据进行音频处理,并输出第一声道音频数据;通过所述基于第二声道的滤波器对所输入的原始音频数据进行音频处理,并输出第二声道音频数据;将输出的多个第一声道音频数据进行混音,得到第一声道混音数据,并将输出的多个第二声道音频数据进行混音,得到第二声道混音数据;对所述第一声道混音数据和所述第二声道混音数据进行播放。

【技术特征摘要】
1.一种音频数据处理方法,其特征在于,包括:获取至少两个原始音频数据,将各原始音频数据分别输入至对应的滤波器组;每个滤波器组均包括基于第一声道的滤波器和基于第二声道的滤波器;不同的滤波器组输出的音频数据对应的三维方位互不相同;通过所述基于第一声道的滤波器对所输入的原始音频数据进行音频处理,并输出第一声道音频数据;通过所述基于第二声道的滤波器对所输入的原始音频数据进行音频处理,并输出第二声道音频数据;将输出的多个第一声道音频数据进行混音,得到第一声道混音数据,并将输出的多个第二声道音频数据进行混音,得到第二声道混音数据;对所述第一声道混音数据和所述第二声道混音数据进行播放。2.如权利要求1所述的方法,其特征在于,所述通过所述基于第一声道的滤波器对所输入的原始音频数据进行三维音频处理,并输出第一声道音频数据,包括:累计输入到所述基于第一声道的滤波器的原始音频数据所构成的输入序列的长度;若所述输入序列的长度达到预设的组帧延时长度,则根据所述组帧延时长度对所述基于第一声道的滤波器的单位冲激响应进行分段,得到多个单位冲激响应分段;各单位冲激响应分段的长度与所述组帧延时长度之间的差值均处于预设的差值区间内;所述单位冲激响应的长度大于所述组帧延时长度;将所述输入序列分别与所述各单位冲激响应分段进行快速卷积计算,得到所述各单位冲激响应分段分别对应的线性卷积结果;将所述各单位冲激响应分段分别对应的线性卷积结果进行相加,得到所述输入序列对应的第一声道音频数据。3.如权利要求1所述的方法,其特征在于,所述通过所述基于第二声道的滤波器对所输入的原始音频数据进行三维音频处理,并输出第二声道音频数据,包括:累计已输入到所述基于第二声道的滤波器的原始音频数据所构成的输入序列的长度;若所述输入序列的长度达到预设的组帧延时长度,则根据所述组帧延时长度对所述基于第二声道的滤波器的单位冲激响应进行分段,得到多个单位冲激响应分段;各单位冲激响应分段的长度与所述组帧延时长度之间的差值均处于预设的差值区间内;所述单位冲激响应的长度大于所述组帧延时长度;将所述输入序列分别与所述各单位冲激响应分段进行快速卷积计算,得到所述各单位冲激响应分段分别对应的线性卷积结果;将所述各单位冲激响应分段分别对应的线性卷积结果进行相加,得到所述输入序列对应的第二声道音频数据。4.一种音频数据处理装置,其特征在于,包括:获取模块,用于获取至少两个原始音频数据,将各原始音频数据分别输入至对应的滤波器组;每个滤波器组均包括基于第一声道的滤波器和基于第二声道的滤波器;不同的滤波器组输出的音频数据对应的三维方位互不相同;第一滤波模块,用于通过所述基于第一声道的滤波器对所输入的原始音频数据进行三维音频处理,并输出第一声道音频数据;第二滤波模块,用于通过所述基于第二声道的滤波器对所输入的原始音频数据进行三维音频处理,并输出第二声道音频数据;混音模块,用于将输出的多个第一声道音频数据进...

【专利技术属性】
技术研发人员:王天宝
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1