音频处理方法、装置、设备及存储介质制造方法及图纸

技术编号:30763795 阅读:33 留言:0更新日期:2021-11-10 12:18
本发明专利技术实施例涉及一种音频处理方法、装置、设备及存储介质,包括:通过第一设备接收第一语音和第二语音;确定第一语音对应的第一信号参数集合,以及第二语音对应的第二信号参数集合;对比第一信号参数与第二信号参数的信号强弱以确定第一语音和第二语音的信号强度,选择第一语音和第二语音中信号强度最大的一个作为目标语音;对第一语音和第二语音进行语音活动检测,得到检测结果;根据检测结果和目标语音对第一设备当前的传输语音进行控制,传输语音为第一语音或第二语音,通过检测信号参数判断是否需要进行传输语音的切换,避免出现收到语音直接进行切换造成的语音波动的情况,以及通过语音活动检测避免出现语音中断提升语音传输的稳定性。音传输的稳定性。音传输的稳定性。

【技术实现步骤摘要】
音频处理方法、装置、设备及存储介质


[0001]本专利技术实施例涉及音频处理领域,尤其涉及一种音频处理方法、装置、设备及存储介质。

技术介绍

[0002]目前,随着远程通讯需求的日益加强,会议系统已逐渐成为大众远程会议的主要媒介,但是传统电话会议机形态笨重,便携性差,近年来会议系统的相关产品逐渐向小型化发展,越来越多大众选择使用小型会议宝产品进行远程多人会议,该会议宝产品可同时多方通话提供高质、快捷、高效的音频会议服务。
[0003]相关技术中,会议宝产品使用范围较小,声音功率不大,若在一个较大会议室中连接至少两个会议宝以保证整个会议室的参会人员均可听到会议内容,但是会议宝之间会存在音频干扰(例如,会议宝会A同时收到会议宝会A收到的声音以及会议宝会B发送给会议宝会A的声音,会议宝A若同时传输这两种语音,则会出现音频干扰的情况),会降低音频会议的体验。

技术实现思路

[0004]鉴于此,为解决上述技术问题或部分技术问题,本专利技术实施例提供一种音频处理方法、装置、设备及存储介质。
[0005]第一方面,本专利技术实施例提供一种音频处理方法,包括:
[0006]第一设备接收第一语音和第二语音,其中,所述第一语音为第一设备接收到的语音,所述第二语音为第二设备接收到的、且发送给第一设备的语音;
[0007]确定所述第一语音对应的第一信号参数集合,以及所述第二语音对应的第二信号参数集合,所述第一信号参数集合包括多个第一信号参数,所述第二信号参数集合包括多个第二信号参数,所述第一信号参数和所述第二信号参数均用于指示信号强弱;
[0008]对比所述第一信号参数与所述第二信号参数的信号强弱以确定所述第一语音和第二语音的信号强度,选择所述第一语音和所述第二语音中信号强度最大的一个作为目标语音;
[0009]对所述第一语音和所述第二语音进行语音活动检测,得到检测结果;
[0010]根据所述检测结果和所述目标语音对所述第一设备当前的传输语音进行控制,所述传输语音为所述第一语音或所述第二语音。
[0011]在一个可能的实施方式中,所述根据所述检测结果和所述目标语音对所述第一设备当前的传输语音进行控制,包括:
[0012]若所述检测结果为所述第一语音或所述第二语音中存在有话帧,则控制所述第一设备保持当前的所述传输语音不变;若所述检测结果为所述第一语音和所述第二语音中均不存在有话帧,则判断所述目标语音与所述传输语音是否相同;在所述目标语音与所述传输语音不同时,控制所述第一设备将当前的所述传输语音切换为所述目标语音;在所述目
标语音与所述传输语音相同时,控制所述第一设备保持当前的所述传输语音不变。
[0013]在一个可能的实施方式中,所述确定所述第一语音对应的第一信号参数集合,以及所述第二语音对应的第二信号参数集合,包括:
[0014]对所述第一语音和第二语音进行预处理,得到所述第一语音对应的多帧语音信号,以及所述第二语音对应的多帧语音信号,其中,所述预处理至少包括:分帧处理和下采样处理;
[0015]确定所述第一语音中每帧语音信号对应的第一信号参数,得到第一信号参数集合,所述第一信号参数集合中的每个所述第一信号参数携带有第一时序信息,所述第一时序信息与所述第一语音中每帧语音信号的时序相同;
[0016]确定所述第二语音中每帧语音信号对应的第二信号参数,得到第二信号参数集合,所述第二信号参数集合中的每个所述第二信号参数携带有第二时序信息,所述第二时序信息与所述第二语音中每帧语音信号的时序相同。
[0017]在一个可能的实施方式中,所述对比所述第一信号参数与所述第二信号参数的信号强弱以确定所述第一语音和第二语音的信号强度,选择所述第一语音和所述第二语音中信号强度最大的一个作为目标语音,包括:
[0018]在第一时序信息与第二时序信息一致的情况下,对所述第一语音中每帧语音信号对应的第一信号参数和所述第二语音中每帧语音信号的第二信号参数对应的信号强弱进行比对;
[0019]从所述第一语音或第二语音中确定一帧或连续多帧语音信号对应的信号参数对应的信号强度最大的作为目标语音。
[0020]在一个可能的实施方式中,所述第一信号参数包括信噪比,所述第二信号参数包括信噪比;
[0021]所述确定所述第一语音中每帧语音信号对应的第一信号参数,包括:
[0022]采用维纳滤波对所述第一语音中的每帧语音信号进行滤波处理;
[0023]确定滤波后的所述第一语音中的每帧语音信号对应的第一信噪比;
[0024]所述确定所述第二语音中每帧语音信号对应的第二信号参数,包括:
[0025]采用维纳滤波对所述第二语音中的每帧语音信号进行滤波处理;
[0026]确定滤波后的所述第二语音中的每帧语音信号对应的第二信噪比。
[0027]在一个可能的实施方式中,所述方法还包括:
[0028]在根据时序信息确定所述第一语音和所述第二语音存在延迟时,通过互相关函数确定所述第一语音和所述第二语音之间的延迟时间;
[0029]基于所述延迟时间执行所述第一语音和所述第二语音的时间对齐操作。
[0030]在一个可能的实施方式中,所述方法还包括:在所述第一设备当前的所述传输语音执行切换操作过程中,控制当前的所述传输语音淡出以及控制所述目标语音淡入,以使由所述传输语音切换至所述目标语音的过程趋于平滑。
[0031]第二方面,本专利技术实施例提供一种音频处理装置,包括:
[0032]接收模块,用于接收第一语音和第二语音,其中,所述第一语音为第一设备接收到的语音,所述第二语音为第二设备接收到的、且发送给第一设备的语音;
[0033]第一确定模块,用于确定所述第一语音对应的第一信号参数集合,以及所述第二
语音对应的第二信号参数集合,所述第一信号参数集合包括多个第一信号参数,所述第二信号参数集合包括多个第二信号参数,所述第一信号参数和所述第二信号参数均用于指示信号强弱;
[0034]第二确定模块,用于对比所述第一信号参数与所述第二信号参数的信号强弱以确定所述第一语音和第二语音的信号强度,选择所述第一语音和所述第二语音中信号强度最大的一个作为目标语音;
[0035]检测模块,用于对所述第一语音和所述第二语音进行语音活动检测,得到检测结果;
[0036]控制模块,用于根据所述检测结果和所述目标语音对所述第一设备当前的传输语音进行控制,所述传输语音为所述第一语音或所述第二语音。
[0037]第三方面,本专利技术实施例提供一种设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的音频处理程序,以实现上述第一方面中任一项所述的音频处理方法。
[0038]第四方面,本专利技术实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面中任一项所述的音频处理方法。
[0039]本专利技术实施例提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:第一设备接收第一语音和第二语音,其中,所述第一语音为第一设备接收到的语音,所述第二语音为第二设备接收到的、且发送给第一设备的语音;确定所述第一语音对应的第一信号参数集合,以及所述第二语音对应的第二信号参数集合,所述第一信号参数集合包括多个第一信号参数,所述第二信号参数集合包括多个第二信号参数,所述第一信号参数和所述第二信号参数均用于指示信号强弱;对比所述第一信号参数与所述第二信号参数的信号强弱以确定所述第一语音和第二语音的信号强度,选择所述第一语音和所述第二语音中信号强度最大的一个作为目标语音;对所述第一语音和所述第二语音进行语音活动检测,得到检测结果;根据所述检测结果和所述目标语音对所述第一设备当前的传输语音进行控制,所述传输语音为所述第一语音或所述第二语音。2.根据权利要求1所述的方法,其特征在于,所述根据所述检测结果和所述目标语音对所述第一设备当前的传输语音进行控制,包括:若所述检测结果为所述第一语音或所述第二语音中存在有话帧,则控制所述第一设备保持当前的所述传输语音不变;若所述检测结果为所述第一语音和所述第二语音中均不存在有话帧,则判断所述目标语音与所述传输语音是否相同;在所述目标语音与所述传输语音不同时,控制所述第一设备将当前的所述传输语音切换为所述目标语音;在所述目标语音与所述传输语音相同时,控制所述第一设备保持当前的所述传输语音不变。3.根据权利要求1所述的方法,其特征在于,所述确定所述第一语音对应的第一信号参数集合,以及所述第二语音对应的第二信号参数集合,包括:对所述第一语音和第二语音进行预处理,得到所述第一语音对应的多帧语音信号,以及所述第二语音对应的多帧语音信号,其中,所述预处理至少包括:分帧处理和下采样处理;确定所述第一语音中每帧语音信号对应的第一信号参数,得到第一信号参数集合,所述第一信号参数集合中的每个所述第一信号参数携带有第一时序信息,所述第一时序信息与所述第一语音中每帧语音信号的时序相同;确定所述第二语音中每帧语音信号对应的第二信号参数,得到第二信号参数集合,所述第二信号参数集合中的每个所述第二信号参数携带有第二时序信息,所述第二时序信息与所述第二语音中每帧语音信号的时序相同。4.根据权利要求3所述的方法,其特征在于,所述对比所述第一信号参数与所述第二信号参数的信号强弱以确定所述第一语音和第二语音的信号强度,选择所述第一语音和所述第二语音中信号强度最大的一个作为目标语音,包括:在第一时序信息与第二时序信息一致的情况下,对所述第一语音中每帧语音信号对应的第一信号参数和所述第二语音中每帧语...

【专利技术属性】
技术研发人员:吴泰云何宇术
申请(专利权)人:深圳海翼智新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1