声音信号的处理方法、相关设备及可读存储介质技术

技术编号:24038362 阅读:26 留言:0更新日期:2020-05-07 02:35
本申请公开了一种声音信号的处理方法、相关设备及可读存储介质,通过根据所述当前帧的前一帧在所述第二拾音区域的第一输出波束信号,从所述第二波束信号集合中确定至少一个第一参考波束信号;基于所述参考波束信号,滤除所述第一波束信号中包含的第二拾音区域内的信息,得到处理后的第一波束信号集合;可以实现对于参考波束信号的实时更新,因此,采用本申请的声音信号的处理方法进行语音分离,可以提高分离后的声音信号的清晰度。

Sound signal processing method, related equipment and readable storage medium

【技术实现步骤摘要】
声音信号的处理方法、相关设备及可读存储介质
本申请涉及信号处理
,更具体的说,是涉及一种声音信号的处理方法、相关设备及可读存储介质。
技术介绍
随着语音识别技术的发展,越来越多的场景下需要进行语音录制,以方便用户回听。但是,有些场景下,语音是由多种用户角色产生的,这种情况下,就需要对语音按照不同用户角色进行分离。比如,检查机关在审讯过程中,审讯全程的语音,会涉及审讯人和被审讯人两种用户角色,这种情况下,就需要对审讯全程的语音按照审讯人和被审讯人两种用户角色进行分离。但是,现有技术中,对于语音进行分离的方法,分离后得到的语音效果并不理想。因此,对现有技术中的语音分离方法进行优化显得尤为必要。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种声音信号的处理方法、相关设备及可读存储介质。具体方案如下:一种声音信号的处理方法,包括:获取当前帧的第一波束信号集合和第二波束信号集合;所述第一波束信号集合包括多个第一波束信号,所述第一波束信号的波束朝向分布于麦克风阵列的第一拾音区域;所述第二波束信号集合包括多个第二波束信号,所述第二波束信号的波束朝向分布于所述麦克风阵列的第二拾音区域;根据所述当前帧的前一帧在所述第二拾音区域的第一输出波束信号,从所述第二波束信号集合中确定至少一个第一参考波束信号;基于所述参考波束信号,滤除所述第一波束信号中包含的第二拾音区域内的信息,得到处理后的第一波束信号集合;基于所述处理后的第一波束信号集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号。可选地,所述从所述第二波束信号集合中确定至少一个第一参考波束信号,具体包括:获取所述第一输出波束信号的波束标识;所述波束标识用于标识所述第二拾音区域的波束信号;将所述波束标识对应的波束信号确定为所述第一参考波束信号。可选地,所述确定所述当前帧在所述第一拾音区域的第二输出波束信号,具体包括:确定与所述当前帧对应的多个时间窗;确定每个时间窗内所述第一拾音区域中的最大能量波束,得到最大能量波束集合;基于所述最大能量波束集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号。可选地,所述基于所述最大能量波束集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号,具体包括:确定所述最大能量波束集合中各个最大能量波束的权重;根据所述权重,对所述处理后的第一波束信号集合中的各个波束信号进行加权,得到所述第二输出波束信号。可选地,所述确定每个时间窗内所述第一拾音区域中的最大能量波束之后,还包括:记录所述最大能量波束集合中的每个最大能量波束对应的波束标识,以便后续从所述当前帧的后一帧的第一波束信号集合中确定参考波束信号。可选地,所述方法还包括:当所述当前帧为所述麦克风阵列采集的声音信号的第一帧时,从所述第二波束信号集合中随机选取至少一个波束信号作为参考波束信号。可选地,所述第一拾音区域为第一方说话人对应的拾音区域,或,第二方说话人对应的拾音区域。一种声音信号的处理装置,包括:获取单元,用于获取当前帧的第一波束信号集合和第二波束信号集合;所述第一波束信号集合包括多个第一波束信号,所述第一波束信号的波束朝向分布于麦克风阵列的第一拾音区域;所述第二波束信号集合包括多个第二波束信号,所述第二波束信号的波束朝向分布于所述麦克风阵列的第二拾音区域;参考波束信号第一确定单元,用于根据所述当前帧的前一帧在所述第二拾音区域的第一输出波束信号,从所述第二波束信号集合中确定至少一个第一参考波束信号;滤除单元,用于基于所述参考波束信号,滤除所述第一波束信号中包含的第二拾音区域内的信息,得到处理后的第一波束信号集合;确定单元,用于基于所述处理后的第一波束信号集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号。可选地,所述参考波束信号第一确定单元,具体用于:获取所述第一输出波束信号的波束标识;所述波束标识用于标识所述第二拾音区域的波束信号;将所述波束标识对应的波束信号确定为所述第一参考波束信号。可选地,所述确定单元,具体包括:时间窗确定单元,用于确定与所述当前帧对应的多个时间窗;最大能量波束集合确定单元,用于确定每个时间窗内所述第一拾音区域中的最大能量波束,得到最大能量波束集合;确定子单元,用于基于所述最大能量波束集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号。可选地,所述确定子单元,具体用于:确定所述最大能量波束集合中各个最大能量波束的权重;根据所述权重,对所述处理后的第一波束信号集合中的各个波束信号进行加权,得到所述第二输出波束信号。可选地,所述装置还包括:记录单元,用于在确定每个时间窗内所述第一拾音区域中的最大能量波束之后,记录所述最大能量波束集合中的每个最大能量波束对应的波束标识,以便后续从所述当前帧的后一帧的第一波束信号集合中确定参考波束信号。可选地,所述装置还包括:参考波束信号第二确定单元,用于当所述当前帧为所述麦克风阵列采集的声音信号的第一帧时,从所述第二波束信号集合中随机选取至少一个波束信号作为参考波束信号。可选地,所述第一拾音区域为第一方说话人对应的拾音区域,或,第二方说话人对应的拾音区域。一种声音信号的处理设备,包括存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现如上所述的声音信号的处理方法的各个步骤。一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如上所述的声音信号的处理方法的各个步骤。借由上述技术方案,本申请公开了一种声音信号的处理方法、相关设备及可读存储介质,通过根据所述当前帧的前一帧在所述第二拾音区域的第一输出波束信号,从所述第二波束信号集合中确定至少一个第一参考波束信号;基于所述参考波束信号,滤除所述第一波束信号中包含的第二拾音区域内的信息,得到处理后的第一波束信号集合;可以实现对于参考波束信号的实时更新,因此,采用本申请的声音信号的处理方法进行语音分离,可以提高分离后的声音信号的清晰度。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本申请实施例公开的声音信号的处理方法的流程示意图;图2为本申请实施例公开的一种拾音区域划分示意图;图3为本申请实施例公开的一种时间窗示意图;图4为本申请实施例公开的一种声音信号的处理装置结构示意图;图5为本申请实施例公开的声音信号的处理设备的硬件结构框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整本文档来自技高网...

【技术保护点】
1.一种声音信号的处理方法,其特征在于,包括:/n获取当前帧的第一波束信号集合和第二波束信号集合;所述第一波束信号集合包括多个第一波束信号,所述第一波束信号的波束朝向分布于麦克风阵列的第一拾音区域;所述第二波束信号集合包括多个第二波束信号,所述第二波束信号的波束朝向分布于所述麦克风阵列的第二拾音区域;/n根据所述当前帧的前一帧在所述第二拾音区域的第一输出波束信号,从所述第二波束信号集合中确定至少一个第一参考波束信号;/n基于所述参考波束信号,滤除所述第一波束信号中包含的第二拾音区域内的信息,得到处理后的第一波束信号集合;/n基于所述处理后的第一波束信号集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号。/n

【技术特征摘要】
1.一种声音信号的处理方法,其特征在于,包括:
获取当前帧的第一波束信号集合和第二波束信号集合;所述第一波束信号集合包括多个第一波束信号,所述第一波束信号的波束朝向分布于麦克风阵列的第一拾音区域;所述第二波束信号集合包括多个第二波束信号,所述第二波束信号的波束朝向分布于所述麦克风阵列的第二拾音区域;
根据所述当前帧的前一帧在所述第二拾音区域的第一输出波束信号,从所述第二波束信号集合中确定至少一个第一参考波束信号;
基于所述参考波束信号,滤除所述第一波束信号中包含的第二拾音区域内的信息,得到处理后的第一波束信号集合;
基于所述处理后的第一波束信号集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号。


2.根据权利要求1所述的方法,其特征在于,所述从所述第二波束信号集合中确定至少一个第一参考波束信号,具体包括:
获取所述第一输出波束信号的波束标识;所述波束标识用于标识所述第二拾音区域的波束信号;
将所述波束标识对应的波束信号确定为所述第一参考波束信号。


3.根据权利要求1所述的方法,其特征在于,所述确定所述当前帧在所述第一拾音区域的第二输出波束信号,具体包括:
确定与所述当前帧对应的多个时间窗;
确定每个时间窗内所述第一拾音区域中的最大能量波束,得到最大能量波束集合;
基于所述最大能量波束集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号。


4.根据权利要求3所述的方法,其特征在于,所述基于所述最大能量波束集合,确定所述当前帧在所述第一拾音区域的第二输出波束信号,具体包括:
确定所述最大能量波束集合中各个最大能量波束的权重;
根据所述权重,对所述处理后的第一波束信号集合中的各个波束信号进行加权,得到所述第二输出波束信号。


5.根据权利要求3所述的方法,其特征在于,所述确定每个时间窗内所...

【专利技术属性】
技术研发人员:张健赵湘高素云付中华王海坤
申请(专利权)人:西安讯飞超脑信息科技有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1