本发明专利技术提供了一种音频处理方法和装置,涉及音频技术领域。本发明专利技术提供的音频处理方法,包括针对待处理语音信号,获取语音增强模型的增益函数;对所述增益函数进行变换处理,得到目标增益函数;依据所述目标增益函数,对所述待处理语音信号的频谱数据进行处理,得到估计信号频谱数据;依据所述估计信号频谱数据生成目标语音信号。本发明专利技术实施例提供的音频处理方法和装置通过对增益函数进行变换处理,能够减少对语音的衰减,且保留保护语音不被过度衰减,提升语音增强效果。
【技术实现步骤摘要】
一种音频处理方法和装置
本专利技术涉及音频
,特别是涉及一种音频处理方法和装置。
技术介绍
随着科学技术的快速发展,诸如手机、平板电脑等设备越来越普及,给人们的生活、学习、工作带来了极大的便利。这些设备通常可以使用语音增强技术,对获取到的语音信号进行处理,以降低噪声干扰的影响。在现有语音增强技术中,单通道语音增强或多通道语音增强的后处理技术,都涉及在变换域计算增益函数,如在增益函数是一个Gain函数时,可以通过该Gain函数对原始信号频谱进行处理,得到估计信号的频谱,以依据该估计信号的频谱进行反变换,得到时域上的目标语音信号。其中,Gain函数的计算是现有大部分语音增强技术的核心内容。但是,Gain函数的计算依据语音处理中的中间变量,如信噪比(Signal-NoiseRatio,SNR)、信号功率谱等难以精确估计的参数,导致Gain函数对欲抑制的噪声的抑制能力较弱,影响语音增强效果。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种音频处理方法和一种音频处理装置。依据本专利技术的第一方面,提供了一种音频处理方法,该方法包括:针对待处理语音信号,获取语音增强模型的增益函数;对所述增益函数进行变换处理,得到目标增益函数;依据所述目标增益函数,对所述待处理语音信号的频谱数据进行处理,得到估计信号频谱数据;依据所述估计信号频谱数据生成目标语音信号。可选地,所述对所述增益函数进行变换处理,得到目标增益函数,包括:基于所述增益函数,确定所述待处理语音信号各时频点上增益函数的取值;基于所述取值对所述增益函数进行变换,得到目标增益函数,其中,所述目标增益函数在所述值域范围内为连续函数。可选地,所述待处理语音信号包括语音状态信号和/或非语音状态信号;所述取值包括:所述语音状态信号对应的第一取值和所述非语音状态信号对应的第二取值;所述目标增益函数在第一抑制范围内为凸函数,在第二抑制范围内为凹函数,其中,所述第一抑制范围为依据所述第一取值确定的,所述第二抑制范围为依据所述第二取值确定的。可选地,依据所述目标增益函数,对所述待处理语音信号的频谱数据进行处理,包括:基于所述凸函数,对所述语音状态信号的频谱数据进行处理;基于所述凹函数,对所述非语音状态信号的频谱数据进行衰减处理。可选地,还包括:对所述待处理语音信号进行频域变换,得到所述待处理语音信号的频谱数据。其中,所述依据所述估计信号频谱数据生成目标语音信号,包括:采用所述估计信号频谱数据进行反变换,得到目标语音信号。依据本专利技术的第二方面,提供了一种音频处理装置,该装置包括:增益函数获取模块,用于针对待处理语音信号,获取语音增强模型的增益函数;增益函数变换模块,用于对所述增益函数进行变换处理,得到目标增益函数;频谱数据处理模块,用于依据所述目标增益函数,对所述待处理语音信号的频谱数据进行处理,得到估计信号频谱数据;目标语音信号生成模块,用于依据所述估计信号频谱数据生成目标语音信号。可选地,所述增益函数变换模块包括:值域范围确定子模块,用于基于所述增益函数,确定所述待处理语音信号各时频点上增益函数的取值;增益函数变换子模块,用于基于所述取值范围对所述增益函数进行变换,得到目标增益函数,其中,所述目标增益函数在所述值域范围内为连续函数。可选地,所述待处理语音信号包括语音状态信号和/或非语音状态信号;所述取值包括:所述语音状态信号对应的第一取值和所述非语音状态信号对应的第二取值;所述目标增益函数在第一抑制范围内为凸函数,在第二抑制范围内为凹函数,其中,所述第一抑制范围为依据所述第一取值确定的,所述第二抑制范围为依据所述第二取值确定的。可选地,所述频谱数据处理模块包括:第一处理子模块,用于基于所述凸函数,对所述语音状态信号的频谱数据进行处理;第二处理子模块,用于基于所述凹函数,对所述非语音状态信号的频谱数据进行衰减处理。可选地,还包括:频域变换模块,用于对所述待处理语音信号进行频域变换,得到所述待处理语音信号的频谱数据。其中,所述目标语音信号生成模块,具体用于采用所述估计信号频谱数据进行反变换,得到目标语音信号。本专利技术实施例提供的一种音频处理方法和装置,在确定语音增强模型的增益函数后,可以对该增益函数进行变换,使得变换后得到的目标增益函数的特性曲线更符合语音增强模型的预期特性,能够显著地抑制噪声,且保留保护语音不被过度衰减,达到较好的语音增强效果。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术的一种音频处理方法实施例的步骤流程图;图2是本专利技术一个示例中的一种目标增益函数的曲线特性示意图;图3是本专利技术的一种音频处理装置实施例的结构框图。具体实施方式下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。参照图1,示出了本专利技术的一种音频处理方法实施例的步骤流程图,具体可以包括如下步骤:步骤102,针对待处理语音信号,获取语音增强模型的增益函数。在本专利技术实施例中,可以基于不同的语音模型和/或语音增强方案,如可以基于不同的语音增强模型,得到一个增益函数,并且可以将得到的增益函数作为语音增强模型的增益函数,以便后续可以使用该增益函数对输入到语音增强模型的待处理语音信号进行语音增强处理。其中,待处理语音信号可以表征需要进行语音处理的语音信号,如可以是需要进行语音增强的语音信号等,具体可以包括语音状态信号和非语音状态信号。语音状态信号可以表征语音状态下的语音;非语音状态信号可包括非语音状态下的干扰信号,如可以包括静音状态下的静音信号、噪声状态下的噪声信号等,本专利技术实施例对此不作具体限制。具体而言,在接收到待处理语音信号时,可以针对当前接收到的待处理语音信号,获取预先训练的语音增强模型的增益函数,或,获取预先计算得到的语音增强模型的增益函数。该增益函数可以用于对待处理语音信号的频谱数据进行处理,如可以是一个Gain函数等。步骤104,对所述增益函数进行变换处理,得到目标增益函数。本专利技术实施例在获取到增益函数后,可以对该增益函数进行变换,使得变换后的增益函数的特性曲线能够符合预期的特性条件,并可将变换后得到的增益函数确定为目标增益函数,以便后续可以采用该目标增益函数对输入到增强模型的待处理语音信号的频谱数据进行处理。其中,预期的特性条件可以依据语音处理需求设置的,如可以设置对语音状态信号的抑制量尽可能少,而对非语音状态信号的抑制量尽可能多,从而减少语音状态信号的衰减并增强对需要抑制的非语音状态信号的抑制能力。例如,当某一个时频单元(t,k)对应的待处理语音信号属于语音状态H_本文档来自技高网...
【技术保护点】
1.一种音频处理方法,其特征在于,所述方法包括:针对待处理语音信号,获取语音增强模型的增益函数;对所述增益函数进行变换处理,得到目标增益函数;依据所述目标增益函数,对所述待处理语音信号的频谱数据进行处理,得到估计信号频谱数据;依据所述估计信号频谱数据生成目标语音信号。
【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括:针对待处理语音信号,获取语音增强模型的增益函数;对所述增益函数进行变换处理,得到目标增益函数;依据所述目标增益函数,对所述待处理语音信号的频谱数据进行处理,得到估计信号频谱数据;依据所述估计信号频谱数据生成目标语音信号。2.根据权利要求1所述的方法,其特征在于,所述对所述增益函数进行变换处理,得到目标增益函数,包括:基于所述增益函数,确定所述待处理语音信号各时频点上增益函数的取值;基于所述取值对所述增益函数进行变换,得到目标增益函数,其中,所述目标增益函数在所述值域范围内为连续函数。3.根据权利要求2所述的方法,其特征在于,所述待处理语音信号包括语音状态信号和/或非语音状态信号;所述取值包括:所述语音状态信号对应的第一取值和所述非语音状态信号对应的第二取值;所述目标增益函数在第一抑制范围内为凸函数,在第二抑制范围内为凹函数,其中,所述第一抑制范围为依据所述第一取值确定的,所述第二抑制范围为依据所述第二取值确定的。4.根据权利要求3所述的方法,其特征在于,依据所述目标增益函数,对所述待处理语音信号的频谱数据进行处理,包括:基于所述凸函数,对所述语音状态信号的频谱数据进行处理;基于所述凹函数,对所述非语音状态信号的频谱数据进行衰减处理。5.根据权利要求1至4任一所述的方法,其特征在于,还包括:对所述待处理语音信号进行频域变换,得到所述待处理语音信号的频谱数据;其中,所述依据所述估计信号频谱数据生成目标语音信号,包括:采用所述估计信号频谱数据进行反变换,得到目标语音信号。6.一种音频处理装置,其特征在于,所述装置包括:增益函数...
【专利技术属性】
技术研发人员:汪法兵,李健,张连毅,武卫东,
申请(专利权)人:北京捷通华声科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。