语音处理方法和语音处理装置制造方法及图纸

技术编号:31093583 阅读:54 留言:0更新日期:2021-12-01 13:00
提供一种语音处理方法和语音处理装置。一种音频处理方法可包括以下步骤:获取当前语音传输网络的网络状态信息;根据所述网络状态信息确定用于对输入语音进行编码的当前码率;基于所述当前码率确定所述输入语音的语音特征信息和对所述语音特征信息进行编码的编码参数;按照所述编码参数对所述语音特征信息进行编码。编码。编码。

【技术实现步骤摘要】
语音处理方法和语音处理装置


[0001]本公开涉及音频
,尤其涉及一种在语音传输中对语音进行编码和解码的语音处理方法和语音处理装置。

技术介绍

[0002]语音编解码技术在语音传输中至关重要,尤其在基于网际协议的语音传输(Voice over Internet Protocol,VoIP)中备受关注。例如,超低码率的VoIP的语音可懂度和音质会影响实时通讯的用户在弱网情况下的用户体验,尤其在网络只能提供3kbps的语音传输带宽时,对VoIP的语音编解码能力有极大挑战。同时,在高网速状态下的高质量语音也是提升用户体验的关键所在。

技术实现思路

[0003]本公开提供一种语音处理方法和语音处理装置,以至少解决上述问题。本公开的技术方案如下:
[0004]根据本公开实施例的第一方面,提供一种语音处理方法,可包括:获取当前语音传输网络的网络状态信息;根据所述网络状态信息确定用于对输入语音进行编码的当前码率;基于所述当前码率确定所述输入语音的语音特征信息和对所述语音特征信息进行编码的编码参数;按照所述编码参数对所述语音特征信息进行编码。
[0005]可选地,基于所述当前码率确定所述输入语音的语音特征信息,可包括:基于所述当前码率确定用于提取语音特征的维度信息;根据所述维度信息从所述输入语音中提取与所述维度信息相应的语音特征信息。
[0006]可选地,在高码率网络环境下提取高纬度的语音特征,在低码率环境下提取低纬度的语音特征,其中,所述维度信息的维度范围为16至64。
[0007]可选地,基于所述当前码率确定对所述语音特征信息进行编码的编码参数,可包括:基于所述当前码率确定用于对所述语音特征信息进行编码的码书和帧间依赖性中的至少一个,其中,所述码书表示单个语音帧的编码比特的数量,并且所述帧间依赖性表示在语音帧序列中语音帧参考其他语音帧的帧信息的数量。
[0008]可选地,基于所述当前码率确定用于对所述语音特征信息进行编码的码书和帧间依赖性中的至少一个,可包括:基于所述当前码率从预先存储的多个码书中选择用于对所述语音特征信息进行编码的码书;和/或基于所述当前码率从预先存储的多个帧间依赖性中选择用于对所述语音特征信息进行编码的帧间依赖性。
[0009]可选地,按照所述编码参数对所述语音特征信息进行编码,可包括:当所述帧间依赖性被选择为所述多个帧间依赖性中的第一帧间依赖性时,每个语音帧的语音特征信息由所述码书中的一组矢量进行编码。
[0010]可选地,按照所述编码参数对所述语音特征信息进行编码,可包括:当所述帧间依赖性被选择为所述多个帧间依懒性中的第二帧间依懒性时,每隔一个语音帧的语音特征信
息由所述码书中的一组矢量进行编码,未由所述码书编码的语音帧的语音特征信息由与其相邻的两个编码的语音帧的语音特征信息的均值进行编码。
[0011]可选地,按照所述编码参数对所述语音特征信息进行编码,可包括:当所述帧间依赖性被选择为所述多个帧间依懒性中的第三帧间依懒性时,在每四个语音帧中,一个语音帧的语音特征信息由所述码书中的一组矢量进行编码,与该语音帧相隔一帧的语音帧的语音特征信息使用预先存储的差分码书中的一组矢量进行编码,其余两个语音帧的语音特征信息分别使用与其相邻的两个语音帧的语音特征信息的均值进行编码。
[0012]可选地,在确定所述输入语音的语音特征信息之前,所述音频处理方法可包括:对所述输入语音进行降噪处理;基于所述当前码率从经过降噪处理的输入语音中提取所述语音特征信息。
[0013]根据本公开实施例的第二方面,提供一种语音处理方法,可包括:获取当前语音传输网络的网络状态信息;根据所述网络状态信息确定用于对接收到的编码语音的语音特征信息进行解码的当前码率;基于所述当前码率确定用于对所述语音特征信息进行解码的解码参数;按照所述解码参数对所述语音特征信息进行解码。
[0014]可选地,基于所述当前码率确定用于对所述语音特征信息进行解码的解码参数,可包括:基于所述当前码率确定用于对所述语音特征信息进行解码的码书和帧间依赖性中的至少一个,其中,所述码书表示单个语音帧的编码比特的数量,并且所述帧间依赖性表示在语音帧序列中语音帧参考其他语音帧的帧信息的数量。
[0015]可选地,基于所述当前码率确定用于对所述语音特征信息进行解码的码书和帧间依赖性中的至少一个,可包括:基于所述当前码率从预先存储的多个码书中选择用于对所述语音特征信息进行解码的码书;和/或基于所述当前码率从预先存储的多个帧间依赖性中选择用于对所述语音特征信息进行解码的帧间依赖性。
[0016]可选地,按照所述解码参数对所述语音特征信息进行解码,可包括:当所述帧间依赖性被选择为所述多个帧间依赖性中的第一帧间依赖性时,每个语音帧的语音特征信息由所述码书中的一组矢量进行解码。
[0017]可选地,按照所述解码参数对所述语音特征信息进行解码,可包括:当所述帧间依赖性被选择为所述多个帧间依懒性中的第二帧间依懒性时,每隔一个语音帧的语音特征信息由所述码书中的一组矢量进行解码,未由所述码书编码的语音帧的语音特征信息由与其相邻的两个编码的语音帧的语音特征信息的均值进行解码。
[0018]可选地,按照所述解码参数对所述语音特征信息进行解码,可包括:当所述帧间依赖性被选择为所述多个帧间依懒性中的第三帧间依懒性时,在每四个语音帧中,一个语音帧的语音特征信息由所述码书中的一组矢量进行解码,与该语音帧相隔一帧的语音帧的语音特征信息使用预先存储的差分码书中的一组矢量进行解码,其余两个语音帧的语音特征信息分别使用与其相邻的两个语音帧的语音特征信息的均值进行解码。
[0019]可选地,所述音频处理方法还可包括:基于解码的语音特征信息使用神经网络来生成与所述编码语音相应的语音信号。
[0020]根据本公开实施例的第三方面,提供一种语音处理装置,所述语音处理装置可包括:网络状态监控模块,被配置为获取当前语音传输网络的网络状态信息,并且根据所述网络状态信息确定用于对输入语音进行编码的当前码率;编码模块,被配置为基于所述当前
码率确定所述输入语音的语音特征信息和对所述语音特征信息进行编码的编码参数,并且按照所述编码参数对所述语音特征信息进行编码。
[0021]可选地,编码模块可被配置为:基于所述当前码率确定用于提取语音特征的维度信息;根据所述维度信息从所述输入语音中提取与所述维度信息相应的语音特征信息。
[0022]可选地,在高码率网络环境下提取高纬度的语音特征,在低码率环境下提取低纬度的语音特征,其中,所述维度信息的维度范围为16至64。
[0023]可选地,编码模块可被配置为:基于所述当前码率确定用于对所述语音特征信息进行编码的码书和帧间依赖性中的至少一个,其中,所述码书表示单个语音帧的编码比特的数量,并且所述帧间依赖性表示在语音帧序列中语音帧参考其他语音帧的帧信息的数量。
[0024]可选地,编码模块可被配置为:基于所述当前码率从预先存储的多个码书中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:获取当前语音传输网络的网络状态信息;根据所述网络状态信息确定用于对输入语音进行编码的当前码率;基于所述当前码率确定所述输入语音的语音特征信息和对所述语音特征信息进行编码的编码参数;按照所述编码参数对所述语音特征信息进行编码。2.如权利要求1所述的音频处理方法,其特征在于,基于所述当前码率确定对所述语音特征信息进行编码的编码参数,包括:基于所述当前码率确定用于对所述语音特征信息进行编码的码书和帧间依赖性中的至少一个,其中,所述码书表示单个语音帧的编码比特的数量,并且所述帧间依赖性表示在语音帧序列中语音帧参考其他语音帧的帧信息的数量。3.如权利要求2所述的音频处理方法,其特征在于,基于所述当前码率确定用于对所述语音特征信息进行编码的码书和帧间依赖性中的至少一个,包括:基于所述当前码率从预先存储的多个码书中选择用于对所述语音特征信息进行编码的码书;和/或基于所述当前码率从预先存储的多个帧间依赖性中选择用于对所述语音特征信息进行编码的帧间依赖性。4.如权利要求3所述的音频处理方法,其特征在于,按照所述编码参数对所述语音特征信息进行编码,包括:当所述帧间依赖性被选择为所述多个帧间依赖性中的第一帧间依赖性时,每个语音帧的语音特征信息由所述码书中的一组矢量进行编码。5.如权利要求3所述的音频处理方法,其特征在于,按照所述编码参数对所述语音特征信息进行编码,包括:当所述帧间依赖性被选择为所述多个帧间依懒性中的第二帧间依懒性时,每隔一个语音帧的语音特征信息由所述码书中的一组矢量进行编码,未由所述码书编码的语音帧的语音特征信息由与其相邻的两个编码的语音帧的语音特征信息的均值进行编码。6.如权利要求3所述的音频处理方法,其特征在于,按照...

【专利技术属性】
技术研发人员:李楠李子涵邢文浩张晨
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1