一种NVOC低速窄带声码器的语音数据处理方法技术

技术编号:27139487 阅读:50 留言:0更新日期:2021-01-27 20:57
本发明专利技术涉及一种NVOC低速窄带声码器的语音数据处理方法,包括以下步骤:步骤1、编码端对原始语音数字信号的初始化配置和分析处理;步骤2、在步骤1计算得到的基音周期、清音和浊音数值参数的基础上继续对线谱对、基音值、增益参数、残差补偿增益、码本矢量等参数进行提取和量化;步骤3、提取步骤2的声音量化参数,通过该声音量化参数合成语音,经过压噪再提升语音质量,当参数恢复失败后或语音合成及后失败后进行声音重建。本发明专利技术能在低速率的情况下提供优良的语音质量。供优良的语音质量。供优良的语音质量。

【技术实现步骤摘要】
一种NVOC低速窄带声码器的语音数据处理方法


[0001]本专利技术属于声码器数字语音压缩
,尤其是一种NVOC低速窄带声码器的语音数据处理方法。

技术介绍

[0002]随着通信技术的高速发展,频率和资源显得尤为宝贵,与模拟语音通信系统相比,数字语音通信系统具有抗干扰性强、保密性号、易于集成等特点,而在这其中低速声码器担当着重要角色。
[0003]目前,语音编码算法大都建立在人类发声器官的声学模型基础上。人的发声器官由声门、声道和其它辅助器官组成。实际语音的产生过程是声门产生的振动被声道滤波器调制后经口鼻等辐射所得,可以用如下公式表示为
[0004]s(n)=h(n)*e(n)
[0005]其中,s(n)表示语音信号,h(n)为声道滤波器单位冲激响应,e(n)为声门振动信号。
[0006]为了清晰地表示语音信号,可以从频谱特点上分别描述声门和声道,如何高效量化声门和声道的特征参数,这是参数编码这一类算法要达到的目标。
[0007]声码器属于参数编码一类,低速窄声码器就是压缩语音信号的数字表示,用较少的比特(bit)还原出与原是语音最为相似语音的方法。随着数字信号处理硬件的效率猛增,加上声码器的加速研究,使得声码器已经大量使用。
[0008]现有的低速窄带声码器包括两种码率:2.4kbps、2.2kbps(用于加密),信道FEC码率为1.2kbps,语音编解码和FEC都以8K采样20毫秒为一帧进行编码和解码。
[0009]但仍存在如下问题:(1)利用时域相关性提取基因参数,容易算错;(2)由于声音不经过降噪,当有噪音时提取的声音参数不准确;(3)方言声音失真;(4)由于窄带低速编码压缩比较高,当信道质量不佳存在误码时语音质量低。

技术实现思路

[0010]本专利技术的目的在于克服现有技术的不足,提出一种设计合理、语音质量高且对方言适应性强的NVOC低速窄带声码器的语音数据处理方法。
[0011]本专利技术解决其现实问题是采取以下技术方案实现的:
[0012]一种NVOC低速窄带声码器的语音数据处理方法,包括以下步骤:
[0013]步骤1、编码端对原始语音数字信号的初始化配置和分析处理,首先对原始语音数字信号进行去噪声处理,然后判断当前语音信号是否为话音,若当前语音信号为话音,则提取话音中的基音后计算出基音周期和各子带清音和浊音数值参数;
[0014]步骤2、在步骤1计算得到的基音周期、清音和浊音数值参数的基础上对线谱对、基音值、增益参数、残差补偿增益和码本矢量的参数进行提取和量化,得到声音量化参数;
[0015]步骤3、提取步骤2的声音量化参数后,将该声音量化参数合成语音,经过压噪再提
升语音质量,并当参数恢复失败后或语音合成失败后进行声音重建。
[0016]而且,所述步骤1具体步骤包括:
[0017](1)对原始语音数字信号S(n)进行去噪声处理,得到去噪声后的语音数据S1(n)和原始数据S(n)的0~4000Hz的声音频谱特性;
[0018](2)采用VAD激活检测技术判断去噪声处理后的当前语音信号是否为话音,得到话音数据S2(n);
[0019](3)提取话音数据S2(n)的基音;
[0020](4)计算出基音周期和各子带清音和浊音数值参数。
[0021]而且,所述步骤1第(1)步的具体步骤包括:
[0022]①
采用高通滤波器对语音数据去除直流成分,提高高频分量,对低频进行衰减;
[0023]②
加窗信号,采用窗长为N的海明窗,通过交叠傅里叶变换以得到在频谱上的能量分布,得到去噪声后的语音数据S1(n)和原始语音数字信号S(n)的0~4000Hz的声音频谱特性。
[0024]而且,所述步骤1第(2)步的具体方法为:
[0025]根据人耳的听觉特性,对去噪声后的语音数据S1(n)进行子带滤波并计算子带信号的电平,根据下示公式估计信噪比,和预先设定的门限值比较,进而判断当前语音信号是否是话音:
[0026][0027]式中,a是当前帧的信号电平值,b为根据前几帧估计得到的当前信号电平值;
[0028]而且,所述步骤1第(3)步的具体方法为:
[0029]使用截止频率为BHz的低通滤波器对话音数据S2(n)进行低通滤波,并采用二阶逆滤波器对低通滤波后的语音数据进行逆滤波后,根据如下公式计算二阶逆滤波的输出信号的自相函数,提取基音:
[0030][0031]其中,N为所述步骤1所述(1)提及窗函数窗长,S
w
(i)为所述步骤1第(3)步所述二阶逆滤波输出信号。
[0032]而且,所述步骤1第(4)步的具体步骤包括:
[0033]①
将频域上0~4000等间隔的分为5个频段,分别为[0-500]Hz,[500-1000]Hz,[1000-2000]Hz,[2000-3000]Hz,[3000-4000]Hz,利用如下公式计算每个区间内带通信号的自相关函数:
[0034][0035]其中,“t”为连续时间自变量,”τ”为输入信号时延“*”是卷积算符,(
·
)
*
f
*
()为取共轭;
[0036]②
将同一时间函数在瞬时t和t+a的两个值相乘积的平均值作为时间t的函数,它是信号与延迟后信号之间相似性的度量,当延迟时间为零时,则成为信号的均方值,此时它
的值最大,用该函数的最大值作为浊音强度,计算出各子带清浊音数值;
[0037]而且,所述步骤2的具体步骤包括:
[0038](1)采用截止频率为AHz的高通滤波器对经过去噪后的语音数据滤波得到S3(n),加窗,计算自相关系数,用Levinson-Durbin递归算法求解线谱对参数,并采用三级矢量量化方案对得到线谱对参数进行参数量化;
[0039](2)将步骤1第(3)步中计算得到的基音值量化:将包含基音值的整数区间线性映射到[0~z]内,将z个数用m1比特表示;
[0040](3)将步骤1第(2)步中话音检测到的语音数据S2(n)经过二阶逆滤波器得到去除共振峰的影响的预测误差信号r(n),其中二阶你滤波器的系数为a1、a2≈1,增益参数用r(n)的RMS表示,量化在对数域完成;
[0041](4)将步骤1第(4)步的计算频域分段后带通信号值的相关函数得到的最大值,量化为m2比特;
[0042](5)计算残差补偿增益,使用量化后的LSF参数计算线性预测系数,构成预测误差滤波器对输入语音S2(n)滤波,得到残差信号,残差信号长度为160点;
[0043](6)使用窗长为160点的哈明窗是对预测残差加窗,将加窗信号补0至512点,对其进行512点的复数FFT,再利用频谱峰点检测算法找到前x次谐波对应的傅立叶变换值;
[0044](7)设P是量化基音,给定第i个谐波的初始位置为512i/P,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种NVOC低速窄带声码器的语音数据处理方法,其特征在于:包括以下步骤:步骤1、编码端对原始语音数字信号的初始化配置和分析处理,首先对原始语音数字信号进行去噪声处理,然后判断当前语音信号是否为话音,若当前语音信号为话音,则提取话音中的基音后计算出基音周期和各子带清音和浊音数值参数;步骤2、在步骤1计算得到的基音周期、清音和浊音数值参数的基础上对线谱对、基音值、增益参数、残差补偿增益和码本矢量的参数进行提取和量化,得到声音量化参数;步骤3、提取步骤2的声音量化参数后,将该声音量化参数合成语音,经过压噪再提升语音质量,并当参数恢复失败后或语音合成失败后进行声音重建。2.根据权利要求1所述的一种NVOC低速窄带声码器的语音数据处理方法,其特征在于:所述步骤1具体步骤包括:(1)对原始语音数字信号S(n)进行去噪声处理,得到去噪声后的语音数据S1(n)和原始数据S(n)的0~4000Hz的声音频谱特性;(2)采用VAD激活检测技术判断去噪声处理后的当前语音信号是否为话音,得到话音数据S2(n);(3)提取话音数据S2(n)的基音;(4)计算出基音周期和各子带清音和浊音数值参数。3.根据权利要求2所述的一种NVOC低速窄带声码器的语音数据处理方法,其特征在于:所述步骤1第(1)步的具体步骤包括:

采用高通滤波器对语音数据去除直流成分,提高高频分量,对低频进行衰减;

加窗信号,采用窗长为N的海明窗,通过交叠傅里叶变换以得到在频谱上的能量分布,得到去噪声后的语音数据S1(n)和原始语音数字信号S(n)的0~4000Hz的声音频谱特性。4.根据权利要求2所述的一种NVOC低速窄带声码器的语音数据处理方法,其特征在于:所述步骤1第(2)步的具体方法为:根据人耳的听觉特性,对去噪声后的语音数据S1(n)进行子带滤波并计算子带信号的电平,根据下示公式估计信噪比,和预先设定的门限值比较,进而判断当前语音信号是否是话音:式中,a是当前帧的信号电平值,b为根据前几帧估计得到的当前信号电平值。5.根据权利要求2所述的一种NVOC低速窄带声码器的语音数据处理方法,其特征在于:所述步骤1第(3)步的具体方法为:使用截止频率为B Hz的低通滤波器对话音数据S2(n)进行低通滤波,并采用二阶逆滤波器对低通滤波后的语音数据进行逆滤波后,根据如下公式计算二阶逆滤波的输出信号的自相函数,提取基音:其中,N为所述步骤1所述(1)提及窗函数窗长,S
w
(i)为所述步骤1第(3)步所述二阶逆滤
波输出信号。6.根据权利要求2所述的一种NVOC低速窄带声码器的语音数据处理方法,其特征在于:所述步骤1第(4)步的具体步骤包括:

将频域上0~4000等间隔的分为5个频段,分别为[0-500]Hz,[500-1000]Hz,[1000-2000]Hz,[2000-3000]Hz,[3000-4000]Hz,利用如下公式计算每个区间内带通信号的自相关函数:其中,“t”为连续时间自变量,”τ”为输入信号时延“*”是卷积算符,(
·
)
...

【专利技术属性】
技术研发人员:肖文雄
申请(专利权)人:天津联声软件开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利