语音编码装置及其方法制造方法及图纸

技术编号：3045845 阅读：239 留言：0更新日期：2012-04-11 18:40

一种语音编码装置，包括：感知线性预测（ｐｌｐ）分析缓冲器，它配置成输出有关原输入语音信号的音调周期并用ｐｌｐ处理分析输入语音信号，以输出ｐｌｐ系数；激励信号发生器，它配置成产生并输出激励信号；音调合成滤波器，它配置成合成从所述ｐｌｐ分析缓冲器输出的所述音调周期和从所述激励信号发生器输出的所述激励信号；频谱包络滤波器，它配置成将从所述ｐｌｐ分析缓冲器输出的所述ｐｌｐ系数应用到所述音调合成滤波器的输出，以输出合成的语音信号；加法器，它配置成从所述ｐｌｐ分析缓冲器输出的所述原输入语音信号中减去从所述频谱包络滤波器输出的所述合成信号，并输出差异信号；感知权重滤波器，它配置成通过将对应于人的听觉效果因素的权重值提供给从所述加法器输出的所述差异信号来计算误差；以及最小误差计算器，它配置成发现具有对应于从所述感知权重滤波器输出的所述误差的最小误差的激励信号。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及使用感知线性预测(PLP)和综合分析法以编码和解码语音数据的语音编码方法和装置。
技术介绍
语音处理系统包括在其中处理语音数据并在不同用户之间传送语音数据的通信系统。语音处理系统还包括诸如数字录音带记录仪的装置，在该装置中处理语音数据并将语音数据储存在记录仪内。用各种方法对语音数据进行压缩(编码)和解压(解码)。在相关技术中已为话音通信设计了各种语音编码器。特别地，基于线性感知(LP)方法的线性感知综合分析(LPAS)编码器被用在数字通信系统中。综合分析处理涉及到从语音信号中提取语音的特性系数并从所提取的特性系数中重新产生该语音。此外，LPAS编码器使用一种依据码激励线性感知(CELP)处理的技术。例如，ITU-T(国际电信同盟-通信标准部(international Telecommunication Union-Telecommunication Standardization Sector))已经定义了几个诸如G.723.1、G.728、G.729等的CELP规范。其他组织也定义了各种CELP规范，这样存在几种可用的规范。CELP使用一种含有互不相同的M编号的(通常，M＝1024)码矢量的代码本。然后将相应于最佳码矢量的码字索引发送给另外的实体，所述最佳码矢量含有原声音和成合声音之间的最少的识别误差。其他实体还包括相同的代码本，并使用该传送索引，重新产生原声音。这样，因为传送该索引而不是整个语音段，语音数据被压缩。CELP语音编码器的传送速度一般在4～8kbps的范围内。这样，难以对1kbps以下的时间变化系数进行量化或编码。此外，...

【技术保护点】
一种语音编码装置，包括：感知线性预测（ｐｌｐ）分析缓冲器，它配置成输出有关原输入语音信号的音调周期并用ｐｌｐ处理分析输入语音信号，以输出ｐｌｐ系数；激励信号发生器，它配置成产生并输出激励信号；音调合成滤波器，它配置成合成从所述ｐｌｐ分析缓冲器输出的所述音调周期和从所述激励信号发生器输出的所述激励信号；频谱包络滤波器，它配置成将从所述ｐｌｐ分析缓冲器输出的所述ｐｌｐ系数应用到所述音调合成滤波器的输出，使得输出合成语音信号；加法器，它配置成从所述ｐｌｐ分析缓冲器输出的所述原输入语音信号中减去从所述频谱包络滤波器输出的所述合成信号，并输出差异信号；感知权重滤波器，它配置成通过将对应于人的听觉效果因素的权重值提供给从所述加法器输出的所述差异信号，计算误差；以及最小误差计算器，它配置成发现具有对应于从所述感知权重滤波器输出的所述误差的最小误差的激励信号。

【技术特征摘要】
KR 2004-12-14 10-2004-01057771.一种语音编码装置，包括感知线性预测(plp)分析缓冲器，它配置成输出有关原输入语音信号的音调周期并用plp处理分析输入语音信号，以输出plp系数；激励信号发生器，它配置成产生并输出激励信号；音调合成滤波器，它配置成合成从所述plp分析缓冲器输出的所述音调周期和从所述激励信号发生器输出的所述激励信号；频谱包络滤波器，它配置成将从所述plp分析缓冲器输出的所述plp系数应用到所述音调合成滤波器的输出，使得输出合成语音信号；加法器，它配置成从所述plp分析缓冲器输出的所述原输入语音信号中减去从所述频谱包络滤波器输出的所述合成信号，并输出差异信号；感知权重滤波器，它配置成通过将对应于人的听觉效果因素的权重值提供给从所述加法器输出的所述差异信号，计算误差；以及最小误差计算器，它配置成发现具有对应于从所述感知权重滤波器输出的所述误差的最小误差的激励信号。2.按照权利要求1所述装置，其特征在于，还包括快速傅里叶变换单元，它配置成分散所述原输入语音信号；临界频带积分和再采样单元，它配置成依据频带将人的识别效果应用到所述分散信号；乘法器，它配置成将通过所述临界频带积分和再采样单元的频率元素乘以等响度曲线；听力幂次律单元，它配置成依据音量的变化，将所述人的识别效果应用到施加有信号的所述等响度曲线，并输出所述施加的信号。逆离散傅里叶变换单元，它配置成从所述听力幂次律单元输出的所述信号的时间域内获取线性方程；以及Cepstral系数单元，它配置成求解所述线性方程并将所述求解结果应用到cepstral递归处理，以获取cepstral系数。3.按照权利要求1所述装置，其特征在于，所述激励信号发生器包括代码本的代码本索引和代码本增益，且所述装置还包括搜索单元，所述搜索单元配置成从所述代码本中搜索具有所述最小误差的所述激励信号。4.按照权利要求3所述装置，其特征在于，还包括发送器，它配置成将所述代码本索引、所述代码本增益、所述音调周期和所述plp系数发送给预期用户。5.一种语音编码方法，包括输出有关原输入语音信号的音调周期并用感知线性预测(plp)处理分析输入语音信号，以输出plp系数；产生并输出激励信号；合成所述输出音调周期和所述激励信号并输出第一合成信号；将所述输出plp系数应用到所述第一合成信号，以输出第二合成信号；从所述原输入语音信号中减去所述第二合成信号，并输出差异信号；通过给所述输出差异信号提供对应于人的听觉效果因素的权重值，计算误差；以及发现具有对应于所述计算误差的最小误差的激励信号。6.按照权利要求5所述的方法，其特征在于，获取所述plp系数包括使用快速傅里叶变换分散所述输入语音信号；使用临界频带积分和再采样处理，依据频带将人的识别效果应用到所述离散信号；使经过所述临界频带积分和再采样处理的频率元素乘以等响度曲线；使用听力幂次律处理，依据音量变化将所述人的识别效果应用到施加有信号的所述等响度曲线，...

【专利技术属性】
技术研发人员：金燦佑，
申请(专利权)人：LG电子株式会社，
类型：发明
国别省市：KR[韩国]

全部详细技术资料下载我是这个专利的主人