参数编码器和参数编码方法及参数译码器和参数译码方法技术

技术编号:3047012 阅读:170 留言:0更新日期:2012-04-11 18:40
一个已知的编码器100,包含一个分段单元110,用于将一个音频或语音信号s划分为至少一个段x(n),并包含一个计算单元120,该单元由段x(n)计算正弦代码数据,该正弦代码数据的形式是一个给定扩展(n)的相位和幅度数据,对于一个给定的规则来说,扩展(n)尽可能好地近似段x(n)。本发明专利技术的一个目的是改进该译码器,以便能以简单廉价的方式执行所述正弦代码数据的计算。按本发明专利技术,这一目的是通过按以下扩展,为段x(n)计算正弦代码数据来达到的。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术有关一种分别用于按照权利要求1和6中前叙部分所描述的,将一个声频或语音信号编码为正弦代码数据的参数编码器和编码方法。本专利技术还有关一种分别用于按照权利要求11和12中所描述的,由所述正弦代码数据重构一个所述声频或语音信号的近似的参数译码器和译码方法。
技术介绍
声频或语音信号在经一个信道发射之前,或被存储在一个存储介质上之前,最好被编码以压缩所述信号的数据。声频或语音信号主要由正弦代码数据代表,因此,在本技术中已知有特定的编码器专用于编码这些信号。例如,这样一个参数编码器见于“A new speech codingmodel based on a least-squares sinusoidal representation”(声学,语音和信号处理IEEE国际会议论文集(ICASSP87),第1641-1644页,达拉斯TX,1987年4月6-9日。IEEE,Picataway,NJ。作者E.B.George和M.J.T.Smith)。在图5中举例说明了该参数编码器。按照图5,该参数编码器500包含一个分段单元510,用于将一个所接收的声频或语音信号划分为至少一个有限段x(n)。所述段x(n)被输入一个计算单元520。所述计算单元520由该段x(n)计算正弦代码数据,该数据的形式是一个给定扩展 的相位和幅值,对于一个给定规则(例如加权平方误差最小)来说,该扩展 尽可能好地近似x(n)。对于所述参数编码器,该扩展由下式给出x^(n)=Σi=1LAi(n)cos(Φi(n))---(1)]]>其中Ai(n)=Σi=0J-1ajinj---(2)]]>Φi(n)=Σk=0K-1φkink---(3)]]>这里, 和 分别是幅值参数Ai和相位参数Φi的多项式系数。计算单元520包含一个频率估算单元522,该单元通过在所接收段x(n)的频谱中挑选频率,由该段x(n)计算相位系数 ,例如,计算k=1时的系数,即 。这些代表所述正弦代码数据相位部分的相位系数 一方面被输出给一个多路复用器530,另一方面被输入一个模式生成单元524。所述模式生成单元根据公式(3)计算相位参数Φi(n)。模式生成单元524还根据下面公式生成扩展 (n)的J×L分量PijPij=njcos(Φi(n))其中,i=1~L,j=0~(J-1)该J×L分量Pij被输入一个幅值估算单元526,该单元根据所述接收分量以及分段单元510输出的接收段x(n)确定最理想的幅值数据 相位系数 和幅值系数 构成代表扩展 (n)的正弦代码数据,该扩展 (n)是段x(n)的一个近似。这些正弦代码数据被多路复用器530多路复用以形成一个数据流,该数据流可被存入一个记录介质或经一个信道发射。如公式(1)中所描述的,并从所述参数编码器500知道的扩展 (n)能为声频或语音信号的一个单独的段x(n)提供合适的近似。不过,该正弦代码数据的计算过于复杂。
技术实现思路
本专利技术的一个目的是改进一个用于将一个声频或语音信号编码为正弦代码数据的已知参数编码器和方法,并且,本专利技术的目的还有改进一种已知的参数译码器和方法,该译码器和方法用于在所述正弦代码数据的传输和恢复之后,由所述正弦代码数据重构所述声频或语音信号的一个近似,因此,可以用一种简单廉价的方式执行所述正弦代码数据的计算。这一目的是通过权利要求1中提出的方式解决的。更具体的,这一目的是通过使计算单元为以下扩展 计算正弦代码数据 和 来达到的x^(n)=Σl=1LΣj=0J-1[djifj(n)cos(Θi(n))+ejifj(n)sin(Θi(n))]]]>并且Θi(n)=Σk=1Kθkink]]>其中 i代表扩展 (n)的一个分量;j,k代表参数;n代表一个离散时间参数; 代表作为所述正弦代码数据之一的相位系数值;fj代表J个线性无关函数集中的第j个实例;Θi是一个相位; 代表描述所述正弦代码数据幅度部分的分量的线性关联幅值。在试图定义一个正弦数据,以使所声明的扩展 准确描述一个指定段x(n)时所出现的最佳化问题很容易解决。这一计算的简单性是由于,所声明的扩展 中,除了相位系数 之外,幅值数据 和 是线性关联的。应指出,在Θi中不会出现零阶的相位系数,而在Φi中会出现这种分量,其形式为 另外,所声明扩展 能为定义正弦代码数据提供更多的自由度,这是因为,与该技术中已知的扩展相比,所声明的扩展更广,并且能为一个单独的段x(n)提供更准确的近似。按本专利技术的一个第一实例,线性无关函数fj(n)被设为fj(n)=nj。以这种方式,根据权利要求提出的扩展 被限定为一个多项式扩展。根据权利要求提出的参数编码器的有利实例,特别是根据权利要求提出的计算单元,是相关编码器权利要求的主题。以上指出的目的还通过权利要求6中提出的一种用于编码一个音频或语音信号的方法解决。所述方法的优点和实例对应于以上所解释的参数编码器的优点和实例。以上所指出的目的还通过权利要求11所提出的一个参数译码器实现,该译码器用于由所发射或恢复的代码数据重构一个音频或语音信号的近似 。更具体的,达到该目的的方法是,采用一个已知的综合器,按照下面公式,由所述正弦代码数据 和 重构所述段 x^(n)=Σl=1LΣj=0J-1[djifj(n)cos(Θi(n))+ejifj(n)sin(Θi(n))]]]>并且Θi(n)=Σk=1Kθkink]]>其中 i代表扩展 (n)的一个部分;j,k代表参数;n代表一个离散时间参数;fj代表J个线性无关函数集中的第j个实例; 代表作为所述正弦代码数据之一的相位系数值;Θi是一个相位; 代表描述和所述正弦代码数据幅度部分的分量的线性关联幅值。权利要求中提出的扩展 的计算比该技术中已知扩展的计算简单。这是由于所述扩展中幅值数据 和 的线性关联性及零阶相位系数的省略。由于扩展 的计算简单,因此,对原始音频或语音信号s(形式为其近似 )的重构实现起来更快而且费用更低。上述目的还通过权利要求12中提出的译码方法达到。所述方法的优点对应于以上参照参数译码器提到的优点。附图描述在以下描述中,结合了五个附图,其中附图说明图1显示了按本专利技术的参数编码器的第一实例;图2显示了按本专利技术的参数编码器的第二实例;图3是一个流程图,举例说明了按本专利技术的参数编码器的第二实例的操作;图4显示了按本专利技术一个实例的参数译码器;图5显示了该技术中已知的一个参数编码器。实施例描述在描述本专利技术的推荐实例之前,先给出有关本专利技术主题的一些基本解释。本专利技术提出一个扩展 (n),用于近似一个正弦音频或语音信号s的一个段x(n)。所述扩展 (n)由相位和幅度数据代表,以下也将其称为正弦代码数据。定义该正弦代码数据的原则是,对于一个给定的规则(本文档来自技高网
...

【技术保护点】
一个参数编码器(100,100’),用于将一个音频或语音信号s编码为正弦代码数据,该编码器包括: -一个分段单元(110,110’),用于将所述信号s分为至少一个段x(n); -一个计算单元(120,120’),用于由段x(n)计算所述正弦代码数据(该数据的形式为一个给定扩展*的相位和幅值数据),以使得对于一个给定的规则来说,扩展*(n)尽可能好地近似段x(n); 该编码器的特点在于: 计算单元(120,120’)为以下的扩展*计算正弦代码数据θ↓[k]↑[i],d↓[j]↑[i]和e↓[j]↑[i]: *** 并且: Θ↑[l](n)=*θ↓[k]↑[l]n↑[k] 其中: i,j,k:代表参数; n: 代表一个离散时间参数; Ci: 代表扩展*的第i个分量; θ↓[k]↑[i]: 代表作为所述正弦代码数据之一的相位系数值; f↓[j]: 代表J个线性无关函数组中的第j个实例; Θ↑[i]: 是一个相位; d↓[j]↑[i],e↓[j]↑[i]: 代表描述所述正弦代码数据一些部分的分量的线性关联幅值。...

【技术特征摘要】
【国外来华专利技术】EP 2001-1-16 01200142.6;EP 2001-7-6 01202612.61.一个参数编码器(100,100’),用于将一个音频或语音信号s编码为正弦代码数据,该编码器包括-一个分段单元(110,110’),用于将所述信号s分为至少一个段x(n);-一个计算单元(120,120’),用于由段x(n)计算所述正弦代码数据(该数据的形式为一个给定扩展 的相位和幅值数据),以使得对于一个给定的规则来说,扩展 (n)尽可能好地近似段x(n);该编码器的特点在于计算单元(120,120’)为以下的扩展 计算正弦代码数据 和 x^=Σi=1LCi=Σl=1LΣj=0J-1[djifj(n)cos(Θi(n))+ejifj(n)sin(Θi(n))]]]>并且Θi(n)=Σk=1K-1θkink]]>其中i,j,k代表参数;n代表一个离散时间参数;Ci代表扩展 的第i个分量; 代表作为所述正弦代码数据之一的相位系数值; 代表J个线性无关函数组中的第j个实例;Θi是一个相位; 代表描述所述正弦代码数据一些部分的分量的线性关联幅值。2.权利要求1中的参数编码器,其特点在于fj(n)=nj。3.权利要求1中的参数编码器,其特点在于,计算单元(120)包含-一个频率估算单元(122),用于为扩展 (n)(该扩展 (n)代表所接收段x(n))的所有分量Ci确定多元相位系数 (L×K,其中i=1~L,k=1~K);-一个模式生成单元(124),按照下式,由相位系数 计算L个相位Θi(n)(其中i=1~L)Θi(n)=Σk=1K-1θkink]]>并按照下面公式为分量Ci(i=1~L)计算多元的J×L模式对 Pij1=fj(n)cos(Θi(n))]]>和Pij2=fj(n)sin(Θi(n))]]>i=1~L且j=0~(J-1);-一个幅值估算单元(126),为扩展 的所有分量Ci的模式 确定多元J×L幅值 ,并为模式 确定多元J×L幅值 -这里,对于段x及其扩展 之间的加权平方和最小这一规则来说,正弦数据 和 至少是近似最优的。4.权利要求1中的参数编码器,其特点在于,一个多路复用器(130)用于将所述正弦代码数据合并为一个数据流。5.权利要求1中的参数编码器,其特点在于,计算单元(120’)包含-一个频率估算单元(122’),用于由一个输入值εi-1为分量Ci确定多元K个相位系数 (k=1~K);其中,对于第一个分量C1(i=1),输入值被设为ε0=x(n);-一个模式生成单元(124’),按照下式,由所述多元相位系数 为分量Ci计算相位ΘiΘi(n)=Σk=1Kθkink]]>并按照下面公式为分量Ci生成多元的2×J模式 ,其中,j=1~LPij1=j(n)cos(Θi(n))]]>和Pij2=fj(n)sin(Θi(n))]]>-一个幅值估算单元(126’),由所接收的段x(n)和所接收的多元模式 ,为分量Ci的所述模式确定J个幅值 和J个幅值 -一个综合器(128’),按照以下公式,由所述多元2×J模式 和多元幅值 和 重构分量CiCi=Σj=0J-1[djifj(n)cos(Θi(n))+ejifj(n)sin(Θi(n))]]]>-一个减法单元(129’),从输入值εi-1中减去所述分量Ci,以便将所得到的差值εi前馈到频率估算单元(122’)的输入端,作为一个新的输入值,用来计算代表分量Ci+1的正弦代码数据;这里,对于段x及其扩展 之间的加权平方和最小这一规则来说,正弦数据 和 是最优的。6.一种参数编码方法,用于将一个音频或语音信号s编码为正弦代码数据,该方法包括以下步骤-将所述信号s分为至少一个段x(n);-由段x(n)计算所述正弦代码数据(该数据的形式为一个给定扩展 的相位和幅度数据),以使得对于一个给定的规则来说,扩展 (n)尽可能好地近似段x(n);其特点在于-扩展 被定义为x^=Σi=1LCi=Σl=1LΣj=0J-1[djifj(n)cos(Θi(n))+ejifj(n)sin(Θi(n))]]]>并且Θi(n)=Σk=1Kθkink]]>其中i代表扩展 (n)的一个分量Ci;j,k代表参数;n代表一个离散时间参数;fj代表J个线性无关函数集中的第j个实例; 代表作为所述正弦代码数据之一的相位系数值;Θi是一个相位; 表示代表所述正弦代码数据幅值部分的分量的线性关联幅值。7.权利要求6中的方法,其特点在于fj(n)=nj。8.权利要求6中的方法,其特点在于,通过取扩展 频域内的峰值频率来定义频率9.权利要求6中的方法,其特点在于,为满足段x及其扩展 之间的加权平方和最小...

【专利技术属性】
技术研发人员:AC登布林克
申请(专利权)人:皇家菲利浦电子有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1