利用可变步距以求取语调估测值的方法技术

技术编号:3046536 阅读:168 留言:0更新日期:2012-04-11 18:40
一种用一语音处理器计算一语音讯号的语调估测值的方法,该语音讯号包含有多个数字语音数据,该方法包含下列步骤:    (a)提供一初始值至一延迟参数;    (b)使用该语音处理器,依据该延迟参数对该语音讯号作自我相关函数运算以产生一自我相关函数值;    (c)储存该延迟参数及相对应的该自我相关函数值至一存储器;    (d)设定一第一递增值及一第二递增值;    (e)使用该语音处理器,比较在步骤(b)中所产生的该自我相关函数值与一第一临界值,若该自我相关函数值小于该第一临界值,则以该第一递增值递增该延迟参数,若该自我相关函数值大于该第一临界值,则以该第二递增值递增该延迟参数;    (f)重复步骤(b)、步骤(c)、步骤(d)、及步骤(e),直到该延迟参数大于一默认值为止;以及    (g)比较该存储器中所储存的多个自我相关函数值以找出该多个自我相关函数值中的最大值,并利用相对应于该最大值的延迟参数来计算该语音讯号的语调估测值。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种预估语调估测值的方法,特别是涉及一种
技术介绍
近年来电子无线通讯与计算机技术不断的进步,与多媒体系统与因特网的普及,对于语音讯号编码与分析的需求也越来越多。语音通讯将是下一世代因特网的一项重要应用,也是因特网多媒体通讯的重要环节。语音编码的技术应用最广的地方就是通讯,因此通讯传输的标准就非常的重要。目前国际电话网络标准语音编码技术,在国际无线通讯联盟(International Telecommunication Union)的制定下有PCM(64Kpbs)、G711(64Kpbs)、G726(ADPCM,16、24、32、40Kpbs),G728(Low Delay CELP16Kpbs)、G728(Low Delay CELP 8Kpbs)。而目前对于数字蜂巢式的无线电话制定的标准,在北美有TIA(Telecommunication Industry Association)所制定的VSELP编码技术,在日本与欧洲则有JDC(Japanese Digital Cellular)与GSM(Global System for Mobil Telecommunication)所使用的RPE-LTP编码技术。目前所应用的实时编码技术都还维持在8Kbps,而新一代的编码技术则是在4.8Kbps(LD-CELP)至2.4Bbps(MELP,STC),要能够达到如此高的压缩比,所需要的运算复杂度当然也相对的增高,如此要使用一般通用的数字讯号处理器来实现完成实时的运算就非轻易的事。如何提高运算速度就是我们需要解决的问题。为了符合设计上的需求,通常会有一个或多个特殊应用设计的数字讯号处理器(Digital Signal Processor)作为语音压缩或辨识之用。DSP的特性为具有很短的指令周期、高度的平行性以及各种特殊的寻址模式用来解决各种一般数字讯号处理的问题。而语音处理中具有大量计算量的部分为语调预估(Pitch Estimation)步骤,此步骤是根据下列所记述的方程式1计算的。R[τ]=Σn=0N-1x[n]x[n+τ]]]>pitch period={τ|max[R[τ]]}方程式1方程式1为自我相关函数的运算,x[n]为一语音讯号,包含多个语音数据,是由x到x[N-1],x[n+τ]为语音讯号x[n]延迟一延迟参数单位τ所产生的另一语音讯号,由x[τ]到x[N-1+τ],R[τ]为语音讯号x[n]相对应于一延迟参数τ的自我相关函数值,其是将x[n]与x[n+τ]两语音讯号中其相对应的语音数据相乘产生一数值,并将该多个数值加总以产生一自我相关函数值。已知预估语调估测值的方法,是根据多个延迟参数τ中的每一个延迟参数τ都做自我相关函数的运算,计算出相对应于多个延迟参数τ的多个自我相关函数值R[τ]之后,比较该自我相关函数值R[τ],并找出该多个自我相关函数值R[τ]的最大值,并利用相对应于该最大值的延迟参数τ来计算语音讯号x[n]的语调估测值。此外,预估一语调估测值另有一标准化自我相关函数的计算方法,请参阅如下的方程式2R[τ]2=[Σn=0N-1x[n]x[n+]τ]2[Σn=0N-1x[n+τ]2]]]>pitch period={τ|max[Rn2[n]}方程式2标准化自我相关函数的计算方法,是根据方程式2计算R[τ]2,亦是根据多个延迟参数τ中的每一个延迟参数τ做自我相关函数值的平方值R[τ]2的运算,并将多个延迟参数τ及自我相关函数值的平方值R[τ]2储存至一存储器中,之后比较所述自我相关函数值R[τ]2并找出所述自我相关函数值的平方值R[τ]2的最大值,并利用相对应于该最大值的延迟参数τ来计算语音讯号x[n]的语调估测值。此两种预估语音讯号的语调估测值的方法,在数字讯号处理器中所需使用的运算量都相当庞大,当输入的语音讯号其数据量愈加庞大时,其语调估测的计算量则更加庞大,数据处理的时间也愈加长久,语音数据无法被实时的处理运算,其语音品质在传输或做其它用途时会因而降低。
技术实现思路
本专利技术的主要目的是提供一种用一语音处理器计算一语音讯号的语调估测值(Pitch esitimation)的方法,以解决上述问题。依据本专利技术的一种计算一语音讯号的语调估测值的方法,该语音讯号包含有多个数字语音数据,该方法包含下列步骤(a)提供一初始值至一延迟参数;(b)使用该语音处理器,依据该延迟参数对该语音讯号作自我相关函数运算以产生一自我相关函数值;(c)储存该延迟参数及相对应的该自我相关函数值至一存储器;(d)设定一第一递增值及一第二递增值;(e)使用该语音处理器,比较在步骤(b)中所产生的该自我相关函数值与一第一临界值,若该自我相关函数值小于该第一临界值,则以该第一递增值递增该延迟参数,若该自我相关函数值大于该第一临界值,则以该第二递增值递增该延迟参数;(f)重复步骤(b)、步骤(c)、步骤(d)、及步骤(e),直到该延迟参数大于一默认值为止;以及(g)比较该存储器中所储存的多个自我相关函数值以找出该多个自我相关函数值中的最大值,并利用相对应于该最大值的延迟参数来计算该语音讯号的语调估测值。附图说明图1为本专利技术语音处理装置的功能方块图;图2为本专利技术预估语调估测值的方法的流程图;和图3为本专利技术的第一实施例中预估语调估测值的方法的流程图。附图符号说明10语音处理装置 12语音处理器14存储器 16语音讯号源具体实施方式请参阅图1,图1为本专利技术语音处理装置的功能方块图。一语音讯号x[n]输入一语音处理装置10,语音处理装置10包含一语音处理器12,用来处理语音讯号x[n],及一存储器14,用来储存多个延迟参数τ及语音处理器10所计算出的多个自我相关函数值R[τ],语音讯号x[n]通常是由一语音讯号源16所产生,并输入语音处理装置10。请参阅图2,图2为本专利技术预估语音讯号的最大语调估测值的方法的流程图,本专利技术根据方程式1预估语调估测值(Pitch Estimation),其方法包含下列步骤步骤200使用语音处理器12,提供一初始值至一延迟参数τ;步骤202使用语音处理器12,依据延迟参数τ对语音讯号x[n]作自我相关函数运算以产生一自我相关函数值R[τ],在此,该自我相关函数运算是利用上述的方程式1进行,然而,此一自我相关函数的运算亦可利用方程式2或者其它能够达到相同目的的方程式进行;步骤204储存延迟参数τ及相对应的自我相关函数值R[τ]至存储器14;步骤206设定一第一递增值Δ1及一第二递增值Δ2;步骤208使用语音处理器12,比较在步骤202中所产生的自我相关函数值R[τ]与第一临界值Rth1,若自我相关函数值R[τ]小于第一临界值Rth1,则以第一递增值Δ1递增延迟参数τ,若自我相关函数值R[τ]大于第一临界值Rth1,则以第二递增值Δ1递增延迟参数τ;步骤210重复步骤202、步骤204、步骤206、及步骤208,直到延迟参数τ大于一默认值为止;以及步骤212比较存储器14中所储存的多个自我相关函数值R[τ]以找出该多个自我相关函本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用一语音处理器计算一语音讯号的语调估测值的方法,该语音讯号包含有多个数字语音数据,该方法包含下列步骤(a)提供一初始值至一延迟参数;(b)使用该语音处理器,依据该延迟参数对该语音讯号作自我相关函数运算以产生一自我相关函数值;(c)储存该延迟参数及相对应的该自我相关函数值至一存储器;(d)设定一第一递增值及一第二递增值;(e)使用该语音处理器,比较在步骤(b)中所产生的该自我相关函数值与一第一临界值,若该自我相关函数值小于该第一临界值,则以该第一递增值递增该延迟参数,若该自我相关函数值大于该第一临界值,则以该第二递增值递增该延迟参数;(f)重复步骤(b)、步骤(c)、步骤(d)、及步骤(e),直到该延迟参数大于一默认值为止;以及(g)比较该存储器中所储存的多个自我相关函数值以找出该多个自我相关函数...

【专利技术属性】
技术研发人员:吴俊德
申请(专利权)人:扬智科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利