基于过渡帧判决及处理的激励信号自然度提高方法属于低速率语音压缩编码技术领域。若当前帧前后各60个样点的平均能量比值小于1/32,则被判定为过渡帧,并用子带清浊音矢量的冗余模式进行表示,解码端对参数进行解量化,根据解码得到的子带清浊音矢量判决当前帧是否为过渡帧,若判定为非过渡帧,再判决当前帧是否为浊音帧且前一帧是否为清音帧,若是,则在合成激励信号时,解码端当前帧参数不与前一帧参数进行插值。这种方法可以提高合成语音的自然度。该方法适用于SELP2.4kbps声码器。
【技术实现步骤摘要】
本专利技术属于语音编码
,特别针对于SELP2.4kbps声码器技术。技术背景语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。 近些年来国际电信联盟(ITU)、 一些区域组织和一些国家相继制定了一系列语音压縮编码标 准,在编码速率为2.4kb/s到16kb/s上得到了令人满意的语音质量。目前国内外的研究主要集 中在2.4kb/s以下速率高质量语音压縮编码上,主要用于无线通信、保密通信、大容量语音存 储回放等。低速率语音编码中激励信号的合成非常重要,SELP声码器采用混合激励信号,用 基音周期参数、能量参数、余量谱幅度参数以及子带清浊音判决参数描述激励信号的特征, 合成语音清晰自然。目前SELP2.4kbps声码器技术中激励信号合成的主要步骤如下 步骤(1)对输入语音信号样点按时间顺序分帧; 步骤(2) 对当前帧提取基音周期参数; 步骤(3)对当前帧提取能量参数; 步骤(4) 对当前帧提取余量谱幅度参数; 步骤(5)对当前帧提取子带清浊音判决参数;步骤(6)将步骤(2)、步骤(3)、步骤(4)以及步骤(5)求取的特征参数进行量化,将量化索引传递给解码端; 步骤(7)解码端根据步骤(6)发送的量化索引进行解量化,得到合成激励信号所需的参数;步骤(8)对步骤(7)中求取的特征参数进行插值。若前一帧和当前帧为浊音帧,并且基 音周期的变化率小于22.5%,则对解码端参数采用逐点的线性插值;否则采用分段插值;步骤(9)根据步骤(8)中插值后的参数合成激励信号。上述己有技术对子带清浊音判决参数采用5bit量化,每个子带的清浊音特性用lbit表示,当某个子带为浊音时将其清浊音判决参数置为1,否则置为0。由于当第一个子带为清音时,后四个子带也必为清音,因此子带清浊音判决参数中有部分模式是不存在的,即子带清浊音判决参数的量化存在一定的冗余。如图1所示,在子带清浊音判决参数的量化上,原有技术采用简单的每个子带清浊音判 决参数lbit量化共5bit量化的方式,这会使编码后的码流存在一定的冗余度,没有充分的利 用比特信息。
技术实现思路
本专利技术的目的是为克服已有技术的不足之处,提出一种基于过渡帧判决及处理的激励信 号自然度提高方法,能够比较充分的利用子带清浊音判决参数量化的冗余度,提高清浊音过 渡时合成语音的自然度。本专利技术提出的,包括以下步骤在编码端,依次按以下步骤执行 步骤(1)对输入语音信号样点按时间顺序分帧; 步骤(2)对当前帧提取基音周期参数; 步骤(3)对当前帧提取能量参数; 步骤(4) 对当前帧提取余量谱幅度参数; 步骤(5)对当前帧提取子带清浊音判决参数;步骤(6)求取当前帧前后各60个样点的平均能量,当后60个样点的平均能量大于前60个样点平均能量的32倍时,判定当前帧为过渡帧; 步骤(7)若当前帧为过渡帧,并且步骤(5)中求取的子带清浊音判决参数为除10000以外的其他模式,则将第一个子带的清浊音判决参数置为0, g卩,假设步骤(5)中求取的模式为11100,则修改为01100;步骤(8)将步骤(2)、步骤(3)和步骤(4)求取的特征参数以及步骤(7)修正的清浊音判决参数进行量化,将量化索引传递给解码端;在解码端,依次按以下步骤执行 步骤(r)解码端根据步骤(8)发送的量化索引进行解量化,得到合成激励信号所需的参数若清浊音判决参数中第一个子带的清浊音判决参数为0,并且后四个子带的清浊音判决参数不全为0,解码端自动将第一个子带的清浊音判决参数置为1,并判定当前帧为过渡帧;步骤(2')将步骤(r)修正的第一个子带的清浊音判决参数作为当前帧的全带清浊音判决 参数;步骤(3')对步骤(r)中所得到的参数进行插值。若前一帧和当前帧为浊音帧,并且基音 周期的变化率小于22.5%,则对解码端所得参数采用逐点的线性插值;若前一帧为清音帧 且当前帧为浊音帧,并且当前帧不为过渡帧,则不进行插值;否则采用分段插值;步骤(4')根据步骤(3')中插值后的参数合成激励信号。本专利技术的特点是对分帧后的语音信号采用过渡帧判决的方法,并且根据当前帧是否为过 渡帧来修正子带清浊音判决参数。原有的技术对各个子带的清浊音判决参数采用简单的lbit 量化,它没有考虑到子带清浊音判决参数中一些不存在的模式,因此增加了量化的冗余度。 本专利技术利用了子带清浊音判决参数的冗余度,根据当前帧前后各60个样点的平均能量比值判 定当前帧是否为过渡帧,根据当前帧是否为过渡帧来决定是否修正子带清浊音判决参数。解 码端根据接收到的子带清浊音判决参数判定当前帧是否为过渡帧,并对第一个子带的清浊音 判决参数进行修正,根据当前帧是否为过渡帧而采用不同的插值方案。本方法可以降低参数量化的冗余度,提高清浊音过渡时合成语音的自然度。该方法主要 针对于SELP 2.4kbps声码器。附图说明图1为已有技术的激励信号合成方法流程框图。 图2为本专利技术提出的激励信号合成方法流程框图。具体实施方式本专利技术提出的结合附图及实施例进一步说明如下本专利技术的方法流程如图2所示,包括以下步骤-在编码端,依次按以下步骤执行 步骤(1) 对输入语音信号样点按时间顺序分帧; 步骤(2)对当前帧提取基音周期参数; 步骤(3) 对当前帧提取能量参数; 步骤(4)对当前帧提取余量谱幅度参数; 步骤(5)对当前帧提取子带清浊音判决参数;步骤(6)求取当前帧前后各60个样点的平均能量,当后60个样点的平均能量大于前60个样点平均能量的32倍时,判定当前帧为过渡帧; 步骤(7)若当前帧为过渡帧,并且步骤(5)中求取的子带清浊音判决参数为除10000以外的其他模式,则将第一个子带的清浊音判决参数置为0, B卩,假设步骤(5)中求取的模式为11100,则修改为01100; 步骤(8)将歩骤(2)、步骤(3)和步骤(4)求取的特征参数以及步骤(7)修正的清浊音判决参数进行量化,将量化索引传递给解码端;在解码端,依次按以下步骤执行 步骤(i')解码端根据步骤(8)发送的量化索引进行解量化,得到合成激励信号所需的参数若清浊音判决参数中第一个子带的清浊音判决参数为O,并且后四个子带的清浊音判决参数不全为0,解码端自动将第一个子带的清浊音判决参数置为1,并判定当前帧为过渡帧;步骤(2')将步骤(1,)修正的第一个子带的清浊音判决参数作为当前帧的全带清浊音判决 参数;步骤(3')对步骤(r)中所得到的参数进行插值。若前一帧和当前帧为浊音帧,并且基音 周期的变化率小于22.5%,则对解码端所得参数采用逐点的线性插值;若前一帧为清音帧 且当前帧为浊音帧,并且当前帧不为过渡帧,则不进行插值;否则采用分段插值;步骤(4')根据步骤(3')中插值后的参数合成激励信号。 本专利技术上述方法各步骤的具体实施例分别详细说明如下上述方法步骤(1)对输入语音信号样点按时间顺序分帧的实施例是按8khz频率采样、 己经过高通滤波去除工频干扰的语音样点。同原有的SELP2.4kbps声码器一样,每25ms,也 就是200个语音样点构成一帧。上述方法步骤(2)的实施例为按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法求取当前帧的基音周期参数尸c/z。上述方法步骤(3)的实施例为按美国政府24本文档来自技高网...
【技术保护点】
基于过渡帧判决及处理的激励信号自然度提高方法,其特征在于,所述方法在编、解码端依次按以下步骤实现: 在编码端,依次按如下步骤执行: 步骤(1)对输入语音信号样点按时间顺序分帧; 步骤(2)对当前帧提取基音周期参数; 步骤(3)对当前帧提取能量参数; 步骤(4)对当前帧提取余量谱幅度参数; 步骤(5)对当前帧提取子带清浊音判决参数; 步骤(6)求取当前帧前后各60个样点的平均能量,当后60个样点的平均能量大于前60个样点平均能量的32倍时,判定当前帧为过渡帧; 步骤(7)若当前帧为过渡帧,并且步骤(5)中求取的子带清浊音判决参数为除10000以外的其他模式,则将第一个子带的清浊音判决参数置为0,即,假设步骤(5)中求取的模式为11100,则修改为01100; 步骤(8)将步骤(2)、步骤(3)和步骤(4)求取的特征参数以及步骤(7)修正的清浊音判决参数进行量化,将量化索引传递给解码端; 在解码端,依次按如下步骤执行: 步骤(1′)解码端根据步骤(8)发送的量化索引进行解量化,得到合成激励信号所需的参数:若清浊音判决参数中第一个子带的清浊音判决参数为0,并且后四个子带的清浊音判决参数不全为0,解码端自动将第一个子带的清浊音判决参数置为1,并判定当前帧为过渡帧; 步骤(2′)将步骤(1’)修正的第一个子带的清浊音判决参数作为当前帧的全带清浊音判决参数; 步骤(3′)对步骤(1’)中所得到的参数进行插值。若前一帧和当前帧为浊音帧,并且基音周期的变化率小于22.5%,则对解码端所得参数采用逐点的线性插值;若前一帧为清音帧且当前帧为浊音帧,并且当前帧不为过渡帧,则不进行插值;否则采用分段插值; 步骤(4′)根据步骤(3’)中插值后的参数合成激励信号。...
【技术特征摘要】
1. 基于过渡帧判决及处理的激励信号自然度提高方法,其特征在于,所述方法在编、解码端依次按以下步骤实现在编码端,依次按如下步骤执行步骤(1)对输入语音信号样点按时间顺序分帧;步骤(2)对当前帧提取基音周期参数;步骤(3)对当前帧提取能量参数;步骤(4)对当前帧提取余量谱幅度参数;步骤(5)对当前帧提取子带清浊音判决参数;步骤(6)求取当前帧前后各60个样点的平均能量,当后60个样点的平均能量大于前60个样点平均能量的32倍时,判定当前帧为过渡帧;步骤(7)若当前帧为过渡帧,并且步骤(5)中求取的子带清浊音判决参数为除10000以外的其他模式,则将第一个子带的清浊音判决参数置为0,即,假设步骤(5)中求取的模式为11100,则修改为01100;步骤(8)将步骤(2)、步骤(3)和步骤(4)求取的特征参数以及步...
【专利技术属性】
技术研发人员:崔慧娟,唐昆,计哲,李晔,
申请(专利权)人:清华大学,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。