【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音识别系统的领域,并且更特别涉及语音识别系统对不断变化环境条件的自适应。
技术介绍
语音识别系统把(口头)口授录制成书写文本。从语音生成文本的处理通常分成以下步骤接收声音信号;预处理和执行信号分析;分析信号的识别以及识别文本的输出。声音信号的接收利用任何记录装置例如麦克风来提供。在信号分析步骤中,通常把已接收的声音信号分段成时间窗,覆盖通常在几毫秒范围内的时间间隔。利用快速傅里叶变换(FFT),计算时间窗的功率谱。通常具有三角整形内核的平滑函数被进一步应用于该功率谱,并生成特征向量。特征向量的单个分量代表功率谱的不同部分,这些部分是语音内容的特征(函数),并因而理论上适于语音识别目的。此外,对数函数被应用于特征向量的所有分量,得到对数谱域的特征向量。信号分析步骤可以进一步包括环境自适应以及附加步骤,例如,应用对数倒频谱(cepstral)变换或把导数或者回归增量(Δ,δ)附加到特征向量上。在识别步骤中,将分析的信号与从被分配给词汇表的训练语音序列中导出的参考信号进行比较。此外,可以在最后步骤中输出识别的文本之前,执行文法规则以及上下文有关的命令。环境自适应是信号分析过程中的重要步骤。训练语音参考与识别数据之间的环境失配的根本原因(起源)例如是不同的信噪比、不同的记录信道噪声或不同的语音-寂静(speech-and-silence)比例。美国专利No.5778340公开了一种具有自适应功能的语音识别信息。这里,将语音输入转换成特征向量系列,将这些特征向量系列馈送给预识别器。预识别器通过计算输入图案与存储在参考图案存储器中的参考图案之间的相 ...
【技术保护点】
一种提供特征向量序列的语音识别系统(402)的环境自适应的方法,每个特征向量描述待识别的语音(400)的功率谱,对于每个特征向量分量,该方法包括以下步骤:-利用单调递减概率函数,计算特征向量分量的寂静概率,-提供至少训练特征向量的子集的各个分量的寂静与语音间隔的平均值,-基于至少各个特征向量的子集,利用均值函数,计算特征向量分量的寂静与语音间隔的平均值,-利用变换函数,变换特征向量分量,该变换函数基于特征向量和训练特征向量的寂静与语音的平均值、特征向量分量的寂静概率和特征向量分量本身。
【技术特征摘要】
【国外来华专利技术】EP 2003-10-8 03103727.81.一种提供特征向量序列的语音识别系统(402)的环境自适应的方法,每个特征向量描述待识别的语音(400)的功率谱,对于每个特征向量分量,该方法包括以下步骤-利用单调递减概率函数,计算特征向量分量的寂静概率,-提供至少训练特征向量的子集的各个分量的寂静与语音间隔的平均值,-基于至少各个特征向量的子集,利用均值函数,计算特征向量分量的寂静与语音间隔的平均值,-利用变换函数,变换特征向量分量,该变换函数基于特征向量和训练特征向量的寂静与语音的平均值、特征向量分量的寂静概率和特征向量分量本身。2.根据权利要求1所述的方法,对于每个特征向量分量,该方法还包括以下步骤-利用单调递增概率函数,计算语音的语音概率,-利用变换函数,变换特征向量分量,该变换函数还基于特征向量分量的语音的概率。3.根据权利要求1或2所述的方法,其中均值函数是移动加权均值函数,寂静与语音间隔的平均值的计算基于特征向量的子集,该子集至少包括数量为10的特征向量,最好包括数量为20至30的特征向量。4.根据权利要求1至3之中任一项权利要求所述的方法,其中训练特征向量的寂静与语音间隔的平均值的提供基于训练均值函数,所述训练均值函数是训练特征向量子集的加权平均函数,该子集至少包括数量为10的特征向量,最好数量为20至30的特征向量。5.根据权利要求1至4之中任一项权利要求所述的方法,其中概率函数包括描述单调概率函数斜率的斜率常数(α),该斜率函数是可修改的。6.根据权利要求1至5之中任一项权利要求所述的方法,其中特征向量分量的变换由下式给出Fc,new=Fc,old+(MTRSil-MSil)PSil+(MTRSp-MSp)PSp,其中Fc,new已变换的特征向量分量,Fc,old特征向量分量,MTRSil训练特征向量的寂静的平均值,MTRSp训练特征向量的语音的平均值,MSp特征向量的语音的平均值,MSil特征向量的寂静的平均值,PSil寂静概率,PSp语音概率。7.根据权利要求1至6之中任一项权利要求所述的方法,其中寂静概率函数由以下形式的S形函数给出PSil=1-11+exp((MSil+VSil-Fc)α/VSil),]]>以及语音概率函数由下式给出Psp=1-PSil,其中MSil语音的寂静间隔的平均值,VSil寂静的平均值的方差,α斜率常数,Fc特征向量分量。8.一种具有环境自适应的语音识别系统(402),提供特征向量序列,每个特征向量描述待识别的语音(400)的功率谱,对于每个特征向量分量,该系统包括-用于利用单调递减概率函数计算特征向量分量的寂静概率的装置(418),-用于提供至少训练特征向量的子集的各个分量的寂静与语音间隔的平均值的装置(416),-用于利用基于至少各个特征向量的子集的均值函数来计算特征向量分量的寂静与语音间隔的平均值的装置(420),-用于利...
【专利技术属性】
技术研发人员:D格勒,
申请(专利权)人:皇家飞利浦电子股份有限公司,
类型:发明
国别省市:NL[荷兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。