一种基于先验概率的声学解码方法技术

技术编号：29207263 阅读：31 留言：0更新日期：2021-07-10 00:43

本发明专利技术公开一种基于先验概率的声学解码方法，包括如下步骤：统计训练语音文本音节序列中每个音节向其他音节转移的概率；用每个音节的全部训练语音进行模型训练，得到该音节的HMM；读取上一个语音的声学模型输出概率值，若最大值远大于其他值，则用上一个语音的音节转移到每个音节的先验概率对声学模型的输出概率进行加权，并将加权概率最大的声学模型对应的音节作为当前语音声学解码的结果；否则，直接用输出概率最大的声学模型对应的音节作为当前语音声学解码的结果。本发明专利技术在声学解码时，除了每个HMM的输出概率，还考虑上一个音节对当前语音的影响，将其作为当前语音的先验概率，可以提高声学解码的精度。可以提高声学解码的精度。可以提高声学解码的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于先验概率的声学解码方法

[0001]本专利技术属于语音识别
，具体涉及到一种基于先验概率的声学解码方法。

技术介绍

[0002]在基于统计的语音识别系统中，一般用隐马尔可夫模型(HMM：Hidden Markov Model)描述每个语音单元(音节)特征向量的分布。在识别阶段，用每个音节的HMM计算当前语音特征向量的概率，并将输出概率最大的HMM对应的音节作为识别结果。
[0003]在实验室安静环境中，基于统计的语音识别系统可以取得很高的识别率。但是，语音的高频能量较小，容易受到环境噪声的干扰。因此，用实验室环境中得到的纯净语音声学模型对实际环境中提取的含噪语音特征向量进行声学解码时，有可能出现前几个似然值比较接近的情况，这时将最大似然值对应的音节作为识别结果，很有可能导致误判。实际上，语音识别系统的各音节之间不是独立的，它们存在着某种转移关系，从而导致声学解码的精度不高。

技术实现思路

[0004]专利技术目的：针对现有技术中存在的问题，本专利技术提供一种基于先验概率的声学解码方法，解决了声学解码精度不高的问题。
[0005]技术方案：本专利技术提出一种基于先验概率的声学解码方法，包括如下步骤：
[0006](1)在训练阶段，将训练语音文本中的所有字都用音节代替，得到音节序列；
[0007](2)统计训练语音文本音节序列中每个音节向其他音节转移的概率，得到音节上下文模型；
[0008](3)用每个音节的全部训练语音进行模型训练，得到该音节的隐马尔

【技术保护点】

【技术特征摘要】
1.一种基于先验概率的声学解码方法，其特征在于，包括如下步骤：(1)在训练阶段，将训练语音文本中的所有字都用音节代替，得到音节序列；(2)统计训练语音文本音节序列中每个音节向其他音节转移的概率，得到音节上下文模型；(3)用每个音节的全部训练语音进行模型训练，得到该音节的隐马尔可夫模型，所有音节的隐马尔可夫模型组成语音识别系统的声学模型；(4)在识别阶段，用所述每个声学模型对当前语音特征向量计算输出概率，并将输出概率从大到小排序，存储前若干个概率值；(5)读取上一个语音的声学模型输出概率值，若最大值远大于其他值，则用上一个语音的音节转移到每个音节的先验概率对声学模型的输出概率进行加权，并将加权概率最大的声学模型对应的音节作为当前语音声学解码的结果；否则，若上一个语音的声学模型输出概率的最大值与后面的几个值比较接近，则不用音节转移的先验概率进行加权，直接用输出概率最大的声学模型对应的音节作为当前语音声学解码的结果。2.如权利要求1所述的基于先验概率的声学解码方法，其特征在于，所述步骤(2)中，具体包括统计训练语音文本音节序列中每个音节向其他音节转移的先验概率，设音节A在训练语音中出现N次，其中，设音节W1在训练语音中出现N次，其中，有M次下一个音节是音节W2，则音节W1向音节W2转移的先验概率为所有音节转移的先验概率构成所述音节上下文模型。3.如权利要求1所述的基于先验概率的声学解码方法，其特征在于，所述步骤(3)用每个音节的全部训练语音进行模型训练之前先对训练语音进行预处理，包括加窗、分帧和快速傅里叶变换，然后提取训练语音和测试语音的美尔频率倒谱系数，将所述美尔顿率倒谱系数作为训练语...

【专利技术属性】
技术研发人员：吕勇，
申请(专利权)人：河海大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人