一种基于矢量泰勒级数的多环境模型孤立词识别方法技术

技术编号：11252396 阅读：121 留言：0更新日期：2015-04-02 01:33

一种基于矢量泰勒级数的多环境模型孤立词识别方法，通过模型训练阶段：设置基本环境信噪比，利用含噪训练语音分别训练生成含噪GMM模型和含噪HMM模型；通过孤立词识别阶段，根据训练阶段获得的含噪GMM模型，首先选择与当前测试环境最匹配的信噪比环境；其次基于矢量泰勒级数和纯净环境下的纯净GMM模型，估计测试语音中噪声的均值和方差，并根据最小均方误差准则将测试语音特征参数映射到最匹配信噪比环境下的含噪语音特征参数；最后，选择最匹配信噪比环境下的含噪HMM模型，将映射后的含噪特征参数与对应的含噪HMM模型进行匹配，得到最终的识别结果。本发明专利技术误识率比现有矢量泰勒级数大幅降低。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于矢量泰勒级数的多环境模型孤立词识别方法
本专利技术涉及语音识别领域，具体涉及一种基于矢量泰勒级数的多环境模型孤立词识别方法。
技术介绍
语音识别是一门涉及很广泛的学科，包括：信号处理、数理统计、模式识别、声学与语音学、人工智能等等。随着现代科学技术的迅猛发展，语音识别技术已经逐渐走出实验室进入人们的日常生活中。虽然语音识别系统在实验室中有较高的识别性能，但在实际环境中，由于语音的变异性和环境噪声的干扰，导致语音识别系统的识别性能不尽如人意。因此，研究语音识别技术，提高语音识别系统在噪声环境下的鲁棒性具有十分重要的实际意义。
技术实现思路
专利技术目的：为了克服现有技术中存在的不足，本专利技术提供一种基于矢量泰勒级数的多环境模型孤立词识别方法，通过建立多种信噪比环境下的GMM模型和HMM模型，改进了现有技术的不足。技术方案：一种基于矢量泰勒级数的多环境模型孤立词识别方法，其特征在于，该方法包括以下步骤：步骤1)模型训练阶段：设置基本环境信噪比，对白噪声进行加权，将加权结果加载到纯净训练语音中，分别得到对应信噪比条件下的含噪训练语音；利用含噪训练语音分别训练生成含噪GMM模型和含噪HMM模型；其中含噪GMM模型表示每一信噪比环境下所有孤立词的特征参数分布，含噪HMM模型表示每一信噪比环境下每个孤立词的特征参数分布；步骤2)孤立词识别阶段：根据训练阶段获得的含噪GMM模型，基于最大似然准则选择与当前测试环境最匹配的信噪比环境，然后基于矢量泰勒级数和纯净环境下的纯净GMM模型，估计测试语音中噪声的均值和方差；接着基于最小均方误差估计准则和最匹配信噪比环境下的含...
一种基于矢量泰勒级数的多环境模型孤立词识别方法

【技术保护点】
一种基于矢量泰勒级数的多环境模型孤立词识别方法，其特征在于，该方法包括以下步骤：1)模型训练阶段：设置基本环境信噪比，对白噪声进行加权，将加权结果加载到纯净训练语音中，分别得到对应信噪比条件下的含噪训练语音；利用含噪训练语音分别训练生成含噪GMM模型和含噪HMM模型；其中含噪GMM模型表示每一信噪比环境下所有孤立词的特征参数分布，含噪HMM模型表示每一信噪比环境下每个孤立词的特征参数分布；2)孤立词识别阶段：根据训练阶段获得的含噪GMM模型，基于最大似然准则选择与当前测试环境最匹配的信噪比环境，然后基于矢量泰勒级数和纯净环境下的纯净GMM模型，估计测试语音中噪声的均值和方差；接着基于最小均方误差估计准则和最匹配信噪比环境下的含噪GMM模型，将测试环境下的含噪语音特征参数映射到最匹配信噪比环境下的含噪特征参数；最后识别时，选择最匹配信噪比环境下的含噪HMM模型，将映射后的含噪特征参数与对应的含噪HMM模型进行匹配，得到最终的识别结果。

【技术特征摘要】
1.一种基于矢量泰勒级数的多环境模型孤立词识别方法，其特征在于，该方法包括以下步骤：1)模型训练阶段：设置基本环境信噪比，对白噪声进行加权，将加权结果加载到纯净训练语音中，分别得到对应信噪比条件下的含噪训练语音；利用含噪训练语音分别训练生成含噪GMM模型和含噪HMM模型；其中含噪GMM模型表示每一信噪比环境下所有孤立词的特征参数分布，含噪HMM模型表示每一信噪比环境下每个孤立词的特征参数分布；2)孤立词识别阶段：根据训练阶段获得的含噪GMM模型，基于最大似然准则选择与当前测试环境最匹配的信噪比环境，然后基于矢量泰勒级数和纯净环境下的纯净GMM模型，估计测试语音中噪声的均值和方差；接着基于最小均方误差估计准则和最匹配信噪比环境下的含噪GMM模型，将测试环境下的含噪语音特征参数映射到最匹配信噪比环境下的含噪特征参数；最后识别时，选择最匹配信噪比环境下的含噪HMM模型，将映射后的含噪特征参数与对应的含噪HMM模型进行匹配，得到最终的识别结果。2.如权利要求1所述的一种基于矢量泰勒级数的多环境模型孤立词识别方法，其特征在于，设置基本环境包括信噪比分别为0dB、5dB、10dB、15dB、20dB和纯净环境，步骤1)中模型训练阶段的具体包括以下步骤：1.1)根据设置的信噪比，对白噪声信号进行加权，加载到纯净训练语音数据中，得到不同环境下的含噪训练语音和纯净训练语音，在每一信噪比下，对训练语音进行预处理，所述预处理过程包括预加重、分帧加窗和端点检测；1.2)对步骤1.1)中得到的每一帧语音信号提取MFCC特征参数；得到不同信噪比环境下所有孤立词的MFCC特征参数；1.3)在每一信噪比下，利用所有孤立词的M...

【专利技术属性】
技术研发人员：周琳，束佳明，吕勇，吴镇扬，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人