一种面向特定人群的语音识别方法技术

技术编号：4053380 阅读：298 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种面向特定人群的语音识别方法，首先对语音信号采样，将其从模拟信号转换至数字信号，然后对数字语音信号进行预加重、加窗分帧和端点检测的前端处理，接着采用离散小波变换对语音信号做特征提取，最后采用经样本训练后的离散隐马尔可夫模型对特征提取后的语音信号做语音识别。在对语音信号的前端处理和特征提取过程中充分考虑不同目标人群的频谱特征和发音特点对语音信息提取的过程进行优化，可简化处理过程和信息提取过程，从而在保证识别精度的同时，大大降低了识别过程中的计算量和信息存储量，实现了在嵌入式平台上的语音识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音信号处理与识别
，尤其涉及一种面向特定目标人群的语音识别方法。
技术介绍
语音识别，是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术，即将语音信号逐字逐句的翻译为相应的书面语言，或对语音所包含的要求和命令做出正确的响应。随着科学的发展和计算机的普及，人们对与计算机的交流方式提出了更高的要求。这促进了语音识别技术的发展，并使之成为语音处理领域中的一个重要研究方向。语音识别具有广阔的应用前景，其发展、成熟和实用化将推动许多产业的迅速发展，包括计算机、办公室自动化、通信、国防、机器人等等。目前，在实验室环境下，语音识别系统的识别率已经达到了很高的水平。但是由于受现实环境噪声的影响，语音识别系统的识别率较实验室环境大幅度下降，语言识别系统的实用性受到了很大的影响。语音识别中最重要的技术基本集中在语音特征提取和模式匹配两个环节。在汉语语音识别系统中，主要采用以下三种特征提取方法基于LPC的倒谱参数(LPCC)分析法该方法的典型代表是基于Durbin或 Levinson迭代算法求解“维纳-霍夫方程”获得LPC预测系数为基础，进而得到的LPC的倒谱参数(LPCC)。基于Mel系数的Mel频标倒谱系数(MPCC)分析法该方法基于FFT频谱余弦变换为基础，根据Mel曲线将语音信号频谱分为若干个频带，每个频带的能量经FFT变换对应一组MFCC参数。基于现代处理技术的小波变换系数分析法该方法将语音信号与一个在时域和频域均具有良好局部化性质的小波函数族进行积分(小波变换)，从而把信号分解成一组位于不同频率和...

【技术保护点】
一种面向特定目标人群的语音识别方法，其特征在于，包括：（１）对语音信号进行采样，将语音信号由模拟信号转换至数字信号；（２）对语音信号进行前端处理；（３）提取语音信号的特征参数；（４）采用离散隐马尔可夫模型对语音信号进行识别。

【技术特征摘要】

【专利技术属性】
技术研发人员：熊伟，刘伟，王飞浪，谢伟良，陈鑫娜，陈鹏，熊俱扬，熊鑫，
申请(专利权)人：杭州网豆数字技术有限公司，
类型：发明
国别省市：86[中国|杭州]

全部详细技术资料下载我是这个专利的主人