语音识别系统技术方案

技术编号：3046448 阅读：245 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开一种语音识别系统，包括：模数变换单元，将输入语音的模拟信号变换为数字信号；特征提取单元，对该数字信号进行分帧处理，提取每一帧语音的特征参数，得到其特征矢量序列；特征码本，由一定数量的码字组成；量化编码单元，根据特征码本将输入语音的特征矢量序列转换为特征码字序列；概率表，存储了特征码本中每个码字对应高斯码本中每个码字的概率值；以及解码运算单元，对该特征码字序列进行解码运算得到识别结果，运算中对该特征码字序列中的各个码字，从概率表中直接查找与其具有最大匹配概率的高斯［０］码字。本发明专利技术的语音识别系统，可在保证语音系统识别性能的前提下，提高系统的识别速度。（*该技术在2022年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音识别系统。
技术介绍
当前的语音识别系统几乎都是采用基于统计模式识别的方法，在所有的语音识别系统中都需要将语音输入的时域声波转换成一种数字化的矢量特征来描述区分不同的发音，我们称之为语音特征，基于该特征对所有的发音建立一个声音模型，这在语音识别领域我们通常称之为声学模型。所有的语音识别系统都必须要有一个声学模型；同时，对于大词表连续语音识别系统来说，还需要一个语言模型。语音识别的目的就是给定一串声音特征序列为输入条件，利用声学模型和语言模型，采用搜索算法，输出识别结果，如字、词或句子，换言之，语音识别系统就是要在巨大的字、词或句子空间中，找出与给定输入特征序列相匹配具有最大概率的字、词或句子。而语音特征集则通过采集众多语音的特征参数集合而成，可用于对输入语音的矢量序列进行量化编码，将其转换为相应的特征码字序列。图1所示是一种已知语音识别系统的结构框图，模拟语音经过模数变换单元11后变换为计算机可处理的数字信号，然后利用特征提取单元12对该数字信号进行分帧处理，通常帧长为20ms，帧移为10ms，提取每一帧语音的MFCC参数，得到MFCC矢量序列，解码运算单元14根据输入语音的特征矢量序列、声学模型13及语言模型15，采用一定的搜索策略，如深度优先搜索(Viterbi算法)或广度优先搜索，得到识别的结果，其中语言模型在进行大词表连续语音识别时，用于将语言层的知识应用到语音识别系统中，提高系统的识别精度。随着微电子技术和通讯技术的高速发展，手机等嵌入式通讯装置几乎已成为人们工作生活必备的物品，而人们对其功能的要求也越来越高，这使得将语...

【技术保护点】
一种语音识别系统，用于接收语音输入信号并得到相匹配的识别结果，至少包括：　　　　模数变换单元，将输入语音的模拟信号变换为数字信号；　　　　特征提取单元，对该数字信号进行分帧处理，提取每一帧语音的特征参数，得到其特征矢量序列；　　　　特征码本，为该语音特征集压缩后得到的；　　　　量化编码单元，根据该特征码本将输入语音的特征矢量序列转换为特征码字序列；　　　　概率表，存储了该特征码本中每个码字对应的高斯码本中每个码字的概率值，该离斯码本为如权利要求８中所述的高斯码本；以及　　　　解码运算单元，对该特征码字序列进行解码运算得到识别结果，运算中对该特征码字序列中的各个码字，从概率表中直接查找与其具有最大匹配概率的高斯码字。

【技术特征摘要】
1.一种语音识别系统，用于接收语音输入信号并得到相匹配的识别结果，至少包括模数变换单元，将输入语音的模拟信号变换为数字信号；特征提取单元，对该数字信号进行分帧处理，提取每一帧语音的特征参数，得到其特征矢量序列；特征码本，为该语音特征集压缩后得到的；量化编码单元，根据该特征码本将输入语音的特征矢量序列转换为特征码字序列；概率表，存储了该特征码本中每个码字对应的高斯码本中每个码字的概率值，该离斯码本为如权利要求8中所述的高斯码本；以及解码运算单元，对该特征码字序列进行解码运算得到识别结果，运算中对该特征码字序列中的各个码字，从概率表中直接查找与其具有最大匹配概率的高斯码字。2.如权利要求1所述的语音识别系统，其特征在于还包括一语言模型。3.如权利要求1所述的语音识别系统，其特征在...

【专利技术属性】
技术研发人员：潘接林，韩疆，刘建，颜永红，庹凌云，张建平，
申请(专利权)人：中国科学院声学研究所，北京中科信利技术有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人