自动语音识别方法和系统技术方案

技术编号：10291919 阅读：187 留言：0更新日期：2014-08-06 19:23

本申请公开了一种自动语音识别方法和系统，包括：对生语料进行语料分类计算，得到一个以上不同类别的分类语料；针对所述每个分类语料进行训练得到一个以上对应的分类语言模型；依据分类的生僻程度为所述各个分类语言模型进行加权插值处理，其中各分类的生僻程度与该分类对应的加权值成正相关关系，将加权插值处理后的分类语言模型合并，得到插值语言模型；依据声学模型和所述插值语言模型构建解码资源；依据所述解码资源，对输入的语音进行解码，输出概率值最高的字符串作为所述输入语音的识别结果。利用本发明专利技术，可以提高对生僻词语的语音的识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本申请公开了一种自动语音识别方法和系统，包括：对生语料进行语料分类计算，得到一个以上不同类别的分类语料；针对所述每个分类语料进行训练得到一个以上对应的分类语言模型；依据分类的生僻程度为所述各个分类语言模型进行加权插值处理，其中各分类的生僻程度与该分类对应的加权值成正相关关系，将加权插值处理后的分类语言模型合并，得到插值语言模型；依据声学模型和所述插值语言模型构建解码资源；依据所述解码资源，对输入的语音进行解码，输出概率值最高的字符串作为所述输入语音的识别结果。利用本专利技术，可以提高对生僻词语的语音的识别准确率。【专利说明】自动语音识别方法和系统
本申请涉及自动语音识别(ASR, Automatic Speech Recognition)
,尤其涉及一种自动语音识别方法和系统。
技术介绍
自动语音识别技术是将人类的语音中的词汇内容转换为计算机可读的输入字符的一项技术。语音识别具有复杂的处理流程，主要包括声学模型训练、语言模型训练、解码资源构建、以及解码四个过程。图1为现有自动语音识别系统的一种主要处理流程的示意图。参见图1，主要处理过程包括:步骤101和102，需要根据声学原料进行声学模型训练得到声学模型，以及根据生语料进行语言模型训练得到语言模型。所述声学模型是语音识别系统中最为重要的部分之一，目前的主流语音识别系统多采用隐马尔科夫模型(HMM，Hidden Markov Model)进行建模，隐马尔可夫模型是统计模型，它用来描述一个含有隐含未知参数的马尔可夫过程。在隐马尔可夫模型中，状态并不是直接可见的，但受状态影响的某些...

【技术保护点】
一种自动语音识别方法，其特征在于，包括：对生语料进行语料分类计算，得到一个以上不同类别的分类语料；针对所述每个分类语料进行语言模型训练计算，得到一个以上对应的分类语言模型；依据分类的生僻程度为所述各个分类语言模型进行加权插值处理，其中各分类的生僻程度与该分类对应的加权值成正相关关系，将加权插值处理后的分类语言模型合并，得到插值语言模型；依据声学模型和所述插值语言模型构建解码资源；依据所述解码资源，对输入的语音进行解码，输出概率值最高的字符串作为所述输入语音的识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：饶丰，卢鲤，陈波，岳帅，张翔，王尔玉，谢达东，李露，陆读羚，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人