通过使用平方根折扣的统计语言的语音识别制造技术

技术编号：3044907 阅读：260 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及统计语言建模和语音识别的方法，该方法提供预定顺序的预定数目的词，并提供包括预定数目的词序列的训练语料，其中每个序列由所提供的预定顺序的预定数目的跟随有至少一个附加词的词组成，提供候选词，并基于训练语料为每个候选词计算该候选词跟随所提供的预定数目的词的概率，确定至少一个候选词，对该候选词计算的概率超过预定的阈值，其中候选词的概率是基于平滑的最大似然概率计算的，该最大似然概率是为训练语料的词序列计算的，对于训练语料的所有词序列，最大似然概率大于或等于预定的正实数，该正实数小于或等于训练语料的词序列的预定数目的倒数值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及采用统计平滑的统计语言建模的方法。特别地，本专利技术涉及基于统计语言建模的语音识别方法，该统计建模利用平滑的概率计算，具体地，折扣所观察到的事件的概率。
技术介绍
统计语言建模是试图捕获自然语言的规律性，并因此捕获到人机交互的自然语言系统的基本成分。统计语言模型旨在尽可能精确地估计自然语言的分布。这些模型在不同自然语言应用中扮演了重要角色，如语音识别、机器翻译、文本到语音系统以及拼写校正。语音识别可以当作统计语言建模的尤其重要的应用。语音识别系统，即将声学信号转换为词或词串的序列的设备，这在今天越来越流行。在过去的几年中，由于语音识别技术的急剧改进，高性能的语音分析、识别算法和语音对话系统已经变得常见。今天，语音输入能力包括语音拨号、呼叫路由、文献准备等。语音对话系统例如可以采用在汽车中，从而允许用户控制不同的装置，如移动电话，车载收音机，导航系统和/或空调。在语音识别发声过程中，例如，孤立的词或连续的语音被麦克风或电话捕获，并被转换为模拟电子信号，该电子信号然后被数字化。数词信号通常经过后续的波谱分析。通常以6.6KHz和20KHz之间的速率采样的语音波形的表示是从短时间功率谱获得的，并表示一系列特征化的矢量，这些矢量含有通常被称为特征/特征参数的值。特征参数的值被用于估计部分被分析波形的概率，例如该被分析波形相应于特定项目，如词汇表中的词。尽管已经有尝试将语言结构和理论以及语义的先验知识包括到统计语言建模中，并且目前可以采用利用语境(context)的统计信息的方法，如集合Markov模型(aggregate Marko...

【技术保护点】
一种用于统计语言建模的方法，其包括以下步骤：　　　　以预定的顺序提供预定数目的词；　　　　提供包括预定数目词序列的训练语料，其中每个词序列由所提供的预定顺序的预定数目的词组成，所述预定数目的词跟随有至少一个额外词；　　　　提供候选词，并基于训练语料为每个候选词计算该候选词跟随所提供的预定数目的词的概率；和　　　　确定对其计算的概率超过预定阈值的至少一个候选词；　　　　其特征在于　　　　所述候选词的概率是基于平滑的最大似然概率计算的，该最大似然概率是为训练语料的词序列计算的，对于训练语料的所有词序列，该最大似然概率大于或等于预定的正实数，该正实数小于或等于训练语料的词序列的预定数目的倒数值。

【技术特征摘要】
EP 2006-8-11 06016867.11.一种用于统计语言建模的方法，其包括以下步骤以预定的顺序提供预定数目的词；提供包括预定数目词序列的训练语料，其中每个词序列由所提供的预定顺序的预定数目的词组成，所述预定数目的词跟随有至少一个额外词；提供候选词，并基于训练语料为每个候选词计算该候选词跟随所提供的预定数目的词的概率；和确定对其计算的概率超过预定阈值的至少一个候选词；其特征在于所述候选词的概率是基于平滑的最大似然概率计算的，该最大似然概率是为训练语料的词序列计算的，对于训练语料的所有词序列，该最大似然概率大于或等于预定的正实数，该正实数小于或等于训练语料的词序列的预定数目的倒数值。2.如权利要求1所述的方法，其中如果观察到的训练语料的词序列的频率cj都没有落在所述预定正实数乘以训练语料的所有预定数目的词序列的整体频率以下，其中该正实数小于或等于词序列的预定数目的倒数值，则对于包括所提供的跟随有所述候选词的预定顺序的预定数目的词或由其组成的每个词序列，基于最大似然概率计算每个候选词的概率。3.如权利要求2所述的方法，其中如果对于至少一个j，cj＜mS，这里cj表示训练语料的N个词序列中观察到的第j个词序列的频率，且S是训练语料中所有观察到的词序列的整体频率且m是预定正实数，其小于或等于词序列的预定数目N的倒数值，对所述候选词的概率pj的计算包括以下步骤a)以下式计算实数α其中b)计算平滑的计数c)通过pj＝cj’/S计算平滑的概率pj，和d)如果pj≥m，由pj确定每个候选词的概率。4.如权利要求3所述的方法，其中如果如步骤c)中计算的pj至少有一个小于预定正实数m，该正实数小于或等于词序列的预定数目N的倒数值，则按照从最大似然概率pj(0)＝cj/S开始并进一步由pj(n)＝<(pj(n-1)>定义的概率pj(n)的归纳序列，对权利要求3中的步骤a)到c)进行迭代，确定每个候选词的概率，其中<>表示平滑的计数cj’的迭代计算。5.如前述任一权利要求所述的方法，其中训练语料中包括的每个词序列由二元文法和/或三元文法和/或四元文法组成。6.如前述任一权利要求所述的方法，其中每个候选词的概率是基于n元文法和(n-1)元文法计算的。7.一种用于语音识别的方法，其包括...

【专利技术属性】
技术研发人员：G维尔申，
申请(专利权)人：哈曼贝克自动系统股份有限公司，
类型：发明
国别省市：DE[德国]

全部详细技术资料下载我是这个专利的主人