语言处理制造技术

技术编号：3047619 阅读：154 留言：0更新日期：2012-04-11 18:40

一种产生用于语言识别的特征的方法和设备，所说方法包括：计算一个输入语言信号的预定数目的ｎ个帧中的每一帧的对数帧能量值；并且向ｎ个对数帧能量值施加一个矩阵变换以形成代表输入语言信号的一个时序矩阵。该矩阵变换可以是离散余弦变换。（*该技术在2017年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语言处理，具体来说涉及用于语言识别的特征的产生。自动语言识别系统一般是为一特定的应用设计的。例如，一种由公众访问的服务要求有一种普通的语言识别系统，这种系统可识别来自任何用户的语言。和专用于一个用户的数据有关的自动语言识别器或者用于识别用户，或者用于鉴定用户的要求保护的身份(所谓发言者识别)。自动语言识别系统或者直接地或者间接地(例如经一电信链路)接收来自一个送话器的输入信号。然后通过语言处理装置处理该输入信号，一般通过产生随时间而变的输入信号的特征的一个适当的(频谱)表示，把输入信号分割成相继的时间区段或帧。频谱分析的通用技术是线性预测编码(LPC)和傅里叶变换。接着，把频谱测量值转换成用于描述输入信号的宽声学性质的一组特征或特征矢量。在语言识别中所用的最普通的特征是唛(音调单位)-频率倒频系数(mel-frequency cepstral coefficlents-MFCC)。然后，将这些特征和代表要识别的字(或者字的一些部分)或短语的多个模式进行比较，其中所说的多个模式还按某种方式和所说的字或短语有关联。比较的结果指示字/短语是否被认为已被识别。用于语言识别的模式匹配法一般来说涉及两种技术之一模板匹配技术或统计模型技术。对于前者，形成一个模板，该模板代表表示一个字的典型语言信号的频谱特性。每个模板是在整个语言持续期间的频谱帧的结合。于是，经一平均步骤可产生用于一个模式的语言帧的一个典型的序列，并且将一个输入信号和这些模板作比较。表示一个模式的多个帧的频谱特性的特点的一种众所周知的并且广泛使用的统计方法是隐式马尔可夫模型(hidde...

【技术保护点】
一种产生用于语言响应设备的特征的方法，所说方法包括：计算一个输入语言信号的预定数目的ｎ个帧中的每一帧的对数帧能量值；并且，向ｎ个对数帧能量施加一个变换矩阵以形成代表该输入语言信号的一个时序矩阵。

【技术特征摘要】
EP 1996-3-29 96302236.31．一种产生用于语言响应设备的特征的方法，所说方法包括计算一个输入语言信号的预定数目的n个帧中的每一帧的对数帧能量值；并且，向n个对数帧能量施加一个变换矩阵以形成代表该输入语言信号的一个时序矩阵。2．如权利要求1的方法，其中相继的特征代表该输入信号n个帧的各个重叠的组。3．如权利要求1或2的方法，其中变换矩阵是一离散余弦变换。4．如权利要求1、2或3的方法，其中截断该时序矩阵以包括小于n个的元素。5．一种语言识别方法，包括接收代表语言的输入信号，把所说输入信号分成多个帧；通过计算一个输入语言信号的预定数目的n个帧中每个帧的对数帧能量值产生一个特征；并且向n个对数帧能量值施加一个矩阵变换以形成代表输入语言信...

【专利技术属性】
技术研发人员：BP米尔纳，
申请(专利权)人：英国电讯公司，
类型：发明
国别省市：GB[英国]

全部详细技术资料下载我是这个专利的主人