由有限的用户圈用语音控制启动可在设备内执行的动作的方法技术

技术编号：3047046 阅读：262 留言：0更新日期：2012-04-11 18:40

为了由设备的有限用户圈的用户利用语音在与用户无关的情况下控制启动可在设备中执行的动作，并在与发音者有关的语音识别系统的基础上与用户无关地和无需用户识别地识别所述的语音，给用户圈用户的识别语音发音－例如一种词汇表的单词－分配一个语音识别系统的所有用户的、对识别所需的参考语音样式。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
利用语音、也即人的自然通信方式把信息或数据或指令输入到设备内-例如电信终端设备象有绳或无绳电话、移动无线电手机等等，家用电器象洗衣机、电灶、冰箱等等，机动车辆象汽车、飞机、船等等，消遣电子设备象电视机、HIFI设备等等，用于控制输入和指令输入的电子设备象个人计算机、个人数字助理等等-，以便用语音控制启动可在各自设备中执行的动作，其首要目的是对此用来输入数据或指令的手被解放出来做其它日常工作活动。对此，所述的设备要具有语音识别装置，它在专业文献中也称之为语音识别器。作为符号和语音的系统，语音自动识别的领域包括识别孤立发音的符号和语音，例如单个词、指令，直到识别按照人的自然通信方式而流利地说出的符号和语音，例如多个相关的词、一个或多个句子、一篇讲话。自动语音识别在原理上是一个搜索过程，这个过程按照杂志“Funkschau(无线电展望)第26册，1998年，72-74页”粗略分成语音信号预加工阶段、数据量减少阶段、分类阶段、构成字串阶段和语法模型阶段，这些阶段在语音识别过程中按给定的顺序执行。按照杂志“Funkschau(无线电展望)第13册，1998年，78-80页”所述，以这种方案工作的语音识别器根据其依赖于发音者的程度是互不相同的。在与发音者有关的语音识别器中由每个用户存入在至少一个学习或训练阶段的全部词汇以产生参考样式，而这个过程在与发音者无关的语音识别器中可取消。与发音者无关的语音识别器几乎只是以音素为基础进行工作，而与发音者有关的语音识别器或多或少地是一个单词识别器。根据这种语音识别器的定义，与发音者无关的语音识别器尤其在这样的设备内使用，它一方面必须...

【技术保护点】
通过有限用户圈用语音控制来启动可在设备中执行的动作的方法，有以下特征：（ａ）利用分别属于设备用户圈的至少一个用户的语音，分别在由用户引入的至少一个语音训练阶段中针对由每个用户所选出的至少一个工作模式来如此地训练所述的设备，使得（ａ１）由这些用户中的至少一个用户针对至少一个动作而分别将分别属于该动作的至少一个参考语音发音输入到所述的设备内，（ａ２）从参考语音发音中通过语音分析产生一个参考语音样式，其中在多个参考语音发音且参考语音发音相类似时产生所述的参考语音样式，（ａ３）给所述的动作分配所述的参考语音样式，（ａ４）无条件地存储具有所分配的动作的参考语音样式，或者只有当参考语音样式与分配给其它动作的已经存储的其它参考语音样式不一样时，才存储具有所分配的动作的参考语音样式，（ｂ）每个用户针对在语音识别阶段中由用户所选出的设备工作模式将一个识别语音发音输入到所述的设备中，（ｃ）从识别语音发音中通过语音分析产生一个识别语音样式，（ｄ）所述的识别语音样式至少被如此地与为选出的工作模式而存储的参考语音样式的一部分进行比较，使得测出每个参...

【技术特征摘要】
DE 2000-3-8 10011178.51.通过有限用户圈用语音控制来启动可在设备中执行的动作的方法，有以下特征(a)利用分别属于设备用户圈的至少一个用户的语音，分别在由用户引入的至少一个语音训练阶段中针对由每个用户所选出的至少一个工作模式来如此地训练所述的设备，使得(a1)由这些用户中的至少一个用户针对至少一个动作而分别将分别属于该动作的至少一个参考语音发音输入到所述的设备内，(a2)从参考语音发音中通过语音分析产生一个参考语音样式，其中在多个参考语音发音且参考语音发音相类似时产生所述的参考语音样式，(a3)给所述的动作分配所述的参考语音样式，(a4)无条件地存储具有所分配的动作的参考语音样式，或者只有当参考语音样式与分配给其它动作的已经存储的其它参考语音样式不一样时，才存储具有所分配的动作的参考语音样式，(b)每个用户针对在语音识别阶段中由用户所选出的设备工作模式将一个识别语音发音输入到所述的设备中，(c)从识别语音发音中通过语音分析产生一个识别语音样式，(d)所述的识别语音样式至少被如此地与为选出的工作模式而存储的参考语音样式的一部分进行比较，使得测出每个参考语音样式和识别语音样式之间的相似性，并根据测出的相似值产生所述存储的参考语音样式的相似性优先次序，(e)如果识别语音样式与处于相似性优先次序第一位置上的参考语音样式相似，或识别语音样式与处于相似性优先次序第一位置上的参考语音样式相似且与处于相似性优先次序上第n个位置上的参考语音样式不相似，则用户试图用识别语音发音进行语音控制以启动可在设备中执行的动作被识别为是允许的，其中，给在相似性优先次序上处于第n个位置上的参考语音样式分配一个动作，该动作在相似性优先次序上与处于第一位置上的参考语音样式所分配的动作是不同的，并且，给相同的动作分配所述在相似性优先次序上处于第一且直到第(n-1)个位置上的参考语音样式，f)在所述的设备中，只有当针对在语音识别阶段由用户选出的设备工作模式而由用户输入的识别语音发音被识别是允许的时，才执行给所述在相似性优先次序上处于第一位置的参考语音样式所分配的动作。2.按照权利要求1所述的方法，其特征在于，如果在分别2个语音样式之间的应通过分析确定的间隔大小低于给定值或低于给定值且与这个值相等，则多个语音样式可确定为相似，其中所述的间隔大小表示一个语音样式与其它语音样式的距离。3.按照权利要求2所述的方法，其特征在于，用隐藏-马尔可夫-模型化或神经元网的动态编程(动态时间偏差)的方法测出或计算出所述的间隔大小。4.按照权利要求1-3之一所述的方法，其特征在于，由用户至少输入一个单词作为参考语音发音。5.按照权利要求1-4之一所述的方法，...

【专利技术属性】
技术研发人员：R奥保尔，
申请(专利权)人：西门子公司，
类型：发明
国别省市：DE[德国]

全部详细技术资料下载我是这个专利的主人