用于设备唤醒的低功率语音门制造技术

技术编号:10786862 阅读:99 留言:0更新日期:2014-12-17 13:49
本发明专利技术提供了一种用于设备唤醒的低功率语音门。一种分级处理系统可以被配置为减小音频信号的语音探测期间的功率消耗。第一级可以包含探测音频信号中的最小声音阈值。然后可以触发第二级施加Teager算子,以确定所述音频信号中的语言能量的信噪比。当探测到最小SNR时,可以触发第三级,以探测所述音频信号中的周期性并识别所述音频信号中的语音信号。当探测到语音信号时,可以触发第四级以处理语音命令。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种用于设备唤醒的低功率语音门。一种分级处理系统可以被配置为减小音频信号的语音探测期间的功率消耗。第一级可以包含探测音频信号中的最小声音阈值。然后可以触发第二级施加Teager算子,以确定所述音频信号中的语言能量的信噪比。当探测到最小SNR时,可以触发第三级,以探测所述音频信号中的周期性并识别所述音频信号中的语音信号。当探测到语音信号时,可以触发第四级以处理语音命令。【专利说明】用于设备唤醒的低功率语音门
本公开内容涉及移动设备。更具体地,本公开内容涉及对移动设备的功率减小。
技术介绍
人们通常通过口语单词最舒服地通信。然而,人与电子设备的交互常规地是通过 触觉方法,诸如利用物理键盘和鼠标交互,并且最近是通过触摸屏来交互。在触觉交互的情 况下,来自用户的输入是容易通过键盘上的键的触发或通过触摸屏设备的电容的变化来探 测的。触觉输入可以涉及没有处理或有限的处理来探测与用户的交互的开始。例如,可以 通过压力传感器探测何时按压键来探测物理键敲击。在另一范例中,可以通过确定触摸屏 的电容值何时与阈值相交来探测触摸屏上的重击。在触觉输入中,在探测用户交互的起始 时存在一些假阳性。即,当用户不意图开始与电子设备交互时,电子设备很少探测到触摸屏 上的重击运动或探测到键盘上的键按压。 输入至电子设备的音频可以变得对用户更舒服和容易。例如,与电子设备的交互 可能需要两只手来在键盘上打字或两个拇指来在移动设备上打字。替代地,能够利用仅一 只手握持设备,或甚至不用手,来向电子设备提供音频输入。例如,用户可以使移动设备位 于口袋中,并且将其配置为无手模式用于通过无线耳机(headset)接收音频输入。然而,电 子设备附近的噪声总是向电子设备的麦克风提供输入。即,总是存在背景噪声,并且背景噪 声仅很少地含有意图用于电子设备的音频输入。此外,可能难以将音频输入与背景噪声区 别开,特别是当使用单个麦克风输入时。从而,电子设备必需连续地处理由电子设备中的麦 克风接收的音频信号以确定是否存在音频输入。此处理消耗电子设备的资源,这可以导致 处理器以较慢的响应时间来完成其它任务,并且可以消极地影响电子设备的电池寿命。 一个常规方案是不通过电子设备处理音频信号,直到用户用信号向电子设备通知 正在开始音频输入为止。例如,用户可以选择电子设备上的"语音搜索"图标,引起电子设 备开始记录来自麦克风的音频信号,并且处理音频信号来识别音频输入。然而,此常规的方 案对于用户是较不舒服的并且减小了用户通过音频输入与电子设备交互的可能性。 这里提到的缺点仅是代表性的并且简单地包含它们以强调存在对改进的电子设 备的需求,特别是在消费者水平的设备中。于此描述的实施例应对某些缺点,但是不必处理 于此描述的或本领域已知的每一个缺点。
技术实现思路
电子设备的语音触发可以改进电子设备的智能,并给用户提供更舒服的输入方 法。语音触发例如在智能电话上在用户向智能电话提供音频输入且用户不具有任何空闲的 手时,诸如当驾驶汽车时,可能是有用的。音频输入可以由电子设备中的语音门探测,语音 门可以生成唤醒信号来触发电子设备中的其它部件。例如,语音门可以位于电子设备的低 功率部件中,以减小没有探测到音频输入时的功率消耗。当探测到音频输入时,语音门可以 向电子设备的另一部件,诸如应用处理器,发送唤醒信号,以基于语音输入执行操作。从而, 语音门可以减小电子设备等待来自用户的音频输入时电子设备的功率消耗。 可以对语音探测进行分级以进一步减小功率消耗。例如,当音频信号达到阈值水 平时,可以探测第一级。当音频号具有够的声音时,可以触发第二级以探测增大的瞬时信号 能量。当探测的增大的信号能量时,指示语音信号的概率,则可以触发第三级以搜索语音信 号中的周期性,匹配人声带生成的周期性。当探测到周期性时,可以触发第四级来处理音频 信号,确定音频信号中的语音命令,并执行语音命令中的指令。 在某些实施例中,可以至少部分地基于向音频信号施加 Teager算子的结果来计 算音频信号的信噪比(SNR)。向音频信号施加 Teager算子来计算SNR可以作为利用语言能 量探测和语音信号探测来提供用于在不同和变化的环境中识别语音信号的更鲁棒和精确 的方法的系统的部分来实现。 在一个实施例中,一种方法可以包含在处理器处接收音频信号。所述方法还可以 包含在所述处理器处向所述音频信号施加 Teager算子,以计算所述音频信号中的能量的 瞬时变化。所述方法还可以包含在所述处理器处至少部分地基于计算的所述能量的瞬时变 化来计算所述音频信号的信噪比(SNR)。所述方法还可以包含当所述SNR在信号阈值以上 时,设定第一探测标记。 所述方法还可以包含:当设定了第一探测标记时,基于所述音频信号的倒谱来计 算峰度,并且当所述峰度在阈值以上时,设定第二探测标记;以及当设定了所述第二探测标 记时,唤醒第二处理器来识别所述音频信号中的语言命令;计算所述音频信号内对于搜索 窗口的所述能量的瞬时变化,以及基于所述搜索窗口内的最小能量值来计算噪声水平;通 过估计环境波动来调整所述信号阈值;基于所述音频信号的平均能量值和所述音频信号的 标准偏差中的至少之一来对所述环境波动进行分类;和/或设定噪声跟踪系数,以对所述 环境波动进行分类,并调整所述噪声跟踪系数。 根据另一实施例,一种装置可以包含:音频信号输入端;以及语音门,耦合至所述 音频信号输入端。所述语音门包含:语言能量探测模块,被配置为向音频信号施加 Teager 算子,以计算所述音频信号输入端的能量的瞬时变化,并被配置为至少部分地基于计算的 所述能量的瞬时变化来计算所述音频信号的信噪比(SNR)。所述语音门还可以包含探测标 记输出端,其中,当所述SNR在信号阈值以上时,设定所述探测标记输出端。 所述装置还可以包含:耦合至所述音频信号输入端的缓冲器,其中,所述缓冲器被 配置为缓冲来自所述音频信号输入端的传入音频;耦合至所述语音门和所述音频信号输 入端的抽选(decimation)滤波器,其中,所述抽选滤波器被配置为减小来自所述音频信号 输入端的音频样本的采样率;耦合至所述语音门的音频采样处理模块,其中,所述音频样 本处理模块被配置为在所述信号水平在唤醒阈值以下时,对所述语音门进行断电(power down);模拟-数字转换器,耦合至所述音频信号输入端和所述语音门,其中,所述模拟-数 字转换器被配置为在所述信号水平在所述唤醒阈值以上时,将来自所述音频信号输入端的 模拟信号转换为数字;耦合至所述探测标记输出端的语音信号探测模块,其中,所述语音 信号探测模块被配置为基于所述音频信号的倒谱来计算峰度,以及当所述峰度在阈值以上 时,生成唤醒信号;和/或耦合至所述语音门的应用处理器,其中,所述应用处理器被配置 为在生成所述唤醒信号时,进一步处理所述音频信号,以确定所述音频信号中的语音命令。 在某些实施例中,语言能量探测器进一步被配置为至少部分地基于环境波动来调整所述信 号阈值。 根据再一实施例,一种计算机程序产品可以包含非瞬态计算机可读介质,所述非 瞬态计算机可读介质包括执行以下步骤的代码:在处本文档来自技高网
...

【技术保护点】
一种方法,包括:在处理器处接收音频信号;在所述处理器处向所述音频信号施加Teager算子,以计算所述音频信号中的能量的瞬时变化;在所述处理器处至少部分地基于计算的所述能量的瞬时变化来计算所述音频信号的信噪比(SNR);以及当所述SNR在信号阈值以上时,设定第一探测标记。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:J·L·许
申请(专利权)人:塞瑞斯逻辑公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1