计算装置的功耗可通过一个或多个关键字进行管理。例如,如果所述计算装置获得的音频输入包含关键字,那么所述计算装置的网络接口模块和/或应用处理模块可被启用。所述音频输入然后可经由所述网络接口模块传输到远程计算装置,诸如,语音识别服务器。或者,所述计算装置可配有语音识别引擎,所述语音识别引擎配置来处理所述音频输入以便进行装置上的语音识别。
【技术实现步骤摘要】
【国外来华专利技术】【专利说明】
技术介绍
计算装置可包含语音识别能力。例如,计算装置可捕获音频输入并使用声学模型和语言模型来识别语音。声学模型用来生成假设,其中基于语音的声学特征,声音子字单元(例如,音素等)对应于语音。语言模型基于所说语音所用语言的词汇特征来确定使用声学模型生成的哪个假设最有可能是语音的抄本。计算装置也能够针对具体的语音识别应用来处理识别的语音。例如,有限的语法或自然语言处理技术可用来处理语音。附图简述参考以下详细说明,结合附图,将更易于了解、同时更好地理解本公开的各方面以及随之而来的很多优点,在附图中:图1为描绘说明性功率管理子系统的示意图。图2为描绘包括功率管理子系统的说明性用户计算装置的示意图。图3为描绘用于语音识别功率管理的说明性例行程序的流程图,所述语音识别功率管理可由图1的功率管理子系统实施。图4A、图4B和图4C为描绘分布式语音识别系统的说明性操作的状态图。图5为描绘说明性用户接口的直观图,所述用户接口可由包括功率管理子系统的用户计算装置提供。详细说明在语音识别的一些当前方法中,语音识别能力被分配到分布式计算环境中的一个或多个计算装置上。在这些方法的一个具体实例中,第一计算装置可配置来捕获音频输入,并且可通过网络将音频输入传输到第二计算装置。第二计算装置可对音频输入执行语音识另IJ,并且生成音频输入中包含的语音的抄本。语音的抄本随后可通过网络从第二计算装置传输回到第一计算装置。在其他当前方法中,第一计算装置可配置来捕获音频输入并独立地转录音频输入。在这些和其他当前方法中,第一计算装置可配置来保持在持续活动状态。在这种持续活动状态下,第一计算装置可连续不断地维持到第二计算装置的网络连接。第一计算装置也可继续为用来实施自身的语音识别能力的任何硬件提供电力。这些方法的一个缺点尤其在于,第一计算装置用来维持持续活动状态而消耗的能量可能是无法接受的。对于依赖电池电力的移动计算装置而言,这种能量需求特别成问题。当前方法中还有其他问题。因此,本公开的方面涉及语音识别的功率管理。计算装置可配有功率管理子系统,所述功率管理子系统选择性地启用或停用计算装置的一个或多个模块。此启用可响应于音频输入,所述音频输入包括一个或多个预先指定的所说字词,本文中有时称为“关键字”。促使启用一个或多个部件的关键字在本文中有时称为“唤醒字”,而促使停用一个或多个部件的关键字在本文中有时称为“休眠字”。在一个特定实例中,计算装置可包括选择性地启用的网络接口模块,所述网络接口模块在启用时会消耗能量以使得计算装置连接到第二计算装置,诸如,语音识别服务器或其他计算装置。功率管理子系统可处理音频输入以确定音频输入是否包含唤醒字,并且响应于确定音频输入包括唤醒字而启用网络接口模块。启用网络接口模块之后,功率管理子系统可使音频输入传输到语音识别服务器以进行处理。功率管理子系统自身可包括一个或多个选择性地启用的模块。在一些实施例中,一个或多个选择性地启用的模块被实施为专用硬件(诸如集成电路、数字信号处理器或其他类型的处理器),其可从功能相对较少的低功率停用状态切换到功能相对较多的高功率启用状态,并且反之亦然。在其他实施例中,一个或多个模块被实施为软件,其包含由一个或多个通用处理器执行的计算机可执行代码。通过启用(或停用)通用处理器可启用(或停用)软件模块,所述通用处理器配置来或能够执行软件中包含的计算机可执行代码。在另外的实施例中,功率管理系统包括一个或多个硬件模块以及一个或多个软件模块。功率管理子系统可还包括与一个或多个选择性地启用的模块通信的控制模块。此控制模块在本文中有时称为“功率管理模块”,并且可包括上述硬件或软件中的任一个。功率管理模块可使启用或停用功率管理子系统的模块。在一些实施例中,至少部分基于计算装置中包括的音频输入模块获得的音频输入的特征,功率管理模块启用或停用一个或多个模块。例如,功率管理子系统的模块可确定一个或多个值,例如,所述值可包括音频输入的能量水平或音量;对应于语音出现在音频输入中的可能性的分数;对应于关键字出现在语音中的可能性的分数;以及其他值。模块可将一个或多个值传送到功率管理模块,所述功率管理模块可与另一模块通信以使该模块启用,或者与从中接收一个或多个值的模块通信以使所述模块和/或其他模块停用。然而,在其他实施例中,第一选择性地启用的模块可直接与第二选择性地启用的模块通信,以使该模块启用。在此类实施例中,无需功率管理模块。在另外的实施例中,功率管理子系统可配有一个或多个模块,其中一个或多个模块中的至少一些彼此通信,但不与功率管理模块通信。在一个示例性实施方案中,功率管理子系统可包括音频检测模块,所述音频检测模块可配置来确定计算装置获得的音频输入的能量水平或音量。尽管音频检测模块可持续监测音频输入,但功率管理子系统的其余部件可保持在低功率非活动状态,直到被启用为止(被功率管理模块或另一不同模块启用)。如果音频检测模块确定音频输入满足阈值能量水平或音量,则语音检测模块可被启用以确定音频输入是否包含语音。如果语音检测模块确定音频输入包含语音,则功率管理子系统中包括的语音处理模块可被启用。语音处理模块可确定语音是否包含唤醒字,并且可任选地对语音分类,以确定特定的用户是否说出所述唤醒字。如果语音处理模块确定语音包含唤醒字,那么应用处理模块可被启用,所述应用处理模块可实施存储在计算装置的存储器中的语音识别应用模块。例如,语音识别应用可包括智能代理前端,诸如,如2011年I月10日申请并于2012年I月19日公开为美国公布号 2012/0016678 的“智能自动助理(Intelligent Automated Assistant) ” 中所描述的智能代理前端。该专利申请的公开内容以全文引用的方式并入本文中。选择性地启用的网络接口模块也可被启用,如上文所述,并且音频输入可被传输到远程计算装置,以便进行处理。下文相对于图3更详细地论述了此示例性实施方案。或者,功率管理子系统可响应于检测到唤醒字而启用处理单元,所述处理单元实施计算装置的任何装置上的语音识别能力。通过选择性地启用计算装置的模块,功率管理子系统可有利地提高计算装置的能量效率。通过选择性地启用一个或多个自身的模块,功率管理子系统还可提高计算装置的能量效率。尽管对于依赖电池电力的计算装置而言,此类实施方案尤其有利,但可能需要功率管理的所有计算装置均可受益于本公开的原理。现在转到图1,示出可包括在计算装置中的说明性功率管理子系统100。功率管理子系统100可包括模/数转换器102 ;存储器缓冲模块104 ;音频检测模块106 ;语音检测模块108 ;语音处理模块110 ;应用处理模块112 ;以及功率管理模块120。存储器缓冲模块104可与音频检测模块106、语音检测模块108、语音处理模块110、应用处理模块112以及网络接口模块206通信。功率管理模块120同样可与音频检测模块106、语音检测模块108、语音处理模块110、应用处理模块112以及网络接口模块206通信。模/数转换器102可接收来自音频输入模块208的音频输入。下文相对于图2还详细地论述音频输入模块208。模/数转换器102可配置来将模拟音频输入转换成数字音频输入,以便由功率管理子系本文档来自技高网...
【技术保护点】
一种系统,其包括:音频输入模块,其配置来接收音频输入;与所述音频输入模块通信的音频检测模块,所述音频检测模块配置来确定所述音频输入的音量,并且至少部分基于所确定的音量,使语音检测模块启用;所述语音检测模块配置来确定指示所述音频输入包括语音的可能性的第一分数,并且至少部分基于所述分数,使唤醒字识别模块启用;所述唤醒字识别模块配置来确定指示所述音频输入包括唤醒字的可能性的第二分数;以及网络接口模块,其配置来将所获得的音频输入的至少一部分传输到远程计算装置。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:肯尼思·约翰·巴斯耶,休·埃文·塞克瓦尔克,托尼·大卫,赖因哈德·克内泽尔,杰弗瑞·彭罗德·亚当斯,斯坦·魏德纳·萨尔瓦多,马赫什·克里希纳穆尔蒂,
申请(专利权)人:亚马逊技术有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。