由话音激活设备接收的音频信号中的噪声抑制由运动传感器支持。运动传感器可以提供移动或运动信息的指示,诸如话音激活设备的线性或旋转位移。可以响应于移动的指示来激活保持在空闲模式以节省功率的降噪单元。当被激活时,降噪单元可以适应于来自新位置或取向的环境噪声,并且切换回空闲模式。当随后在音频信号中检测到语音时,降噪单元已经适应于噪声,并且因此可以在被激活时在无延迟的情况下降低音频信号中的噪声。附加地或替代地,运动信息可以由降噪单元用于快速适应于音频信号中的噪声。的噪声。的噪声。
【技术实现步骤摘要】
话音激活设备中的增强降噪
[0001]相关申请的交叉引用本申请根据35 USC
§
119(e)要求于2021年10月17日提交的美国临时专利申请No. 63/262,630的优先权和权益,该申请以其整体通过引用并入本文。
[0002]本实施方式总体上涉及话音(voice)激活设备,并且具体地涉及用于话音激活设备的降噪的系统和方法。
技术介绍
[0003]话音激活设备通过收听和响应用户的话音来提供免提操作。例如,用户可以向话音激活设备询问信息(例如,食谱、指令、指导等),以回放媒体内容(例如,音乐、视频、有声读物等),或者控制用户的家庭或办公室环境中的各种设备(例如,灯、恒温器、车库门和其他家庭自动化设备)。一些话音激活设备可以与一个或多个网络(例如,云计算)资源通信以解释和/或生成对用户的询问的响应。此外,一些话音激活设备可以在生成要发送到网络资源的询问之前首先监听预定义的“触发词”或“唤醒词”。
技术实现思路
[0004]提供本
技术实现思路
是为了以简化的形式介绍下面在具体实施方式中进一步描述的概念的选择。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在限制所要求保护的主题的范围。
[0005]通过采用一个或多个运动传感器来支持由话音激活设备接收的音频信号中的噪声抑制。运动传感器可以提供移动或运动信息的指示,诸如话音激活设备的线性或旋转位移。响应于移动的指示,可以激活处于空闲模式以节省功率的话音激活设备中的降噪单元。当被激活时,降噪单元可以在切换回空闲模式之前适应于来自新位置或取向的环境噪声。当随后在音频信号中检测到语音时,可以作为响应激活降噪单元,并且在很少或没有延迟的情况下抑制音频信号中的噪声。附加地或替代地,运动信息可以被提供给降噪单元,并且可以用于快速适应于音频信号中的噪声。
[0006]在一个方面,一种在话音激活设备中处理音频信号的方法包括:感测话音激活设备的运动;在感测到运动之后将话音激活设备中的降噪单元从非活动模式切换到活动模式;以及对在感测到运动之后接收的音频信号执行降噪。
[0007]在一个方面,一种用于话音激活设备的控制器包括处理系统,所述处理系统包括耦合到所述至少一个存储器的一个或多个处理器,所述处理系统被配置为:感测所述话音激活设备的运动;至少部分地基于感测到所述运动将所述话音激活设备中的降噪从非活动模式切换到活动模式;以及对在感测到所述运动之后接收的音频信号执行降噪。
[0008]在一个方面,一种话音激活设备包括:一个或多个运动传感器,其被配置为感测话音激活设备的运动;以及降噪单元,其被配置为:至少部分地基于感测到的运动从非活动模
式切换到活动模式;以及对在感测到运动之后接收的音频信号执行降噪。
附图说明
[0009]本实施方式通过示例的方式示出,并且不旨在受附图中的图的限制。
[0010]图1示出了话音激活设备的示例。
[0011]图2示出了音频输入信号的时序图,并且示出了话音活动检测器的性能。
[0012]图3示出了音频输入信号的时序图,并且示出了在话音激活设备移动之后输入信号中的噪声。
[0013]图4示出了被配置为检测移动的话音激活设备的示例,其用于增强降噪。
[0014]图5示出了音频输入信号的时序图,并且示出了响应于检测到话音激活设备的移动而在输入信号中的降噪。
[0015]图6示出了话音激活设备,其相对于声源移动并且基于检测到的运动信息适应于声源的方向的改变。
[0016]图7示出了根据一些实施方式的示例话音激活设备的框图。
[0017]图8示出了描绘根据一些实施方式的话音激活设备的示例操作的说明性流程图。
具体实施方式
[0018]在以下描述中,阐述了许多具体细节,诸如具体部件、电路和过程的示例,以提供对本公开的透彻理解。如本文所使用的术语“耦合”意指直接连接到或通过一个或多个中间部件或电路连接。术语“电子系统”和“电子设备”可以互换使用,以指代能够电子地处理信息的任何系统。此外,在以下描述中并且出于解释的目的,阐述了具体命名法以提供对本公开的各方面的透彻理解。然而,对于本领域技术人员显而易见的是,可以不需要这些具体细节来实践示例实施例。在其他实例中,以框图形式示出了公知的电路和设备,以避免使本公开模糊不清。以下详细描述的一些部分是根据对计算机存储器内的数据位的操作的过程、逻辑块、处理和其他符号表示来呈现的。
[0019]这些描述和表示是数据处理领域的技术人员用来最有效地将他们工作的实质传达给本领域其他技术人员的手段。在本公开中,过程、逻辑块、进程等被认为是导致期望结果的步骤或指令的自洽序列。这些步骤是需要对物理量进行物理操纵的步骤。通常,尽管不一定,这些量采取能够在计算机系统中存储、传送、组合、比较和以其他方式操纵的电信号或磁信号的形式。然而,应当记住,所有这些和类似术语将与适当的物理量相关联,并且仅仅是应用于这些量的方便标签。
[0020]除非另有明确说明,否则如从以下讨论中显而易见的那样,应当理解,在整个本申请中,利用诸如“访问”、“接收”、“发送”、“使用”、“选择”、“确定”、“归一化”、“乘法”、“平均”、“监视”、“比较”、“应用”、“更新”、“测量”、“导出”等术语的讨论是指计算机系统或类似电子计算设备的动作和过程,其将表示为计算机系统的寄存器和存储器内的物理(电子)量的数据操纵和转换成类似地表示为计算机系统存储器或寄存器或其他这样的信息存储、传输或显示设备内的物理量的其他数据。
[0021]在附图中,单个框可以被描述为执行一个或多个功能;然而,在实际实践中,由该框执行的一个或多个功能可以在单个部件中或跨多个部件执行,和/或可以使用硬件、使用
软件或使用硬件和软件的组合来执行。为了清楚地说明硬件和软件的这种可互换性,下面已经在其功能性方面对各种说明性的部件、块、模块、电路和步骤进行了总体描述。此类功能性是实施为硬件还是软件取决于特定应用及强加于整个系统的设计约束。所属领域的技术人员可针对每一特定应用以不同方式实施所描述的功能性,但此类实施方式决策不应被解释为导致脱离本公开的范围。此外,示例输入设备可以包括除了所示出的那些部件之外的部件,包括诸如处理器、存储器等公知的部件。
[0022]本文描述的技术可以以硬件、软件、固件或其任何组合来实施,除非特别描述为以特定方式实施。被描述为模块或部件的任何特征也可以在集成逻辑设备中一起实施,或者单独地实施为分立但可互操作的逻辑设备。如果以软件实施,那么所述技术可至少部分地由包括指令的非暂时性处理器可读存储介质来实现,所述指令在被执行时执行所描述功能或方法中的一个或多个。非暂时性处理器可读数据存储介质可形成计算机程序产品的部分,所述计算机程序产品可包括封装材料。
[0023]非暂时性处理器可读存储介质可以包括随机存取存储器(RAM)(诸如同步动态随机存取存储器(SDRAM))、只读存储器(ROM)、非易失性随机存取存储器本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种在话音激活设备中处理音频信号的方法,包括:感测所述话音激活设备的运动;至少部分地基于感测到所述运动,将所述话音激活设备中的降噪单元从非活动模式切换到活动模式;以及经由所述降噪单元对在感测到所述运动之后接收的音频信号执行降噪。2.根据权利要求1所述的方法,其中对音频信号执行降噪包括语音增强、信噪比SNR增强、空间滤波、波束成形、干扰消除、噪声消除、或其任何组合中的一个或多个。3.根据权利要求1所述的方法,其中将所述降噪单元从所述非活动模式切换到所述活动模式是响应于感测到所述运动,并且其中对在感测到所述运动之后接收的所述音频信号执行所述降噪包括在从所述活动模式切换回所述非活动模式之前,适应于所述音频信号中的环境噪声。4.根据权利要求3所述的方法,其中在适应于所述音频信号中的所述环境噪声之后,所述方法还包括:检测音频信号中的语音;以及响应于检测到所述语音,将所述降噪单元从所述非活动模式切换到所述活动模式,其中所述降噪单元适应于所述音频信号中的所述环境噪声。5.根据权利要求1所述的方法,还包括根据感测到所述运动生成运动信息,并且其中在感测到所述运动之后执行所述降噪使用所述运动信息。6.根据权利要求5所述的方法,还包括在感测到所述运动之后检测语音,并且其中将所述降噪单元从所述非活动模式切换到所述活动模式是响应于检测到所述语音。7.根据权利要求5所述的方法,还包括基于在感测到所述运动之前的转向状态和所述运动信息来确定用于波束成形的转向方向以接收所述音频信号,并且其中在感测到所述运动之后执行所述降噪使用所述转向方向。8.一种用于话音激活设备的控制器,包括:至少一个存储器;以及处理系统,其包括耦合到所述至少一个存储器的一个或多个处理器,所述处理系统被配置为:感测所述话音激活设备的运动;至少部分地基于感测到所述运动,将所述话音激活设备中的降噪从非活动模式切换到活动模式;以及对在感测到所述运动之后接收的音频信号执行所述降噪。9.根据权利要求8所述的控制器,其中所述处理系统被配置为通过被配置为执行语音增强、信噪比SNR增强、空间滤波、波束成形、干扰消除、噪声消除、或其任何组合中的一个或多个来对音频信号执行降噪。10.根据权利要求8所述的控制器,其中所述处理系统被配置为响应于感测到所述运动而将所述降噪从所述非活动模式切换到所述活动模式,并且其中所述处理系统被配置为通过被配置为在从所述活动模式切换回所述非活动模式之前适应于所述音频信号中的环境噪声来对在感测到所述运动之后接收的所述音频信号执行所述降噪。11.根据权利要求10所述的控制器,其中在适应于所述音频信号中的所述环境噪声之
【专利技术属性】
技术研发人员:Y,
申请(专利权)人:DSP集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。