多设备唤醒词检测制造技术

技术编号：32716704 阅读：22 留言：0更新日期：2022-03-20 08:16

一种用于选择用于音频处理的设备的方法可以涉及从包括至少第一麦克风的第一设备接收第一唤醒词置信度度量并且从包括至少第二麦克风的第二设备接收第二唤醒词置信度度量。第一和第二唤醒词置信度度量可以与由第一设备确定的第一多个唤醒词置信度值的第一局部极大值和由第二设备确定的第二多个唤醒词置信度值的第二局部极大值对应。该方法可以包括将第一唤醒词置信度度量与第二唤醒词置信度度量进行比较并且至少部分基于第一唤醒词置信度度量与第二唤醒词置信度度量的比较来选择用于后续音频处理的设备。择用于后续音频处理的设备。择用于后续音频处理的设备。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】多设备唤醒词检测
[0001]对相关申请的交叉引用
[0002]本申请要求于2019年7月30日提交的美国临时专利申请No.62/880,112；以及2020年1月21日提交的No.62/964,018美国临时专利申请的优先权，所述申请通过引用并入本文。

[0003]本公开涉及用于从环境中的多个设备当中自动选择设备以用于音频处理的系统和方法。

技术介绍

[0004]音频设备，包括但不限于智能音频设备，已经被广泛部署并正在成为许多家庭的共同特征。虽然用于定位音频设备的现有系统和方法提供了益处，但是改进的系统和方法将是期望的。
[0005]符号和命名法
[0006]在本文中，我们使用表述“智能音频设备”来表示智能设备，它要么是单一目的的音频设备，要么是虚拟助手(例如，连接的虚拟助手)。单一目的音频设备是包括或耦合到至少一个麦克风(并且在一些示例中还可以包括或耦合到至少一个扬声器)并且很大程度上或主要被设计为实现单一目的的设备(例如，智能扬声器、电视(TV)或移动电话))。虽然TV通常可以播放(并且被认为能够播放)来自节目素材的音频，但在大多数情况下，现代TV运行某种操作系统，应用在操作系统上本地运行，包括看电视的应用。类似地，移动电话中的音频输入和输出可以做很多事情，但这些都是由电话上运行的应用服务的。在这个意义上，具有(一个或多个)扬声器和(一个或多个)麦克风的单一目的音频设备常常被配置为运行本地应用和/或服务以直接使用(一个或多个)扬声器和(一个或多个)麦克风。一些单一目的音频设备可以...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种选择用于音频处理的设备的方法，该方法包括：从包括至少第一麦克风的第一设备接收第一唤醒词置信度度量，第一唤醒词置信度度量与由第一设备确定的第一多个唤醒词置信度值的第一局部极大值对应；从包括至少第二麦克风的第二设备接收第二唤醒词置信度度量，第二唤醒词置信度度量与由第二设备确定的第二多个唤醒词置信度值的第二局部极大值对应；比较第一唤醒词置信度度量与第二唤醒词置信度度量；以及至少部分基于第一唤醒词置信度度量与第二唤醒词置信度度量的比较，选择用于后续音频处理的设备。2.如权利要求1所述的方法，还包括：从包括至少第三麦克风的第三设备接收第三唤醒词置信度度量，第三唤醒词置信度度量与由第三设备确定的第三多个唤醒词置信度值的第三局部极大值对应；比较第三唤醒词置信度度量与第一唤醒词置信度度量和第二唤醒词置信度度量；以及至少部分基于第一唤醒词置信度度量、第二唤醒词置信度度量与第三唤醒词置信度度量的比较，选择用于后续音频处理的设备。3.如权利要求1或权利要求2所述的方法，其中所述后续音频处理包括语音识别过程。4.如权利要求1
‑
3中的任一项所述的方法，其中所述后续音频处理包括命令识别过程。5.如权利要求4所述的方法，还包括根据命令识别过程来控制选择的设备。6.如权利要求1
‑
5中的任一项所述的方法，其中在确定唤醒词置信度值超过唤醒词检测开始阈值之后确定局部极大值。7.如权利要求6所述的方法，其中通过在先前的唤醒词置信度值已经超过唤醒词检测开始阈值之后检测唤醒词置信度值的减小来确定局部极大值。8.如权利要求6所述的方法，其中通过在先前的唤醒词置信度值已超过唤醒词检测开始阈值之后检测音频帧n的唤醒词置信度值与音频帧n
‑
k的唤醒词置信度值相比的减小来确定局部极大值，其中k是整数。9.如权利要求6
‑
8中的任一项所述的方法，还包括在第一设备、第二设备或另一设备的唤醒词置信度值以上升沿超过唤醒词检测开始阈值之后发起局部极大值确定时间间隔。10.如权利要求9所述的方法，还包括在第一设备、第二设备或另一设备的唤醒词置信度值降至低于唤醒词检测结束阈值之后终止局部极大值确定时间间隔。11.如权利要求1
‑
10中的任一项所述的方法，其中：第一设备根据第一时钟域对由第一麦克风接收的音频数据进行采样；以及第二设备根据与第一时钟域不同的第二时钟域对由第二麦克风接收的音频数据进行采样。12.如权利要求1
‑
11中的任一项所述的方法，其中该方法由被配置为至少部分执行后续音频处理的设备执行。13.如权利要求1
‑
11中的任一项所述的方法，其中该方法由被配置为确定与多个唤醒词置信度值的局部极大值对应的唤醒词置信度度量的设备执行。14.如权利要求1
‑
11中的任一项所述的方法，其中该方法由不被配置为执行后续音频处理的...

【专利技术属性】
技术研发人员：M，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人