音频会话管理方法与音频会话管理系统技术方案

技术编号：42297217 阅读：5 留言：0更新日期：2024-08-14 15:46

本公开涉及音频会话管理方法与音频会话管理系统。一种音频会话管理方法可以涉及：由音频会话管理器确定第一智能音频设备的第一媒体引擎的一个或多个第一媒体引擎能力，第一媒体引擎被配置用于管理由第一智能音频设备接收的一个或多个音频媒体流以及用于根据第一媒体引擎采样时钟针对一个或多个音频媒体流执行第一智能音频设备信号处理；由音频会话管理器并且经由第一应用通信链路来接收来自第一应用的第一应用控制信号；以及由音频会话管理器根据第一媒体引擎能力，通过经由第一智能音频设备通信链路在不参考第一媒体引擎采样时钟的情况下传输到第一智能音频设备的第一音频会话管理控制信号来控制第一智能音频设备。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及用于协调(编排)和实施音频设备的系统和方法，所述音频设备可以包括智能音频设备。

技术介绍

1、音频设备，包括但不限于智能音频设备，已经被广泛部署并且正在成为许多家庭的共同特征。尽管用于控制音频设备的现有系统和方法提供了益处，但改进的系统和方法将仍是期望的。

2、符号和术语

3、贯穿本公开，包括在权利要求中，“扬声器(speaker)”和“扩音器(loudspeaker)”同义地用于表示由单个扬声器馈送驱动的任何发声换能器(或一组换能器)。典型的耳机包括两个扬声器。扬声器可以被实施为包括多个换能器(例如，低音扬声器和高音扬声器)，所述换能器可以由单个公共扬声器馈送或多个扬声器馈送驱动。在一些示例中，(多个)扬声器馈送可以在耦接到不同换能器的不同电路分支中经历不同处理。

4、贯穿本公开，包括在权利要求中，在广义上使用“对”信号或数据进行操作的表达(例如，对信号或数据进行滤波、缩放、变换或施加增益)来表示直接对信号或数据进行操作或对信号或数据的已处理版本(例如，在对其进行操作之前已进行了初步滤波或预处理的信号版本)进行操作。

5、贯穿本公开，包括在权利要求中，在广义上使用表达“系统”来表示设备、系统或子系统。例如，实施解码器的子系统可以被称为解码器系统，并且包括这种子系统的系统(例如，响应于多个输入而生成x个输出信号的系统，其中，所述子系统生成其中m个输入，而其他x-m个输入是从外部源接收的)也可以被称为解码器系统。

6、贯穿本公开，包括在权利要求中，在广义上使用术

7、贯穿本公开，包括在权利要求中，术语“耦接(couple/coupled)”用于指直接或间接连接。因此，如果第一设备耦接至第二设备，则所述连接可以通过直接连接或者通过经由其他设备和连接的间接连接实现。

8、如本文所使用的，“智能设备”是可以在某种程度上交互地和/或自主地运行的电子设备，其通常被配置为通过如蓝牙、zigbee、近场通信、wi-fi、光保真(li-fi)、3g、4g、5g等各种无线协议与一个或多个其他设备(或网络)进行通信。若干种值得注意的智能设备类型是智能电话、智能汽车、智能恒温器、智能门铃、智能锁、智能冰箱、平板手机和平板电脑、智能手表、智能手环、智能钥匙链和智能音频设备。术语“智能设备”还可以指展现出如人工智能等普适计算的某些性质的设备。

9、本文中使用表达“智能音频设备”来表示智能设备，其可以是单用途音频设备或多用途音频设备(例如，实施虚拟助理功能的至少一些方面的音频设备)。单用途音频设备是包括或耦接到至少一个麦克风(并且任选地还包括或耦接到至少一个扬声器和/或至少一个相机)并且很大程度上或主要被设计为实现单用途的设备(例如，电视(tv)或移动电话)。例如，虽然tv通常可以播放(并且被认为能够播放)来自节目素材的音频，但在大多数情况下，现代tv运行某种操作系统，应用(包括看电视的应用)在所述操作系统上本地运行。类似地，移动电话中的音频输入和输出可以做很多事情，但这些都是由电话上运行的应用服务的。从这个意义上说，具有(多个)扬声器和(多个)麦克风的单用途音频设备通常被配置为运行本地应用和/或服务以直接使用所述(多个)扬声器和(多个)麦克风。一些单用途音频设备可以被配置为组合在一起以实现在一定区或用户配置区域上播放音频。

10、一种常见类型的多用途音频设备是实施虚拟助理功能的至少一些方面的音频设备，尽管虚拟助理功能的其他方面可以由一个或多个其他设备来实施，例如一个或多个服务器，多用途音频设备被配置为与所述一个或多个服务器通信。这种多用途音频设备在本文中可以被称为“虚拟助理”。虚拟助理是包括或耦接到至少一个麦克风(并且任选地还包括或耦接到至少一个扬声器和/或至少一个相机)的设备(例如，智能扬声器或语音助理集成设备)。在一些示例中，虚拟助理可以提供将多个设备(不同于虚拟助理)用于某种意义上支持云的应用或以其他方式未在虚拟助理本身中或之上完全实施的应用的能力。换句话说，虚拟助理功能的至少一些方面(例如，言语识别功能)可以(至少部分地)由一个或多个服务器或其他设备实施，虚拟助理可以通过网络(如互联网)与所述一个或多个服务器或其他设备通信。虚拟助理有时可以一起工作，例如，以离散和有条件地定义的方式。例如，两个或更多个虚拟助理可以在其中之一(例如，最确信已经听到唤醒词的虚拟助理)对唤醒词作出响应的意义上一起工作。在一些实施方式中，连接的虚拟助理可以形成一种可以由一个主应用管理的系列(constellation)，主应用可以是(或实施)虚拟助理。

11、本文中，“唤醒词”在广义上用于表示任何声音(例如，人类说出的词或其他声音)，其中智能音频设备被配置为响应于检测到(“听到”)声音(使用包括在智能音频设备中或耦接到所述智能音频设备的至少一个麦克风，或至少一个其他麦克风)而唤醒。在该上下文中，“唤醒”表示设备进入等待(换句话说，正在收听)声音命令的状态。在一些实例中，本文中可以被称为“唤醒词”的内容可以包括超过一个词，例如，短语。

12、本文中，表达“唤醒词检测器”表示被配置为连续搜索实时声音(例如，言语)特征与训练模型之间的对齐的设备(或包括用于将设备配置为连续搜索实时声音特征与训练模型之间的对齐的指令的软件)。通常，每当唤醒词检测器确定检测到唤醒词的概率超过预定义阈值，就会触发唤醒词事件。例如，所述阈值可以是被调整以在错误接受率与错误拒绝率之间给出合理折衷的预定阈值。在唤醒词事件之后，设备可能会进入一种状态(可以被称为“已唤醒”状态或“注意力”状态)，在所述状态下设备会收听命令并且将接收到的命令传递给更大的、计算更密集的识别器。

技术实现思路

1、在一类实施例中，使用连续分层音频会话管理器(continuous hierarchicalaudio session manager，chasm)对音频设备(其可以包括智能音频设备)进行协调。在一些公开的实施方式中，chasm的至少一些方面可以通过本文中所谓的“智能家居中枢”来实施。根据一些示例，chasm可以由音频环境的特定设备实施。在一些实例中，可以至少部分地经由可以由音频环境的一个或多个设备执行的软件来实施chasm。在一些实施例中，设备(例如，智能音频设备)包括可连接网络的元件或子系统(例如，可连接网络的媒体引擎和设备性质描述符)，在本文中有时被称为可发现的机会性编排分布式音频子系统(discoverableopportunistically orchestrated distributed audio subsystem，do本文档来自技高网...

【技术保护点】

1.一种用于音频环境的音频系统的音频会话管理方法，所述音频会话管理方法包括：

2.如权利要求1所述的音频会话管理方法，其中，所述第一应用通信链路是响应于来自所述第一应用设备的第一路由发起请求而建立的。

3.如权利要求1所述的音频会话管理方法，其中，所述第一应用控制信号是在不参考所述第一媒体引擎采样时钟的情况下从所述第一应用传输的。

4.如权利要求1所述的音频会话管理方法，其中，所述第一音频会话管理控制信号使所述第一智能音频设备将对所述第一媒体引擎的控制委派给所述音频会话管理器。

5.如权利要求1所述的音频会话管理方法，其中，除了所述音频会话管理器或所述第一智能音频设备之外的一设备被配置用于执行所述第一应用。

6.如权利要求1所述的音频会话管理方法，其中，所述第一智能音频设备被配置用于执行所述第一应用。

7.如权利要求1所述的音频会话管理方法，其中，所述第一智能音频设备包括特定用途音频会话管理器，并且其中，所述音频会话管理器经由所述第一智能音频设备通信链路与所述特定用途音频会话管理器进行通信。

9.如权利要求1所述的音频会话管理方法，其中，所述音频会话管理器充当控制所述第一媒体引擎的所有应用的网关，无论所述应用是在所述第一智能音频设备上还是在另一个设备上运行。

10.如权利要求1所述的音频会话管理方法，进一步包括至少建立与第一音频源相对应的第一音频流，所述第一音频流包括第一音频信号。

11.如权利要求10所述的音频会话管理方法，其中，至少建立所述第一音频流涉及经由第一音频会话管理控制信号来使所述第一智能音频设备至少建立所述第一音频流，所述第一音频会话管理控制信号是经由所述第一智能音频设备通信链路被传输到所述第一智能音频设备的。

12.如权利要求10所述的音频会话管理方法，进一步包括使所述第一音频信号被渲染为第一经渲染的音频信号的渲染过程。

13.如权利要求12所述的音频会话管理方法，其中，所述渲染过程由所述第一智能音频设备响应于所述第一音频会话管理控制信号而执行。

14.如权利要求12所述的音频会话管理方法，进一步包括：

15.如权利要求1所述的音频会话管理方法，进一步包括：

16.如权利要求15所述的音频会话管理方法，其中，控制所述第二智能音频设备包含：

17.如权利要求15所述的音频会话管理方法，其中，控制所述第二智能音频设备包含：

18.一种装置，所述装置被配置成执行如权利要求1所述的方法。

19.一种系统，所述系统被配置成执行如权利要求1所述的方法。

20.一个或多个非暂态介质，其上编码有软件，所述软件包括用于控制一个或多个设备执行如权利要求1所述的方法的指令。

...

【技术特征摘要】

1.一种用于音频环境的音频系统的音频会话管理方法，所述音频会话管理方法包括：

2.如权利要求1所述的音频会话管理方法，其中，所述第一应用通信链路是响应于来自所述第一应用设备的第一路由发起请求而建立的。

3.如权利要求1所述的音频会话管理方法，其中，所述第一应用控制信号是在不参考所述第一媒体引擎采样时钟的情况下从所述第一应用传输的。

5.如权利要求1所述的音频会话管理方法，其中，除了所述音频会话管理器或所述第一智能音频设备之外的一设备被配置用于执行所述第一应用。

6.如权利要求1所述的音频会话管理方法，其中，所述第一智能音频设备被配置用于执行所述第一应用。

8.如权利要求7所述的音频会话管理方法，其中，所述音频会话管理器从所述特定用途音频会话管理器获得所述一个或多个第一媒体引擎能力。

9.如权利要求1所述的音频会话管理方法，其中，所述音频会话管理器充当控制所述第一媒体引擎的所有应用的网关，无论所述应用是在所述第一智能音频设备上还是在...

【专利技术属性】
技术研发人员：G·N·狄金斯，M·R·P·托马斯，A·J·西斐德，J·B·兰多，D·阿特亚加，C·M·迪奥尼西奥，D·古纳万，R·J·卡特莱特，C·G·海因斯，
申请(专利权)人：杜比国际公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人