辅助技术制造技术

技术编号:28204328 阅读:15 留言:0更新日期:2021-04-24 14:30
提供一种设备或系统,所述设备或系统被配置为检测与预定情境相关联的一个或多个声音事件和/或场景,并在满足该情境时提供辅助输出。出。出。

【技术实现步骤摘要】
辅助技术


[0001]本公开总体上涉及基于从非语言提示确定的情境向用户提供辅助设施。

技术介绍

[0002]关于声音识别系统和方法的背景信息可以在申请人的PCT申请WO2010/070314中找到,该申请的全部内容通过引用合并在此。
[0003]本申请人已经认识到声音识别系统的新应用的潜力。

技术实现思路

[0004]人们广泛采用了技术来为用户的日常生活提供帮助。用户将辅助技术部署为信息源,或者为他们提供执行某些任务的提示或提醒,已很常见。
[0005]例如,在家庭环境中,可以部署计算机辅助设备,该计算机辅助设备实现按照时间表来以向用户提供以显示器、听觉警报、触觉刺激或计算机生成的语音形式的提醒的设施。此外,或替代地,这种设备可以提供使特定动作自动化的设施。因此,例如,辅助设备可以发布指令以由适当的协作设备实施,以打开或关闭房屋照明,或打开或关闭窗帘,或生成旨在唤醒睡眠中的人的声音输出。这样的动作可以由设备的用户预先安排。
[0006]例如,在汽车环境中,提供一种导航系统是众所周知的,该导航系统旨在向驾驶员提供图形和听觉指令,以便尽可能有效地到达目的地。这样的指令可以适应关于道路交通状况或其他标准的信息。
[0007]一般而言,提供了一种设备或系统,所述设备或系统被配置为检测与预定情境相关联的一个或多个声音事件和/或场景,并在满足该情境时提供辅助输出。
[0008]本公开的各方面提供了一种可操作用于基于情境确定来生成辅助输出的计算机设备,所述设备包括:音频流获取单元,用于获取音频样本流;声音检测器,用于在音频样本流上检测一个或多个非语言声音标识符,每个非语言声音标识符标识音频样本流上的非语言声音签名;情境确定器,用于基于检测到一个或多个指示性非语言声音标识符确定已满足特定的情境,并基于所述情境生成辅助输出。
[0009]本公开的各方面提供了一种计算机设备,该计算机设备能够根据音频输入流上的可识别的非语言声音和/或场景来确定是否已经满足预定情境并因此生成对该情境的辅助响应。
[0010]可以以多种方式来确定情境是否已被满足。在一个简单的示例中,特定声音事件的单个实例可能导致情境的满足。声音事件的组合可以满足情境。更复杂的组合方法可以进一步用于确定情境的满足。情境的满足可以是相对于情境模型的。情境模型可以包括处理网络模型,例如神经网络或决策树,可以使用机器学习在训练数据上开发机器模型,该训练数据由与特定情境相关联的声音事件的“有效”组合组成。机器学习可能是在使用中自适应的,设备可能会响应于对真实数据的潜在错误响应,从用户反馈中获取进一步的训练。
[0011]将理解的是,本文描述的设备的功能可以划分为多个模块。可替代地,可以在单个
模块或处理器中提供功能。所述处理器或每个处理器可以用任何已知的合适硬件来实现,例如微处理器、数字信号处理(DSP)芯片、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、GPU(图形处理单元)、TPU(张量处理单元)或NPU(神经处理单元)等。所述处理器或每个处理器可以包括一个或多个处理核心,每个核心配置为独立执行。所述处理器或每个处理器可以具有到总线的连接性,以执行指令和处理例如存储在存储器中的信息。
[0012]本专利技术还提供处理器控制代码以实现上述系统和方法,例如在通用计算机系统上、数字信号处理器(DSP)上或特殊设计的数学加速单元(例如图形处理单元(GPU)或张量处理单元(TPU))上实现。本专利技术还提供了一种载有处理器控制代码的载体,以在运行时实现上述任何一种方法,特别是在非暂时性数据载体上,例如磁盘、微处理器、CD-或DVD-ROM、编程存储器,例如只读存储器(固件)或数据载体(例如光或电信号载体)上。可以在诸如磁盘、微处理器、CD-或DVD-ROM的载体,诸如非易失性存储器(例如,闪存)或只读存储器(固件)的编程存储器上提供代码。实现本专利技术的实施例的代码(和/或数据)可以包括常规编程语言中的源代码、目标代码或可执行代码(解释或编译)(例如C)或汇编代码,用于设置或控制ASIC(专用集成电路)或FPGA(现场可编程门阵列)的代码,或用于硬件描述语言的代码(例如VerilogTM或VHDL)(高速集成电路硬件描述语言)。如本领域技术人员将理解的,这样的代码和/或数据可以分布在彼此通信的多个耦合组件之间。本专利技术可以包括控制器,该控制器包括与系统的一个或多个组件耦合的微处理器、工作存储器和程序存储器。
[0013]这些和其他方面将从下面描述的实施例中非常清楚。本公开的范围既不限于该概述,也不限于必须解决所指出的任何或所有缺点的实施方式。
附图说明
[0014]为了更好地理解本公开并示出实施例如何生效,参考附图,其中:
[0015]图1示出了被监视环境中的示例设备的框图;
[0016]图2示出了计算设备的框图。
[0017]图3示出了在计算设备上实现的软件的框图;
[0018]图4是示出根据实施例的提供辅助输出的过程的流程图。
[0019]图5是示出了实施例的实现并指示这种实现的功能和结构的过程架构图。
具体实施方式
[0020]现在仅以示例的方式描述实施例。
[0021]图1示出了处于被监视环境100中的计算设备102,其可以是室内空间(例如,房屋、健身房、商店、火车站等)、室外空间或车辆中。
[0022]网络106可以是无线网络、有线网络,或者可以包括设备之间的有线和无线连接的组合。
[0023]如以下更详细描述的,计算设备102可以执行音频处理以识别(即检测)被监视环境100中的目标声音。在替代实施例中,计算设备102外部的声音识别设备104可以执行音频处理,以识别被监视环境100中的目标声音,然后提醒计算设备102已检测到目标声音。
[0024]图2示出了计算设备102的框图。从下面将认识到,图2仅是说明性的,并且本公开的实施例的计算设备102可以不包括图2中所示的所有组件。
[0025]计算设备102可以是PC、诸如膝上型计算机、智能电话、平板PC之类的移动计算设备、消费电子设备(例如,智能扬声器、TV、耳机、可穿戴设备等)或其他电子设备(例如,车载设备)。计算设备102可以是移动设备,使得用户103可以使计算设备102在被监视环境周围移动。可替代地,计算设备102可以固定在被监视环境中的某个位置(例如,安装到房屋墙壁上的面板)。可替代地,用户可以通过附接到身体部分或安放在身体部分上或者通过附接到一件衣服来穿戴所述设备。
[0026]计算设备102包括耦合到存储器204的处理器202,存储器204存储可与数据元素208一起操作的应用软件206的计算机程序代码。如图3所示,示出了使用中的存储器的映射。声音识别软件206a用于通过将检测到的声音与存储在存储器204中的一个或多个声音模型208a进行比较来识别目标声音。声音模型208a可以与一个或多个目标声音相关联(可以是例如碎玻璃声、烟雾警报声、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机设备,能够操作以基于情境确定来生成辅助输出,所述设备包括:音频流获取单元,用于获取音频样本流,声音检测器,用于从音频样本流中检测一个或多个非语言声音事件和/或场景;声音处理器,用于基于一个或多个非语言声音事件和/或场景,处理非语言声音事件和/或场景以确定一个或多个声音事件和/或场景标识符,每个非语言声音事件和/或场景标识符标识来自音频样本流的非语言声音事件和/或场景,情境确定器,用于基于一个或多个指示性非语言声音事件和/或场景标识符的检测确定已经满足特定情境,以及辅助输出生成器,用于基于已满足的情境生成辅助输出。2.根据权利要求1所述的计算机设备,其中,所述情境确定器能够操作以基于与所述情境有关的非语言声音事件和/或场景标识符的检测来确定情境的满足。3.根据权利要求1所述的计算机设备,其中,所述情境确定器能够操作以基于时间量度来确定情境的满足,所述时间量度是结合一个或多个非语言声音事件和/或场景标识符的检测,相对于实时或关于另一非语言声音事件和/或场景的非语言声音事件和/或场景的实例的量度。4.根据权利要求1所述的计算机设备,其中,所述情境确定器能够操作以结合一个或多个非语言声音事件和/或场景标识符的检测,基于位置量度来确定情境的满足。5.根据权利要求1所述的计算机设备,其中,所述情境确定器能够操作以基于多个情境定义通过检测到的一个或多个非语言声音事件和/或场景标识符来确定在存在情境定义的情况下满足哪一个情境定义。6.根据权利要求1所述的计算机设备,其中,所述情境确定器能够操作以基于情境定义来确定是否满足所述情境定义,所述情境定义包括根据对可用的检测到的一个或多个非语言声音事件和/或场景标识符的输入的响应来定义情境的满足的情境模型。7.根据权利要求6所述的计算机设备,其中,所述情境模型是使用机器学习实现的。8.根据权利要求6所述的计算机设备,其中,所述情境确定器包括决策树。9.根据权利要求6所述的计算机设备,其中,所述情境确定器包括神经网络。10.根据权利要求6所述的计算机设备,其中,所述情境确定器包括加权图模型。11.根据权利要求6所述...

【专利技术属性】
技术研发人员:克里斯托夫
申请(专利权)人:音频分析有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1