音声识别装置、音声识别方法、存储音声识别程序的非暂时性计算机可读介质制造方法及图纸

技术编号:23625856 阅读:15 留言:0更新日期:2020-03-31 23:15
本发明专利技术提供一种音声识别装置、音声识别方法、存储音声识别程序的非暂时性计算机可读介质。本发明专利技术的音声识别装置识别用户的发话音声,并且包括控制器,所述控制器配置为根据向所述用户要求的发话内容是否为不期望第三者听到的内容来控制任何干扰声的输出,并且响应于所述用户的发话的结束而停止所述干扰声的所述输出。

Sound recognition device, sound recognition method and non temporary computer readable medium for storing sound recognition program

【技术实现步骤摘要】
音声识别装置、音声识别方法、存储音声识别程序的非暂时性计算机可读介质
本专利技术涉及一种识别用户的发话音声的音声识别装置、一种音声识别方法以及一种存储音声识别程序的非暂时性计算机可读介质。
技术介绍
日本未审查专利申请公开第2013-019803号(JP2013-019803A)描述了一种声音对话装置,所述声音对话装置在开始音乐的输出或者维持音乐输出状态的同时,根据用户的发话音量的计算结果来调节音乐的音量,从而将用户的发话音量引导至期望的级别。
技术实现思路
在使用音声识别装置的情况下,用户可能不期望诸如车辆的乘客的第三者听到发话内容。然而,在JP2013-019803A描述的声音对话装置中,因为音乐没有以妨碍第三者听到用户的发话内容的级别的音量再生,所以用户的发话内容有可能被第三者听到。本专利技术提供一种音声识别装置、一种音声识别方法以及一种存储能够抑制第三者听到用户的发话内容的音声识别程序的非暂时性计算机可读介质。本专利技术的第一方案涉及一种识别用户的发话音声的音声识别装置。所述音声识别装置包括控制器,所述控制器配置为:根据向所述用户要求的发话内容是否为不期望第三者听到的内容来控制任何干扰声的输出,并且响应于所述用户的发话的结束而停止所述干扰声的所述输出。在根据本专利技术的第一方案的音声识别装置中,所述控制器可以被配置为:当在输出音乐时,将所述音乐的输出音量控制到干扰听到所述发话内容的级别。因此,能够抑制第三者听到用户的发话内容。在根据本专利技术的第一方案的音声识别装置中,所述控制器可以被配置为:基于向所述用户要求所述发话的场景或情况以及来自所述用户的要求信号是否存在,来判定向所述用户要求的所述发话内容是否为不期望所述第三者听到的所述内容。因此,能够精确地判定向用户要求的发话内容是否为不期望第三者听到的内容。在根据本专利技术的第一方案的音声识别装置中,所述控制器可以被配置为:从经由音声输入装置获取的音声数据去除所述干扰声,从而识别所述用户的发话音声。因此,即使在干扰声正在输出的状态下也能够精确地识别用户的发话音声。本专利技术的第二方案涉及一种识别用户的发话音声的音声识别方法。所述音声识别方法包括:根据向所述用户要求的发话内容是否为不期望第三者听到的内容来控制任何干扰声的输出,并且响应于所述用户的发话的结束而停止所述干扰声的所述输出。根据本专利技术的第二方案的音声识别方法还可以包括:判定向所述用户要求的所述发话内容是否为不期望所述第三者听到的所述内容,当所述发话内容为不期望所述第三者听到的所述内容时:当在输出音乐时,将所述音乐的输出音量控制到干扰听到所述发话内容的级别,以及当没有在输出所述音乐时则再生所述干扰声。本专利技术的第三方案涉及一种非暂时性计算机可读介质,其存储使计算机实行识别用户的发话音声的处理的音声识别程序。所述处理包括:根据向所述用户要求的发话内容是否为不期望第三者听到的内容来控制任何干扰声的输出,并且响应于所述用户的发话的结束而停止所述干扰声的所述输出。通过根据本专利技术的各个方案的音声识别装置、音声识别方法以及存储音声识别程序的非暂时性计算机可读介质,由于根据向用户要求的发话内容是否为不期望第三者听到的内容来控制任何干扰声的输出,所以能够抑制第三者听到用户的发话内容。附图说明将在下文中参照附图描述本专利技术的示例性实施例的特征、益处以及技术和工业方面的重要性,其中相同的附图标记表示相同的元件,并且其中:图1为图示出根据本专利技术的一个实施例的音声识别装置的配置的框图;图2A为图示出根据本专利技术的一个实施例的音声识别处理的流程的流程图;以及图2B为图示出根据本专利技术的一个实施例的音声识别处理的流程的流程图。具体实施方式在下文中,将参照附图描述根据本专利技术的一个实施例的音声识别装置的配置和操作。音声识别装置的配置首先,将参照图1描述根据本专利技术的一个实施例的音声识别装置的配置。图1为图示出根据本专利技术的一个实施例的音声识别装置的配置的框图。如图1所示,根据本专利技术的一个实施例的音声识别装置1被配置为包括处理器和存储单元的、诸如工作站的通用信息处理装置,所述处理器诸如中央处理单元(CPU)、数字信号处理器(DSP)或者现场可编程门阵列(FPGA),所述存储单元诸如随机存取存储器(RAM)和只读存储器(ROM),并且包括音声识别处理单元11、声音数据库(声音DB)12、音频再生单元13以及音量设定单元14。音声识别处理单元11、音频再生单元13以及音量设定单元14的功能由执行存储在存储单元中的计算机程序的处理器实现。音声识别单元11、音频再生单元13以及音量设定单元14可以用作控制器。音声识别处理单元11经由诸如麦克风的音声输入装置2获取用户P1的发话音声,并且识别获取的发话音声的内容。如将在下文中详细描述的,在本实施例中,音声识别处理单元11从经由音声输入装置2获取的音声(麦克风声音)数据去除音乐或干扰声的数据,并且使用去除处理之后的音声数据在再生音乐或干扰声的环境下识别用户P1的发话音声的内容。声音DB12存储音乐或者干扰声的数据。在此,干扰声的示例能够包括适于干扰听到用户P1的发话内容的专用音声(例如,没有令人不快并且没有无声状态的噪声音乐),以及用户所拥有的音乐。音频再生单元13从声音DB12获取音乐或者干扰声的数据,并且再生获取的数据并输出已经再生的获取的数据。音量设定单元14调节由音频再生单元13再生的音乐或者干扰声的音量,并且从安装在用户P1附近的扬声器3A或者安装在第三者(例如,车辆的乘客)P2附近的扬声器3B输出音乐或干扰声。上述计算机程序能够被记录在诸如CD-ROM、软盘、可记录光盘(CD-R)以及数字多功能光盘(DVD)的计算机可读记录介质中,并且提供为可安装格式或者可执行格式的文件。而且,上述计算机程序可以被存储在连接至电气通信线路的计算机中,并且通过经由电气通信线路下载来提供。而且,上述计算机程序可以经由电气通信线路提供或分布。具有这样的配置的音声识别装置1执行如下的音声识别处理,由此抑制第三者P2听到用户P1的发话内容。在下文中,将参照图2A和图2B描述执行音声识别处理时的音声识别装置1的操作。音声识别处理图2A和图2B为图示出根据本专利技术的一个实施例的音声识别处理的流程的流程图。每次音声识别装置1向用户P1要求发话,则开始图2A和图2B所示的流程图,并且音声识别处理进行到步骤S1的处理。在步骤S1的处理中,音声识别处理单元11判定向用户P1要求的发话内容(要求用户P1提供的发话的内容)是否为不期望第三者P2听到的内容。具体地,音声识别处理单元11基于向用户P1要求发话的场景或状况(例如,在进行车辆中的全部乘客参与的智力游戏的状况下识别向用户P1要求不能被其他人听到的答案的情况)以及来自用户P1的要求信号是否存在,来判定向用户P1要求的发话内容是否为不期望第三者P2听到的内容。作为判定的结果,当向用户P1要本文档来自技高网...

【技术保护点】
1.一种音声识别装置,其识别用户的发话音声,所述音声识别装置的特征在于包括控制器,所述控制器配置为根据向所述用户要求的发话内容是否为不期望第三者听到的内容来控制任何干扰声的输出,并且响应于所述用户的发话的结束而停止所述干扰声的所述输出。/n

【技术特征摘要】
20180925 JP 2018-1794071.一种音声识别装置,其识别用户的发话音声,所述音声识别装置的特征在于包括控制器,所述控制器配置为根据向所述用户要求的发话内容是否为不期望第三者听到的内容来控制任何干扰声的输出,并且响应于所述用户的发话的结束而停止所述干扰声的所述输出。


2.根据权利要求1所述的音声识别装置,其特征在于,所述控制器配置为:当输出音乐时,将所述音乐的输出音量控制到干扰听到所述发话内容的级别。


3.根据权利要求1或2所述的音声识别装置,其特征在于,所述控制器配置为:基于向所述用户要求的所述发话的场景或情况以及来自所述用户的要求信号是否存在,来判定向所述用户要求的所述发话内容是否为不期望所述第三者听到的所述内容。


4.根据权利要求1至3中任一项所述的音声识别装置,其特征在于,所述控制器配置为:从经由音声输入装置获取的音声数据去除所述干扰声,...

【专利技术属性】
技术研发人员:菅原嘉彦
申请(专利权)人:丰田自动车株式会社株式会社电装
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1