语音识别方法、装置、设备和存储介质制造方法及图纸

技术编号:31315001 阅读:16 留言:0更新日期:2021-12-12 23:09
本发明专利技术实施例提出一种语音识别方法、装置、设备和存储介质。其中,所述语音识别方法可以包括:获取来自多个位置的多路唤醒语音信号;对所述多路唤醒语音信号进行声源定位,确定唤醒语音位置;对所述唤醒语音位置之外的其他位置的音频信号进行抑制,以得到待识别信号;对所述待识别信号进行语音识别。通过先确定出唤醒语音位置,可以对其他位置的音频信号进行抑制,从而保持唤醒语音位置的语音的有效性,减少其他位置的噪声信号对语音识别的影响,减少对唤醒语音位置的干扰。减少对唤醒语音位置的干扰。减少对唤醒语音位置的干扰。

【技术实现步骤摘要】
语音识别方法、装置、设备和存储介质
[0001]本申请是申请日为2019年03月11日、申请号为201910180338.2、专利技术名称为“语音识别方法、装置、设备和存储介质”的中国专利申请的分案申请。


[0002]本专利技术涉及语音识别
,尤其涉及一种语音识别方法、装置、设备和存储介质。

技术介绍

[0003]目前的车载语音识别系统,通常只允许安静的环境下,某个特定位置人进行语音输入。但是,在车载环境下,经常出现车上有多人说话的场景。例如,有人在打电话,同时另外有其他人想语音发起导航之类的操作。此时如果电话的声音被车机的麦克风录入,可能造成车机出现很多误识别。

技术实现思路

[0004]本专利技术实施例提供一种语音识别方法、装置、设备和存储介质,以解决现有技术中的一个或多个技术问题。
[0005]第一方面,本专利技术实施例提供了一种语音识别方法,包括:
[0006]获取来自多个位置的多路唤醒语音信号;
[0007]对所述多路唤醒语音信号进行声源定位,确定唤醒语音位置;
[0008]对所述唤醒语音位置之外的其他位置的音频信号进行抑制,以得到待识别信号;
[0009]对所述待识别信号进行语音识别。
[0010]在本专利技术的一个实施例中,对所述多路唤醒语音信号进行声源定位,确定唤醒语音位置,包括:
[0011]利用所述多路唤醒语音信号的信号能量进行声源定位,将信号能量最大的一路唤醒语音信号对应的位置确定为唤醒语音位置。
[0012]在本专利技术的一个实施例中,该方法还包括:
[0013]利用波束成形的方式调整麦克风阵列的角度,以使得所述麦克风阵列朝向所述唤醒语音位置。
[0014]在本专利技术的一个实施例中,对所述唤醒语音位置之外的其他位置的音频信号进行抑制,以得到待识别信号,包括:
[0015]接收所述唤醒语音位置的麦克风的第一语音信号;
[0016]接收所述其他位置的各麦克风的第二语音信号;
[0017]利用数字信号处理器从所述第一语音信号中消除各所述第二语音信号,以得到待识别信号。
[0018]在本专利技术的一个实施例中,对所述唤醒语音位置之外的其他位置的音频信号进行抑制,以得到待识别信号,包括:
[0019]控制所述其他位置的麦克风停止收音;
[0020]接收所述唤醒语音位置的麦克风的待识别信号。
[0021]第二方面,本专利技术实施例提供了一种语音识别装置,包括:
[0022]获取单元,用于获取来自多个位置的多路唤醒语音信号;
[0023]声源定位单元,用于对所述多路唤醒语音信号进行声源定位,确定唤醒语音位置;
[0024]抑制单元,用于对所述唤醒语音位置之外的其他位置的音频信号进行抑制,以得到待识别信号;
[0025]识别单元,用于对所述待识别信号进行语音识别。
[0026]在本专利技术的一个实施例中,所述声源定位单元还用于利用所述多路唤醒语音信号的信号能量进行声源定位,将信号能量最大的一路唤醒语音信号对应的位置确定为唤醒语音位置。
[0027]在本专利技术的一个实施例中,该装置还包括:
[0028]波束成形单元,用于利用波束成形的方式调整麦克风阵列的角度,以使得所述麦克风阵列朝向所述唤醒语音位置。
[0029]在本专利技术的一个实施例中,所述抑制单元包括:
[0030]第一接收子单元,用于接收所述唤醒语音位置的麦克风的第一语音信号;接收所述其他位置的各麦克风的第二语音信号;
[0031]消除子单元,用于利用数字信号处理器从所述第一语音信号中消除各所述第二语音信号,以得到待识别信号。
[0032]在本专利技术的一个实施例中,所述抑制单元包括:
[0033]停止控制单元,用于控制所述其他位置的麦克风停止收音;
[0034]第二接收子单元,用于接收所述唤醒语音位置的麦克风的待识别信号。
[0035]第三方面,本专利技术实施例提供了一种语音识别设备,所述设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的单元。
[0036]在一种实施方式中,所述设备的结构中包括处理器和存储器,所述存储器用于存储支持所述设备执行上述语音识别方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口,用于与其他设备或通信网络通信。
[0037]第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储语音识别设备所用的计算机软件指令,其包括用于执行上述语音识别方法所涉及的程序。
[0038]上述技术方案中的一个技术方案具有如下优点或有益效果:通过先确定出唤醒语音位置,可以对其他位置的音频信号进行抑制,从而保持唤醒语音位置的语音的有效性,减少其他位置的噪声信号对语音识别的影响,减少对唤醒语音位置的干扰。因此,更加有利于得到准确的语音识别结果,提高用户体验。
[0039]上述技术方案中的另一个技术方案具有如下优点或有益效果:采用本专利技术实施例的语音识别方法,可以在车辆内加入识别抗干扰的方案。如果车辆内的某个位置的人发出唤醒词,将该位置确定为唤醒语音位置,然后可以对该位置的人讲的话进行识别。其他位置的人在讲话时,不会干扰到唤醒语音位置的人,使得用户体验更好,使车机的语音识别更智能和准确。
[0040]上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。
附图说明
[0041]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。
[0042]图1示意性示出根据本专利技术一个实施例的语音识别方法的流程图。
[0043]图2示意性示出根据本专利技术另一个实施例的语音识别方法的流程图。
[0044]图3示意性示出根据本专利技术再一个实施例的语音识别方法的应用场景的示意图。
[0045]图4示意性示出根据本专利技术再一个实施例的语音识别方法的流程图。
[0046]图5示意性示出根据本专利技术一个实施例的语音识别装置的示意图。
[0047]图6示意性示出根据本专利技术另一个实施例的语音识别装置的示意图。
[0048]图7示意性示出根据本专利技术一个实施例的语音识别设备的示意图。
具体实施方式
[0049]在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
[0050]图1示意性示出根据本专利技术一个实施例的语音识别方法的流程图。如图1所示,该本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:利用麦克风阵列获取来自至少一个位置的唤醒语音信号;对所述唤醒语音信号进行声源定位,确定唤醒语音的位置;采用停止收音的方式对其他位置的音频信号进行抑制,以得到待识别信号;所述其他位置为所述唤醒语音的位置之外的位置;对所述待识别信号进行语音识别。2.根据权利要求1所述的方法,其特征在于,对所述多路唤醒语音信号进行声源定位,确定唤醒语音的位置,包括:利用所述多路唤醒语音信号的信号能量进行声源定位,将信号能量最大的一路唤醒语音信号对应的位置确定为唤醒语音的位置。3.根据权利要求1所述的方法,其特征在于,还包括:利用波束成形的方式调整麦克风阵列的角度,以使得所述麦克风阵列朝向所述唤醒语音的位置。4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述唤醒语音的位置的麦克风接收到所述唤醒语音的位置的第一语音信号,以及其他位置的第二语音信号的情况下,还包括:利用数字信号处理器从所述第一语音信号中消除各所述第二语音信号,以得到待识别信号。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述采用停止收音的方式对其他位置的音频信号进行抑制,以得到待识别信号,包括:控制所述其他位置的麦克风停止收音;接收所述唤醒语音的位置的麦克风的待识别信号。6.一种语音识别装置,其特征在于,包括:获取单元,用于利用麦克风阵列获取来自至少一个位置的多路唤醒语音信号;声源定位单元,用于对所述多路唤醒语音信号进行声源定位,确定唤醒语音的位置;抑制单元,用于采用停止收...

【专利技术属性】
技术研发人员:陈建哲张腾飞向伟
申请(专利权)人:百度国际科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1