语音识别方法、装置、设备和存储介质制造方法及图纸

技术编号：31315001 阅读：16 留言：0更新日期：2021-12-12 23:09

本发明专利技术实施例提出一种语音识别方法、装置、设备和存储介质。其中，所述语音识别方法可以包括：获取来自多个位置的多路唤醒语音信号；对所述多路唤醒语音信号进行声源定位，确定唤醒语音位置；对所述唤醒语音位置之外的其他位置的音频信号进行抑制，以得到待识别信号；对所述待识别信号进行语音识别。通过先确定出唤醒语音位置，可以对其他位置的音频信号进行抑制，从而保持唤醒语音位置的语音的有效性，减少其他位置的噪声信号对语音识别的影响，减少对唤醒语音位置的干扰。减少对唤醒语音位置的干扰。减少对唤醒语音位置的干扰。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备和存储介质
[0001]本申请是申请日为2019年03月11日、申请号为201910180338.2、专利技术名称为“语音识别方法、装置、设备和存储介质”的中国专利申请的分案申请。

[0002]本专利技术涉及语音识别
，尤其涉及一种语音识别方法、装置、设备和存储介质。

技术介绍

[0003]目前的车载语音识别系统，通常只允许安静的环境下，某个特定位置人进行语音输入。但是，在车载环境下，经常出现车上有多人说话的场景。例如，有人在打电话，同时另外有其他人想语音发起导航之类的操作。此时如果电话的声音被车机的麦克风录入，可能造成车机出现很多误识别。

技术实现思路

[0004]本专利技术实施例提供一种语音识别方法、装置、设备和存储介质，以解决现有技术中的一个或多个技术问题。
[0005]第一方面，本专利技术实施例提供了一种语音识别方法，包括：
[0006]获取来自多个位置的多路唤醒语音信号；
[0007]对所述多路唤醒语音信号进行声源定位，确定唤醒语音位置；
[0008]对所述唤醒语音位置之外的其他位置的音频信号进行抑制，以得到待识别信号；
[0009]对所述待识别信号进行语音识别。
[0010]在本专利技术的一个实施例中，对所述多路唤醒语音信号进行声源定位，确定唤醒语音位置，包括：
[0011]利用所述多路唤醒语音信号的信号能量进行声源定位，将信号能量最大的一路唤醒语音信号对应的位置确定为唤醒语音位置。
[0...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：利用麦克风阵列获取来自至少一个位置的唤醒语音信号；对所述唤醒语音信号进行声源定位，确定唤醒语音的位置；采用停止收音的方式对其他位置的音频信号进行抑制，以得到待识别信号；所述其他位置为所述唤醒语音的位置之外的位置；对所述待识别信号进行语音识别。2.根据权利要求1所述的方法，其特征在于，对所述多路唤醒语音信号进行声源定位，确定唤醒语音的位置，包括：利用所述多路唤醒语音信号的信号能量进行声源定位，将信号能量最大的一路唤醒语音信号对应的位置确定为唤醒语音的位置。3.根据权利要求1所述的方法，其特征在于，还包括：利用波束成形的方式调整麦克风阵列的角度，以使得所述麦克风阵列朝向所述唤醒语音的位置。4.根据权利要求1至3中任一项所述的方法，其特征在于，在所述唤醒语音的位置的麦克风接收到所述唤醒语音的位置的第一语音信号，以及其他位置的第二语音信号的情况下，还包括：利用数字信号处理器从所述第一语音信号中消除各所述第二语音信号，以得到待识别信号。5.根据权利要求1至3中任一项所述的方法，其特征在于，所述采用停止收音的方式对其他位置的音频信号进行抑制，以得到待识别信号，包括：控制所述其他位置的麦克风停止收音；接收所述唤醒语音的位置的麦克风的待识别信号。6.一种语音识别装置，其特征在于，包括：获取单元，用于利用麦克风阵列获取来自至少一个位置的多路唤醒语音信号；声源定位单元，用于对所述多路唤醒语音信号进行声源定位，确定唤醒语音的位置；抑制单元，用于采用停止收...

【专利技术属性】
技术研发人员：陈建哲，张腾飞，向伟，
申请(专利权)人：百度国际科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人