语音唤醒方法、系统、电子设备和存储介质技术方案

技术编号：36426789 阅读：21 留言：0更新日期：2023-01-20 22:37

本发明专利技术实施例提供一种语音唤醒方法、系统、电子设备和存储介质。该方法包括：对用户语音进行信号处理，确定第一波束形成音频；利用第一唤醒引擎对第一波束形成音频进行实时唤醒识别，若识别到第一波束形成音频属于部分唤醒词时，将第一波束形成音频以及在半字唤醒模式之后确定的第二波束形成音频上传至第二唤醒引擎；利用第一唤醒引擎确定第一波束形成音频以及第二波束形成音频的唤醒置信度，若没有达到预设唤醒阈值时，根据接收到第二唤醒引擎反馈的唤醒结果判断是否触发语音唤醒。本发明专利技术实施例根据不同的场景结合不同功能的识别引擎交叉验证，可以将唤醒的误识别率大大降低，一定程度提升唤醒效率，并且可以满足不同场景下的唤醒需求。下的唤醒需求。下的唤醒需求。

全部详细技术资料下载

【技术实现步骤摘要】
语音唤醒方法、系统、电子设备和存储介质

[0001]本专利技术涉及智能语音领域，尤其涉及一种语音唤醒方法、系统、电子设备和存储介质。

技术介绍

[0002]随着智能语音技术的发展，智能语音设备逐步进入用户家庭之中。用户在使用时，通过唤醒词触发智能语音设备的唤醒，来下达语音功能指令。为了识别环境中不同的声源，通常会为智能语音设备搭载多麦克的麦克风阵列。麦克风阵列会采集到多路音频，在唤醒词检测时，考虑到成本、启动效率等因素，通常多麦唤醒更多使用的是利用神经网络进行匹配音波，不会检测声音的识别，当出现例如电流声等外界情况会触发误唤醒。
[0003]在实现本专利技术过程中，专利技术人发现相关技术中至少存在如下问题：
[0004]为了防止误唤醒，通常会针对唤醒场景的神经网络模型进行更大规模的训练，或者是针对于特定的唤醒词进行定制化的神经网络模型的优化。然而，当前的唤醒神经网络模型已经优化到极限，以此再进行优化也难以取得更大的技术上的突破。

技术实现思路

[0005]为了至少解决现有技术中多麦唤醒可能会触发误唤醒的问题。第一方面，本专利技术实施例提供一种语音唤醒方法，包括：
[0006]对实时采集的用户语音进行信号处理，确定出多路的第一波束形成音频；
[0007]利用第一唤醒引擎对所述第一波束形成音频进行实时唤醒识别，若识别到所述第一波束形成音频属于部分唤醒词时，触发半字唤醒模式，将所述半字唤醒模式之前用户语音的所述第一波束形成音频，以及在所述半字唤醒模式之后采集的用户语音实时信号...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法，包括：对实时采集的用户语音进行信号处理，确定出多路的第一波束形成音频；利用第一唤醒引擎对所述第一波束形成音频进行实时唤醒识别，若识别到所述第一波束形成音频属于部分唤醒词时，触发半字唤醒模式，将所述半字唤醒模式之前用户语音的所述第一波束形成音频，以及在所述半字唤醒模式之后采集的用户语音实时信号处理确定的第二波束形成音频上传至第二唤醒引擎；当所述用户语音停止输入时，利用第一唤醒引擎确定所述第一波束形成音频以及所述第二波束形成音频的唤醒置信度，若所述唤醒置信度没有达到预设唤醒阈值时，根据接收到所述第二唤醒引擎反馈的唤醒结果判断是否触发语音唤醒。2.根据权利要求1所述的方法，其中，所述第一唤醒引擎包括本地唤醒引擎、局域唤醒引擎，所述第二唤醒引擎包括云端识别引擎、局域唤醒引擎。3.根据权利要求2所述的方法，其中，当所述第一唤醒引擎为本地唤醒引擎，所述第二唤醒引擎为云端识别引擎或局域唤醒引擎时，所述利用第一唤醒引擎确定所述第一波束形成音频以及所述第二波束形成音频的唤醒置信度包括：若根据本地唤醒引擎确定的唤醒置信度达到预设唤醒阈值时，及时触发语音唤醒，并取消对所述云端识别引擎或局域唤醒引擎的访问。若根据本地唤醒引擎确定的唤醒置信度没有达到预设唤醒阈值时，等待所述云端识别引擎或局域唤醒引擎反馈唤醒结果，根据接收到的所述唤醒结果判断是否触发语音唤醒。4.根据权利要求2所述的方法，其中，当所述第一唤醒引擎为局域唤醒引擎，所述第二唤醒引擎为云端识别引擎时，所述利用第一唤醒引擎确定所述第一波束形成音频以及所述第二波束形成音频的唤醒置信度包括：若根据局域唤醒引擎确定的唤醒置信度达到预设唤醒阈值时，触发语音唤醒，并取消对所述云端识别引擎的访问。5.一种语音唤醒系统，包括：信号处理程序模块，用于对实时采集的用户语音进行信号处理，确定出多路的第一波束形成音频；半字唤醒程序模块，用于利用第一唤醒引擎对所述第一波束形成音频...

【专利技术属性】
技术研发人员：蔡春孟，李路天，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人