一种动态拾音方法、装置、电子设备及存储介质制造方法及图纸

技术编号：33032547 阅读：15 留言：0更新日期：2022-04-15 09:09

本申请公开了一种动态拾音方法、装置、电子设备及存储介质，涉及人工智能领域，尤其涉及智能交通领域。具体实现方案为：接收当前用户发送的唤醒指令；响应于唤醒指令，对当前用户进行人脸识别，得到当前用户的人脸识别结果；若当前用户的人脸识别结果满足预先设定的检测条件，接收当前用户发送的语音控制指令；响应于语音控制指令，执行语音控制指令对应的控制操作。本申请实施例可以有效地提高车载场景下的动态拾音准确率，同时还可以节省硬件开销，降低维护成本。降低维护成本。降低维护成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种动态拾音方法、装置、电子设备及存储介质

[0001]本公开涉及人工智能
，进一步涉及智能交通技术，尤其是一种动态拾音方法、装置、电子设备及存储介质。

技术介绍

[0002]随着智能网联汽车的快速发展，语音控制功能在汽车里的应用已经越来越普遍。动态拾音功能，即锁定唤起一方音源，限制其它方向的音源输入，更能提高唤醒方用户的语音识别准确率。车载场景是复杂的，车躁、胎噪、车载音乐等情况，都会对车载场景的音源判定造成影响。如果出现动态拾音错误的情况，对用户的体验感是极其负面的。因为唤醒方后续的指令输入被限制，反而不能使用语音，完全丢失了语音的体验入口。
[0003]在起初的项目中，大多是单音区项目，即麦克风集中在主副驾之间，通过麦克风接收到的主驾和副驾的音源的时间差进行判断。但这种判断方式在面对复杂的车载场景，准确率一直有待提升。以致于后面出来了双音区、四音区方案。但是这也只是进一步提升了准确率，并不能完全避免。这种提升还建立在高昂的硬件消耗的基础上，而且后期四音区的开发、维护成本也很高。

技术实现思路

[0004]本公开提供了一种动态拾音方法、装置、电子设备以及存储介质。
[0005]第一方面，本申请提供了一种动态拾音方法，所述方法包括：
[0006]接收当前用户发送的唤醒指令；
[0007]响应于所述唤醒指令，对所述当前用户进行人脸识别，得到所述当前用户的人脸识别结果；
[0008]若所述当前用户的人脸识别结果满足预先设定的检测条件，接收所述当前用户发送的语...

【技术保护点】

【技术特征摘要】
1.一种动态拾音方法，所述方法包括：接收当前用户发送的唤醒指令；响应于所述唤醒指令，对所述当前用户进行人脸识别，得到所述当前用户的人脸识别结果；若所述当前用户的人脸识别结果满足预先设定的检测条件，接收所述当前用户发送的语音控制指令；响应于所述语音控制指令，执行所述语音控制指令对应的控制操作。2.根据权利要求1所述的方法，所述响应于所述唤醒指令，对所述当前用户进行人脸识别，得到所述当前用户的人脸识别结果，包括：响应于所述唤醒指令，向车辆的图像采集装置发送图像采集指令，使得所述图像采集装置响应于所述图像采集指令获取所述当前用户的至少一张人脸图像；基于所述至少一张人脸图像对所述当前用户进行人脸识别，得到所述当前用户的人脸识别结果。3.根据权利要求2所述的方法，其中，所述基于所述至少一张人脸图像对所述当前用户进行人脸识别，得到所述当前用户的人脸识别结果，包括：将所述至少一张人脸图像中的各张人脸图像输入至预先训练好的人脸识别模型中，通过所述人脸识别模型得到各张人脸图像对应的人脸识别结果；基于各张图像对应的人脸识别结果确定所述当前用户的人脸识别结果。4.根据权利要求1所述的方法，其中，所述接收当前用户发送的唤醒指令，包括：接收所述当前用户通过耳机触发的唤醒操作；根据所述唤醒操作生成所述唤醒指令；或者，接收所述当前用户通过麦克风发送的唤醒语音；根据所述唤醒语音生成所述唤醒指令；所述唤醒指令用于指示车辆的图像采集装置进行唤醒。5.根据权利要求4所述的方法，所述方法还包括：若至少两个拾音器接收到所述唤醒指令，则基于所述至少两个拾音器接收到的唤醒指令的信号幅值，从所述至少两个拾音器中确定出唤醒指令所对应的目标拾音器；将所述目标拾音器接收到的唤醒指令作为所述当前用户发送的唤醒指令。6.根据权利要求1所述的方法，其中，所述当前用户的人脸识别结果满足预先设定的检测条件，包括：在所述当前用户的人脸识别结果中提取出所述当前用户的人脸特征；若所述当前用户的人脸特征与多个目标用户中的其中一个目标用户的人脸特征相匹配，则判定所述当前用户的人脸识别结果满足所述预先确定的检测条件。7.一种动态拾音装置，所述装置包括：指令接收模块、人脸识别模块和指令执行模块；其中，所述指令接收模块，用于接收当前用户发送的唤醒指令；所述人脸识别模块，用于响应于所述唤醒指令，对所述当前用户进行人脸识别，得到所述当前用户的人脸识别结果；所述指令接收模块，还用于若所述当前用户的人...

【专利技术属性】
技术研发人员：王磊，
申请(专利权)人：阿波罗智联北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人