本申请公开了一种动态拾音方法、装置、电子设备及存储介质,涉及人工智能领域,尤其涉及智能交通领域。具体实现方案为:接收当前用户发送的唤醒指令;响应于唤醒指令,对当前用户进行人脸识别,得到当前用户的人脸识别结果;若当前用户的人脸识别结果满足预先设定的检测条件,接收当前用户发送的语音控制指令;响应于语音控制指令,执行语音控制指令对应的控制操作。本申请实施例可以有效地提高车载场景下的动态拾音准确率,同时还可以节省硬件开销,降低维护成本。降低维护成本。降低维护成本。
【技术实现步骤摘要】
一种动态拾音方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,进一步涉及智能交通技术,尤其是一种动态拾音方法、装置、电子设备及存储介质。
技术介绍
[0002]随着智能网联汽车的快速发展,语音控制功能在汽车里的应用已经越来越普遍。动态拾音功能,即锁定唤起一方音源,限制其它方向的音源输入,更能提高唤醒方用户的语音识别准确率。车载场景是复杂的,车躁、胎噪、车载音乐等情况,都会对车载场景的音源判定造成影响。如果出现动态拾音错误的情况,对用户的体验感是极其负面的。因为唤醒方后续的指令输入被限制,反而不能使用语音,完全丢失了语音的体验入口。
[0003]在起初的项目中,大多是单音区项目,即麦克风集中在主副驾之间,通过麦克风接收到的主驾和副驾的音源的时间差进行判断。但这种判断方式在面对复杂的车载场景,准确率一直有待提升。以致于后面出来了双音区、四音区方案。但是这也只是进一步提升了准确率,并不能完全避免。这种提升还建立在高昂的硬件消耗的基础上,而且后期四音区的开发、维护成本也很高。
技术实现思路
[0004]本公开提供了一种动态拾音方法、装置、电子设备以及存储介质。
[0005]第一方面,本申请提供了一种动态拾音方法,所述方法包括:
[0006]接收当前用户发送的唤醒指令;
[0007]响应于所述唤醒指令,对所述当前用户进行人脸识别,得到所述当前用户的人脸识别结果;
[0008]若所述当前用户的人脸识别结果满足预先设定的检测条件,接收所述当前用户发送的语音控制指令;
[0009]响应于所述语音控制指令,执行所述语音控制指令对应的控制操作。
[0010]第二方面,本申请提供了一种动态拾音装置,所述装置包括:指令接收模块、人脸识别模块和指令执行模块;其中,
[0011]所述指令接收模块,用于接收当前用户发送的唤醒指令;
[0012]所述人脸识别模块,用于响应于所述唤醒指令,对所述当前用户进行人脸识别,得到所述当前用户的人脸识别结果;
[0013]所述指令接收模块,还用于若所述当前用户的人脸识别结果满足预先设定的检测条件,接收所述当前用户发送的语音控制指令;
[0014]所述指令执行模块,用于响应于所述语音控制指令,执行所述语音控制指令对应的控制操作。
[0015]第三方面,本申请实施例提供了一种电子设备,包括:
[0016]一个或多个处理器;
[0017]存储器,用于存储一个或多个程序,
[0018]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请任意实施例所述的动态拾音方法。
[0019]第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任意实施例所述的动态拾音方法。
[0020]第五方面,提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时实现本申请任意实施例所述的动态拾音方法。
[0021]根据本申请的技术解决了现有技术中动态拾音准确率低,以及硬件消耗大,维护成本高的技术问题,本申请提供的技术方案,可以有效地提高车载场景下的动态拾音准确率,同时还可以节省硬件开销,降低维护成本。
[0022]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0024]图1是本申请实施例提供的动态拾音方法的第一流程示意图;
[0025]图2是本申请实施例提供的动态拾音方法的第二流程示意图;
[0026]图3是本申请实施例提供的动态拾音方法的第三流程示意图;
[0027]图4是本申请实施例三提供的动态拾音装置的结构示意图;
[0028]图5是用来实现本申请实施例的动态拾音方法的电子设备的框图。
具体实施方式
[0029]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0030]实施例一
[0031]图1是本申请实施例提供的动态拾音方法的第一流程示意图,该方法可以由动态拾音装置或者电子设备来执行,该装置或者电子设备可以由软件和/或硬件的方式实现,该装置或者电子设备可以集成在任何具有网络通信功能的智能设备中。如图1所示,动态拾音方法可以包括以下步骤:
[0032]S101、接收当前用户发送的唤醒指令。
[0033]在本步骤中,电子设备可以接收当前用户发送的唤醒指令。具体地,电子设备可以接收当前用户通过耳机触发的唤醒操作;根据唤醒操作生成唤醒指令;或者,电子设备还可以接收当前用户通过麦克风发送的唤醒语音;根据唤醒语音生成唤醒指令;唤醒指令用于指示车辆的图像采集装置进行唤醒。
[0034]S102、响应于唤醒指令,对当前用户进行人脸识别,得到当前用户的人脸识别结果。
[0035]在本步骤中,电子设备可以响应于唤醒指令,对当前用户进行人脸识别,得到当前
用户的人脸识别结果。具体地,电子设备可以响应于唤醒指令,向车辆的图像采集装置发送图像采集指令,使得图像采集装置响应于图像采集指令获取当前用户的至少一张人脸图像;然后基于该至少一张人脸图像对当前用户进行人脸识别,得到当前用户的人脸识别结果。
[0036]S103、若当前用户的人脸识别结果满足预先设定的检测条件,接收当前用户发送的语音控制指令。
[0037]在本步骤中,若当前用户的人脸识别结果满足预先设定的检测条件,电子设备可以接收当前用户发送的语音控制指令。具体地,电子设备可以在当前用户的人脸识别结果中提取出当前用户的人脸特征;若当前用户的人脸特征与多个目标用户中的其中一个目标用户的人脸特征相匹配,则电子设备可以判定当前用户的人脸识别结果满足预先确定的检测条件。若当前用户的人脸特征与多个目标用户中的任意一个目标用户的人脸特征均不匹配,则电子设备可以判定当前用户的人脸识别结果不满足预先确定的检测条件。
[0038]S104、响应于语音控制指令,执行语音控制指令对应的控制操作。
[0039]在本步骤中,电子设备可以响应于语音控制指令,执行语音控制指令对应的控制操作。具体地,电子设备可以先将语音控制指令转换为文本控制指令,然后执行文本控制指令对应的控制操作。
[0040]本申请实施例提出的动态拾音方法,先接收当前用户发送的唤醒指令;然后响应于该唤醒指令,对当前用户进行人脸识别,得到当前用户的人脸识别结果;若当前用户的人脸识别结果满足预先设定的检测条件,接收当前用户发送的语音控制指令;然后响应于该本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种动态拾音方法,所述方法包括:接收当前用户发送的唤醒指令;响应于所述唤醒指令,对所述当前用户进行人脸识别,得到所述当前用户的人脸识别结果;若所述当前用户的人脸识别结果满足预先设定的检测条件,接收所述当前用户发送的语音控制指令;响应于所述语音控制指令,执行所述语音控制指令对应的控制操作。2.根据权利要求1所述的方法,所述响应于所述唤醒指令,对所述当前用户进行人脸识别,得到所述当前用户的人脸识别结果,包括:响应于所述唤醒指令,向车辆的图像采集装置发送图像采集指令,使得所述图像采集装置响应于所述图像采集指令获取所述当前用户的至少一张人脸图像;基于所述至少一张人脸图像对所述当前用户进行人脸识别,得到所述当前用户的人脸识别结果。3.根据权利要求2所述的方法,其中,所述基于所述至少一张人脸图像对所述当前用户进行人脸识别,得到所述当前用户的人脸识别结果,包括:将所述至少一张人脸图像中的各张人脸图像输入至预先训练好的人脸识别模型中,通过所述人脸识别模型得到各张人脸图像对应的人脸识别结果;基于各张图像对应的人脸识别结果确定所述当前用户的人脸识别结果。4.根据权利要求1所述的方法,其中,所述接收当前用户发送的唤醒指令,包括:接收所述当前用户通过耳机触发的唤醒操作;根据所述唤醒操作生成所述唤醒指令;或者,接收所述当前用户通过麦克风发送的唤醒语音;根据所述唤醒语音生成所述唤醒指令;所述唤醒指令用于指示车辆的图像采集装置进行唤醒。5.根据权利要求4所述的方法,所述方法还包括:若至少两个拾音器接收到所述唤醒指令,则基于所述至少两个拾音器接收到的唤醒指令的信号幅值,从所述至少两个拾音器中确定出唤醒指令所对应的目标拾音器;将所述目标拾音器接收到的唤醒指令作为所述当前用户发送的唤醒指令。6.根据权利要求1所述的方法,其中,所述当前用户的人脸识别结果满足预先设定的检测条件,包括:在所述当前用户的人脸识别结果中提取出所述当前用户的人脸特征;若所述当前用户的人脸特征与多个目标用户中的其中一个目标用户的人脸特征相匹配,则判定所述当前用户的人脸识别结果满足所述预先确定的检测条件。7.一种动态拾音装置,所述装置包括:指令接收模块、人脸识别模块和指令执行模块;其中,所述指令接收模块,用于接收当前用户发送的唤醒指令;所述人脸识别模块,用于响应于所述唤醒指令,对所述当前用户进行人脸识别,得到所述当前用户的人脸识别结果;所述指令接收模块,还用于若所述当前用户的人...
【专利技术属性】
技术研发人员:王磊,
申请(专利权)人:阿波罗智联北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。