语音交互方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:32830866 阅读:19 留言:0更新日期:2022-03-26 20:43
本公开提供了一种语音交互方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域,尤其涉及语音技术领域、自然语言处理技术领域、深度学习技术领域。具体实现方案为:监测目标驾舱是否满足语音交互模式的切换条件,语音交互模式包括舱内语音交互模式和舱外语音交互模式;若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式;采用另一种语音交互模式与目标用户进行语音交互。本公开能够在满足语音交互模式的切换条件时,实现对语音交互模式之间的切换,而且能够实现与用户的多种语音交互方式,全方位的满足用户的语音交互需求。全方位的满足用户的语音交互需求。全方位的满足用户的语音交互需求。

【技术实现步骤摘要】
语音交互方法、装置、设备、存储介质及程序产品


[0001]本公开涉及人工智能
中的语音
、自然语言处理
、深度学习
,尤其涉及一种语音交互方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]随着汽车智能化程度越来越高以及智能网联汽车的快速发展,车载语音技术作为车载人工智能的基础入口,对车载语音在交互场景上的扩展提出了新的要求。
[0003]目前在采用车载语音技术时,一般均为舱内进行语音交互的形式进行,导致交互方式单一,无法全方位地满足用户的语音交互需求。

技术实现思路

[0004]本公开提供了一种语音交互方法、装置、设备、存储介质及程序产品。
[0005]根据本公开的第一方面,提供了一种语音交互方法,包括:
[0006]监测目标驾舱是否满足语音交互模式的切换条件,所述语音交互模式包括舱内语音交互模式和舱外语音交互模式;
[0007]若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式;
[0008]采用另一种语音交互模式与目标用户进行语音交互。
[0009]根据本公开的第二方面,提供了一种语音交互装置,包括:
[0010]监测单元,用于监测目标驾舱是否满足语音交互模式的切换条件,所述语音交互模式包括舱内语音交互模式和舱外语音交互模式;
[0011]切换单元,用于若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式;
[0012]语音交互单元,用于采用另一种语音交互模式与目标用户进行语音交互。
[0013]根据本公开的第三方面,提供了一种电子设备,包括:
[0014]至少一个处理器;至少一个麦克风以及
[0015]与所述至少一个处理器通信连接的存储器;其中,
[0016]所述存储器存储有可被所述至少一个处理器执行的指令;所述麦克风用于采集目标用户的交互语音;
[0017]所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
[0018]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面所述的方法。
[0019]根据本公开的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电
子设备执行第一方面所述的方法。
[0020]根据本公开的技术由于语音交互模式包括舱内语音交互模式和舱外语音交互模式,并且能够在满足语音交互模式的切换条件时,实现对语音交互模式之间的切换,采用与用户需求匹配的语音交互模式来满足用户需求,所以能够实现与用户的多种语音交互方式,全方位的满足用户的语音交互需求。
[0021]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0022]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0023]图1是根据本公开提供的语音交互方法的应用场景示意图;
[0024]图2是根据本公开第一实施例提供的语音交互方法的流程示意图;
[0025]图3是根据本公开第二实施例提供的语音交互方法的流程示意图;
[0026]图4是根据本公开第三实施例提供的语音交互方法的流程示意图;
[0027]图5是根据本公开第四实施例提供的语音交互方法的流程示意图;
[0028]图6是根据本公开第四实施例提供的语音交互方法中语音交互模式示意图;
[0029]图7是根据本公开第五实施例提供的语音交互方法的流程示意图;
[0030]图8是根据本公开第六实施例提供的语音交互方法的流程示意图;
[0031]图9是根据本公开第七实施例提供的语音交互方法的流程示意图;
[0032]图10是根据本公开第八实施例提供的语音交互方法的流程示意图;
[0033]图11是根据本公开第九实施例提供的语音交互装置的结构示意图;
[0034]图12是用来实现本公开实施例的语音交互方法的电子设备的框图。
具体实施方式
[0035]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0036]需要说明的是,本公开的技术方案中,所涉及的与用户相关的信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0037]为了清楚理解本公开的技术方案,首先对现有技术的技术方案进行详细介绍。
[0038]目前在采用车载语音技术时,一般均为舱内进行语音交互的形式进行。具体地,通过在舱内设置麦克风,采集舱内用户发出的语音。若发出的语音中包括唤醒词,则开启舱内语音交互模式,采用舱内语音交互模式进行舱内用户交互语音的识别,并根据语音识别结果执行对应的操作。如可控制电子设备的运行,还可智能控制车辆行驶。但用户在使用车辆时的需求是多种多样的。目前的舱内语音交互模式,只能满足舱内用户的需求,导致交互方式单一,无法全方位地满足用户的语音交互需求。
[0039]所以在面对现有技术中的技术问题时,专利技术人通过创造性的研究发现,用户在使用车辆时,不仅在进入舱内后有需求,在进入车辆前,以及离开车辆后仍然有一些需求。如
即将进入车辆时,自动开锁,打开车门或后备箱。离开车辆时,自动落锁,关闭语音交互功能等。所以全方位考虑用户使用车辆的需求后,可将语音交互模式划分为舱内语音交互模式和舱外语音交互模式。采用舱内语音交互模式满足舱内用户的语音交互需求。采用舱外语音交互模式满足用户在车辆外的语音交互需求。并且在具有两种语音交互模式后,监测车辆是否满足语音交互模式的切换条件。若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式。采用另一种语音交互模式与目标用户进行语音交互。由于语音交互模式包括舱内语音交互模式和舱外语音交互模式,并且能够在满足语音交互模式的切换条件时,实现对语音交互模式之间的切换,采用与用户需求匹配的语音交互模式来满足用户需求,所以能够实现与用户的多种语音交互方式,全方位的满足用户的语音交互需求。
[0040]专利技术人基于上述的创造性发现,提出了本公开的技术方案。下面对本公开实施例提供的人脸识别模型的训练方法和人脸识别方法的网络架构进行介绍。
[0041]图1是根据本公开提供的语音交互本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,包括:监测目标驾舱是否满足语音交互模式的切换条件,所述语音交互模式包括舱内语音交互模式和舱外语音交互模式;若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式;采用另一种语音交互模式与目标用户进行语音交互。2.根据权利要求1所述的方法,其中,所述目标用户包括主驾用户;所述监测目标驾舱是否满足语音交互模式的切换条件,包括:获取主驾用户在目标驾舱上的起落座状态;根据主驾用户在目标驾舱上的起落座状态监测目标驾舱是否满足语音交互模式的切换条件。3.根据权利要求2所述的方法,其中,所述根据主驾用户在目标驾舱上的起落座状态监测目标驾舱是否满足语音交互模式的切换条件,包括:若监测到主驾用户在目标驾舱上处于落座状态,则确定目标驾舱满足从舱外语音交互模式到舱内语音交互模式的切换条件;若监测到主驾用户在目标驾舱上处于离座状态,则确定目标驾舱满足从舱内语音交互模式到舱外音交互模式的切换条件。4.根据权利要求1所述的方法,其中,所述监测目标驾舱是否满足语音交互模式的切换条件,包括:监测是否接收到目标用户触发的模式切换操作;若确定接收到目标用户触发的模式切换操作,则确定满足语音交互模式的切换条件。5.根据权利要求1所述的方法,其中,所述采用另一种语音交互模式与至少一个用户进行语音交互,包括:采用舱外语音交互模式与目标用户进行语音交互。6.根据权利要求5所述的方法,所述目标驾舱外侧设置至少一个麦克风;所述采用舱外语音交互模式与目标用户进行语音交互,包括:采用所述麦克风采集位于目标驾舱外的目标用户的交互语音;若所述麦克风为一个,则将所述交互语音发送至语音服务器,以使所述语音服务器对所述交互语音进行识别;接收语音服务器发送的语音识别结果,并根据语音识别结果控制目标驾舱执行对应的操作。7.根据权利要求6所述的方法,其中,所述麦克风为多个,分别设置在目标驾舱的后视镜和后备箱上;所述交互语音为多路;所述将所述交互语音发送至语音服务器之前,还包括:从所述交互语音中筛选出目标交互语音;所述将所述交互语音发送至语音服务器,以使所述语音服务器对所述交互语音进行识别,包括:将所述目标交互语音发送至语音服务器,以使所述语音服务器对所述目标交互语音进行识别。
8.根据权利要求7所述的方法,其中,所述从所述交互语音中筛选出目标交互语音,包括:将所述交互语音输入到预设的语音方位识别模型中;采用所述预设的语音方位识别模型从所述交互语音中识别出目标用户所在方向的麦克风对应的交互语音;将目标用户所在方向的麦克风对应的交互语音确定为目标交互语音。9.根据权利要求6

8任一项所述的方法,其中,所述将所述交互语音发送至语音服务器之前,还包括:对所述交互语音进行回声消除处理和混响消除处理。10.根据权利要求9所述的方法,其中,对所述交互语音进行回声消除处理,包括:获取目标驾舱喇叭播放的回声参考信号;将所述交互语音及所述回声参考信号进行时间方向上的对齐操作,以获得对齐后的交互语音及对齐后的回声参考信号;将对齐后的交互语音及对齐后的回声参考信号输入到回声消除算法中;采用所述回声消除算法以对齐后的回声参考信号为参考对所述对齐后的交互语音进行回声消除处理,并输出回声消除后的交互语音。11.根据权利要求9或10所述的方法,其中,对所述交互语音进行混响消除处理,包括:将所述交互语音输入到混响消除算法中;采用所述混响消除算法对所述交互语音进行混响消除处理,以获得混响消除后的交互语音。12.根据权利要求6

11任一项所述的方法,其中,所述将所述交互语音发送至语音服务器之前,还包括:采用起尾点检测算法对所述交互语音进行起尾点检测;所述将所述交互语音发送至语音服务器,包括:将位于起尾点之间的交互语音发送至语音服务器。13.根据权利要求5

12任一项所述的方法,其中,所述目标用户包括多个;所述采用舱外语音交互模式与目标用户进行语音交互,包括:采用舱外语音交互模式及唤醒抢占方式与多个目标用户进行语音交互。14.根据权利要求13所述的方法,其中,所述采用舱外语音交互模式及唤醒抢占方式与多个目标用户进行语音交互,包括:若采用舱外语音交互模式与第一目标用户进行语音交互,并在向时语音服务器发送第一目标用户对应的交互语音时,采用唤醒算法识别到第二目标用户发出唤醒词,则停止向语音服务器发送第一目标用户对应的交互语音;将第二目标用户对应的交互语音发送给语音服务器,以使语音服务器停止对第一目标用户对应的交互语音进行识别,并对第二目标用户对应的交互语音进行识别。15.根据权利要求1

14任一项所述的方法,所述监测目标驾舱是否满足语音交互模式的切换条件之前,还包括:监测目标驾舱是否满足舱外语音交互模式的开启条件;若确定满足舱外语音交互模式的开启条件,则开启舱外语音交互模式。
16.根据权利要求15所述的方法,其中,所述监测目标驾舱是否满足舱外语音交互模式的开启条件,包括:监测目标驾舱的电子钥匙是否进入目标驾舱周围的预设区域内;若确定目标驾舱的电子钥匙进入目标驾舱周围的预设区域内,则确定满足舱外语音交互模式的开启条件。17.根据权利要求1

16任一项所述的方法,还包括:监测目标驾舱是否满足语音交互功能的关闭条件;若确定满足语音交互功能的关闭条件,则对语音交互功能进行关闭。18.根据权利要求17所述的方法,其中,所述监测目标驾舱是否满足语音交互功能的关闭条件,包括:监测目标驾舱的电子钥匙是否离开目标驾舱周围的预设区域;若确定目标驾舱的电子钥匙离开目标驾舱周围的预设区域,则确定满足语音交互功能的关闭条件。19.一种语音交互装置,包括:监测单元,用于监测目标驾舱是否满足语音交互模式的切换条件,所述语音交互模式包括舱内语音交互模式和舱外语音交互模式;切换单元,用于若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式;语音交互单元,用于采用另一种语音交互模式与目标用户进行语音交互。20.根据权利要求19所述的装...

【专利技术属性】
技术研发人员:李鹏伟徐木水汪木金杜春明
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1