语音交互方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号：32830866 阅读：19 留言：0更新日期：2022-03-26 20:43

本公开提供了一种语音交互方法、装置、设备、存储介质及程序产品，涉及人工智能技术领域，尤其涉及语音技术领域、自然语言处理技术领域、深度学习技术领域。具体实现方案为：监测目标驾舱是否满足语音交互模式的切换条件，语音交互模式包括舱内语音交互模式和舱外语音交互模式；若确定满足语音交互模式的切换条件，则将语音交互模式从当前语音交互模式切换为另一种语音交互模式；采用另一种语音交互模式与目标用户进行语音交互。本公开能够在满足语音交互模式的切换条件时，实现对语音交互模式之间的切换，而且能够实现与用户的多种语音交互方式，全方位的满足用户的语音交互需求。全方位的满足用户的语音交互需求。全方位的满足用户的语音交互需求。

全部详细技术资料下载

【技术实现步骤摘要】
语音交互方法、装置、设备、存储介质及程序产品

[0001]本公开涉及人工智能
中的语音
、自然语言处理
、深度学习
，尤其涉及一种语音交互方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]随着汽车智能化程度越来越高以及智能网联汽车的快速发展，车载语音技术作为车载人工智能的基础入口，对车载语音在交互场景上的扩展提出了新的要求。
[0003]目前在采用车载语音技术时，一般均为舱内进行语音交互的形式进行，导致交互方式单一，无法全方位地满足用户的语音交互需求。

技术实现思路

[0004]本公开提供了一种语音交互方法、装置、设备、存储介质及程序产品。
[0005]根据本公开的第一方面，提供了一种语音交互方法，包括：
[0006]监测目标驾舱是否满足语音交互模式的切换条件，所述语音交互模式包括舱内语音交互模式和舱外语音交互模式；
[0007]若确定满足语音交互模式的切换条件，则将语音交互模式从当前语音交互模式切换为另一种语音交互模式；
[0008]采用另一种语音交互模式与目标用户进行语音交互。
[0009]根据本公开的第二方面，提供了一种语音交互装置，包括：
[0010]监测单元，用于监测目标驾舱是否满足语音交互模式的切换条件，所述语音交互模式包括舱内语音交互模式和舱外语音交互模式；
[0011]切换单元，用于若确定满足语音交互模式的切换条件，则将语音交互模式从当前语音交互模式切换为另一种语音交互模式；
[...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法，包括：监测目标驾舱是否满足语音交互模式的切换条件，所述语音交互模式包括舱内语音交互模式和舱外语音交互模式；若确定满足语音交互模式的切换条件，则将语音交互模式从当前语音交互模式切换为另一种语音交互模式；采用另一种语音交互模式与目标用户进行语音交互。2.根据权利要求1所述的方法，其中，所述目标用户包括主驾用户；所述监测目标驾舱是否满足语音交互模式的切换条件，包括：获取主驾用户在目标驾舱上的起落座状态；根据主驾用户在目标驾舱上的起落座状态监测目标驾舱是否满足语音交互模式的切换条件。3.根据权利要求2所述的方法，其中，所述根据主驾用户在目标驾舱上的起落座状态监测目标驾舱是否满足语音交互模式的切换条件，包括：若监测到主驾用户在目标驾舱上处于落座状态，则确定目标驾舱满足从舱外语音交互模式到舱内语音交互模式的切换条件；若监测到主驾用户在目标驾舱上处于离座状态，则确定目标驾舱满足从舱内语音交互模式到舱外音交互模式的切换条件。4.根据权利要求1所述的方法，其中，所述监测目标驾舱是否满足语音交互模式的切换条件，包括：监测是否接收到目标用户触发的模式切换操作；若确定接收到目标用户触发的模式切换操作，则确定满足语音交互模式的切换条件。5.根据权利要求1所述的方法，其中，所述采用另一种语音交互模式与至少一个用户进行语音交互，包括：采用舱外语音交互模式与目标用户进行语音交互。6.根据权利要求5所述的方法，所述目标驾舱外侧设置至少一个麦克风；所述采用舱外语音交互模式与目标用户进行语音交互，包括：采用所述麦克风采集位于目标驾舱外的目标用户的交互语音；若所述麦克风为一个，则将所述交互语音发送至语音服务器，以使所述语音服务器对所述交互语音进行识别；接收语音服务器发送的语音识别结果，并根据语音识别结果控制目标驾舱执行对应的操作。7.根据权利要求6所述的方法，其中，所述麦克风为多个，分别设置在目标驾舱的后视镜和后备箱上；所述交互语音为多路；所述将所述交互语音发送至语音服务器之前，还包括：从所述交互语音中筛选出目标交互语音；所述将所述交互语音发送至语音服务器，以使所述语音服务器对所述交互语音进行识别，包括：将所述目标交互语音发送至语音服务器，以使所述语音服务器对所述目标交互语音进行识别。
8.根据权利要求7所述的方法，其中，所述从所述交互语音中筛选出目标交互语音，包括：将所述交互语音输入到预设的语音方位识别模型中；采用所述预设的语音方位识别模型从所述交互语音中识别出目标用户所在方向的麦克风对应的交互语音；将目标用户所在方向的麦克风对应的交互语音确定为目标交互语音。9.根据权利要求6
‑
8任一项所述的方法，其中，所述将所述交互语音发送至语音服务器之前，还包括：对所述交互语音进行回声消除处理和混响消除处理。10.根据权利要求9所述的方法，其中，对所述交互语音进行回声消除处理，包括：获取目标驾舱喇叭播放的回声参考信号；将所述交互语音及所述回声参考信号进行时间方向上的对齐操作，以获得对齐后的交互语音及对齐后的回声参考信号；将对齐后的交互语音及对齐后的回声参考信号输入到回声消除算法中；采用所述回声消除算法以对齐后的回声参考信号为参考对所述对齐后的交互语音进行回声消除处理，并输出回声消除后的交互语音。11.根据权利要求9或10所述的方法，其中，对所述交互语音进行混响消除处理，包括：将所述交互语音输入到混响消除算法中；采用所述混响消除算法对所述交互语音进行混响消除处理，以获得混响消除后的交互语音。12.根据权利要求6
‑
11任一项所述的方法，其中，所述将所述交互语音发送至语音服务器之前，还包括：采用起尾点检测算法对所述交互语音进行起尾点检测；所述将所述交互语音发送至语音服务器，包括：将位于起尾点之间的交互语音发送至语音服务器。13.根据权利要求5
‑
12任一项所述的方法，其中，所述目标用户包括多个；所述采用舱外语音交互模式与目标用户进行语音交互，包括：采用舱外语音交互模式及唤醒抢占方式与多个目标用户进行语音交互。14.根据权利要求13所述的方法，其中，所述采用舱外语音交互模式及唤醒抢占方式与多个目标用户进行语音交互，包括：若采用舱外语音交互模式与第一目标用户进行语音交互，并在向时语音服务器发送第一目标用户对应的交互语音时，采用唤醒算法识别到第二目标用户发出唤醒词，则停止向语音服务器发送第一目标用户对应的交互语音；将第二目标用户对应的交互语音发送给语音服务器，以使语音服务器停止对第一目标用户对应的交互语音进行识别，并对第二目标用户对应的交互语音进行识别。15.根据权利要求1
‑
14任一项所述的方法，所述监测目标驾舱是否满足语音交互模式的切换条件之前，还包括：监测目标驾舱是否满足舱外语音交互模式的开启条件；若确定满足舱外语音交互模式的开启条件，则开启舱外语音交互模式。
16.根据权利要求15所述的方法，其中，所述监测目标驾舱是否满足舱外语音交互模式的开启条件，包括：监测目标驾舱的电子钥匙是否进入目标驾舱周围的预设区域内；若确定目标驾舱的电子钥匙进入目标驾舱周围的预设区域内，则确定满足舱外语音交互模式的开启条件。17.根据权利要求1
‑
16任一项所述的方法，还包括：监测目标驾舱是否满足语音交互功能的关闭条件；若确定满足语音交互功能的关闭条件，则对语音交互功能进行关闭。18.根据权利要求17所述的方法，其中，所述监测目标驾舱是否满足语音交互功能的关闭条件，包括：监测目标驾舱的电子钥匙是否离开目标驾舱周围的预设区域；若确定目标驾舱的电子钥匙离开目标驾舱周围的预设区域，则确定满足语音交互功能的关闭条件。19.一种语音交互装置，包括：监测单元，用于监测目标驾舱是否满足语音交互模式的切换条件，所述语音交互模式包括舱内语音交互模式和舱外语音交互模式；切换单元，用于若确定满足语音交互模式的切换条件，则将语音交互模式从当前语音交互模式切换为另一种语音交互模式；语音交互单元，用于采用另一种语音交互模式与目标用户进行语音交互。20.根据权利要求19所述的装...

【专利技术属性】
技术研发人员：李鹏伟，徐木水，汪木金，杜春明，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人