一种语音交互方法、装置、设备及存储介质制造方法及图纸

技术编号：21481333 阅读：44 留言：0更新日期：2019-06-29 05:41

本发明专利技术实施例提出一种语音交互方法、装置、设备及存储介质，其中方法包括：采集第一用户图像，识别所述第一用户图像中的用户动作；响应于所述第一用户图像中的用户动作与第一预设动作相匹配，接收语音信息并对所述语音信息进行语音识别；采集第二用户图像，识别所述第二用户图像中的用户动作；响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配，停止接收语音信息。本发明专利技术实施例能够简化唤醒流程，改善用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音交互方法、装置、设备及存储介质
本专利技术涉及语音交互
，尤其涉及一种语音交互方法、装置、设备及存储介质。
技术介绍
语音交互设备在接收用户发出的语音指令之前，需要首先被唤醒。目前一般采用语音唤醒的方式，例如用户发出包含唤醒词的语音信息，当语音交互设备识别出该唤醒词时，语音交互设备被唤醒。现有的语音交互方法中，每次在进行语音交互前用户都需要说一次唤醒词，这种方式的用户体验较差。
技术实现思路
本专利技术实施例提供一种语音交互方法及装置，以至少解决现有技术中的以上技术问题。第一方面，本专利技术实施例提供了一种语音交互方法，包括：采集第一用户图像，识别所述第一用户图像中的用户动作；响应于所述第一用户图像中的用户动作与第一预设动作相匹配，接收语音信息并对所述语音信息进行语音识别；采集第二用户图像，识别所述第二用户图像中的用户动作；响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配，停止接收语音信息。在一种实施方式中，所述识别所述第二用户图像中的用户动作之后，还包括：响应于所述第二用户图像中的用户动作与第二预设动作相匹配，停止接收语音信息，并删除所述语音识别的结果。在一种实施方式中，还包括：响应于所述第一用户图像中的用户动作与第一预设动作相匹配，提示所述匹配的信息，并提示语音交互过程已开启；所述接收语音信息并对所述语音信息进行语音识别时，进一步提示正在接收语音信息，并显示所述语音识别的结果。在一种实施方式中，所述采集第二用户图像，识别所述第二用户图像中的用户动作，包括：采集多帧第二用户图像；根据各帧所述第二用户图像中的用户状态，识别所述多帧第二用...

【技术保护点】
1.一种语音交互方法，其特征在于，包括：采集第一用户图像，识别所述第一用户图像中的用户动作；响应于所述第一用户图像中的用户动作与第一预设动作相匹配，接收语音信息并对所述语音信息进行语音识别；采集第二用户图像，识别所述第二用户图像中的用户动作；响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配，停止接收语音信息。

【技术特征摘要】
1.一种语音交互方法，其特征在于，包括：采集第一用户图像，识别所述第一用户图像中的用户动作；响应于所述第一用户图像中的用户动作与第一预设动作相匹配，接收语音信息并对所述语音信息进行语音识别；采集第二用户图像，识别所述第二用户图像中的用户动作；响应于所述第二用户图像中的用户动作与所述第一预设动作不匹配，停止接收语音信息。2.根据权利要求1所述的方法，其特征在于，所述识别所述第二用户图像中的用户动作之后，还包括：响应于所述第二用户图像中的用户动作与第二预设动作相匹配，停止接收语音信息，并删除所述语音识别的结果。3.根据权利要求1或2所述的方法，其特征在于，还包括：响应于所述第一用户图像中的用户动作与第一预设动作相匹配，提示所述匹配的信息，并提示语音交互过程已开启；所述接收语音信息并对所述语音信息进行语音识别时，进一步提示正在接收语音信息，并显示所述语音识别的结果。4.根据权利要求1或2所述的方法，其特征在于，所述采集第二用户图像，识别所述第二用户图像中的用户动作，包括：采集多帧第二用户图像；根据各帧所述第二用户图像中的用户状态，识别所述多帧第二用户图像中的用户动作。5.一种语音交互装置，其特征在于，包括：第一采集识别模块，用于采集第一用户图像，识别所述第一用户图像中的用户动作；第一处理模块，用于响应于所述第一用户图像中的用户动作与第一预设动作相匹配，接收语音信息并对所...

【专利技术属性】
技术研发人员：戚耀文，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人