语音交互控制方法和装置制造方法及图纸

技术编号:20799000 阅读:24 留言:0更新日期:2019-04-06 12:41
本发明专利技术实施例提出一种语音交互控制方法和装置。其中,该方法包括:对语音交互设备收到的语音信号进行识别,得到语音交互需求;判断预先习得的入场需求中是否包括所述语音交互需求;如果所述入场需求中包括所述语音交互需求,则对所述语音交互需求进行响应。本发明专利技术实施例能够满足用户的自然体验需求,可以在用户使用过程中可以习得用户的真实需求,矫正误识需求。

Speech Interactive Control Method and Device

The embodiment of the present invention provides a voice interactive control method and device. Among them, the method includes: identifying the voice signals received by the voice interaction equipment to obtain the voice interaction requirements; determining whether the pre-acquired admission requirements include the voice interaction requirements; and responding to the voice interaction requirements if the admission requirements include the voice interaction requirements. The embodiment of the invention can satisfy the user's natural experience needs, and can acquire the user's real needs and correct the misunderstanding needs in the user's use process.

【技术实现步骤摘要】
语音交互控制方法和装置
本专利技术涉及语音交互
,尤其涉及一种语音交互控制方法和装置。
技术介绍
全双工交互场景下,设备一直处于收音状态。收音过程中各种声音都会收录进来。全部响应会造成打扰过多。如果用户想要设备改变响应,需要用户主动发出停止响应的命令。例如,说出“小度小度,放首歌”后,设备开始播放一首歌。如果需要别的功能,用户需要说出“暂停播放”使得设备停止播放。接着,用户说出“今天天气怎么样”,设备给出回答“今天天气晴朗,最高温度xx,最低温度xx”等。然后,用户说出“继续播放”,设备再继续播放歌曲。这种暂停播放与继续播放的体验不自然,且需要用户教育。
技术实现思路
本专利技术实施例提供一种语音交互控制方法和装置,以解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种语音交互控制方法,包括:对语音交互设备收到的语音信号进行识别,得到语音交互需求;判断预先习得的入场需求中是否包括所述语音交互需求;如果所述入场需求中包括所述语音交互需求,则对所述语音交互需求进行响应。在一种实施方式中,该方法还包括:如果对所述语音交互需求进行响应后收到负反馈,则从所述入场需求中删除所述语音交互需求。在一种实施方式中,如果对所述语音交互需求进行响应后收到负反馈,则从所述入场需求中删除所述语音交互需求,包括:如果对所述语音交互需求进行响应后收到负反馈的次数超出设定阈值,则从所述入场需求中删除所述语音交互需求。在一种实施方式中,所述负反馈包括负反馈表述和/或负反馈行为。在一种实施方式中,该方法还包括以下方式的至少一种:如果在设定时长内连续检测到与一个语音交互需求的近似或重复表达,则将该语音交互需求作为入场需求;统计所述语音交互设备对语音交互需求的响应,以及所述语音交互设备响应后的反馈,得到入场需求;将所述语音交互设备响应过的候选需求作为入场需求。第二方面,本专利技术实施例提供了一种语音交互控制装置,包括:需求识别模块,用于对语音交互设备收到的语音信号进行识别,得到语音交互需求;入场判断模块,用于判断预先习得的入场需求中是否包括所述语音交互需求;响应模块,用于如果所述入场需求中包括所述语音交互需求,则对所述语音交互需求进行响应。在一种实施方式中,该装置还包括:需求删除模块,用于如果对所述语音交互需求进行响应后收到负反馈,则从所述入场需求中删除所述语音交互需求。在一种实施方式中,所述需求删除模块还用于如果对所述语音交互需求进行响应后收到负反馈的次数超出设定阈值,则从所述入场需求中删除所述语音交互需求。在一种实施方式中,所述负反馈包括负反馈表述和/或负反馈行为。在一种实施方式中,该装置还包括以下模块的至少一种:第一入场模块,用于如果在设定时长内连续检测到与一个语音交互需求的近似或重复表达,则将该语音交互需求作为入场需求;第二入场模块,用于统计所述语音交互设备对语音交互需求的响应,以及所述语音交互设备响应后的反馈,得到入场需求;第三入场模块,用于将所述语音交互设备响应过的候选需求作为入场需求。第三方面,本专利技术实施例提供了一种语音交互控制装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,所述装置的结构中包括处理器和存储器,所述存储器用于存储支持所述装置执行上述语音交互控制方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述装置还可以包括通信接口,用于与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储语音交互控制装置所用的计算机软件指令,其包括用于执行上述语音交互控制方法所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:能够满足用户的自然体验需求,可以在用户使用过程中可以习得用户的真实需求,矫正误识需求。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1示出根据本专利技术实施例的语音交互控制方法的流程图。图2示出根据本专利技术实施例的语音交互控制方法的流程图。图3示出根据本专利技术实施例的语音交互控制装置的结构框图。图4示出根据本专利技术实施例的语音交互控制装置的结构框图。图5示出根据本专利技术实施例的语音交互控制装置的结构框图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。图1示出根据本专利技术实施例的语音交互控制方法的流程图。如图1所示,该方法可以包括:步骤S11、对语音交互设备收到的语音信号进行识别,得到语音交互需求。步骤S12、判断预先习得的入场需求中是否包括所述语音交互需求。步骤S13、如果所述入场需求中包括所述语音交互需求,则对所述语音交互需求进行响应。在本专利技术实施例中,语音交互设备可以包括具有语音交互功能的各种设备,例如手机、笔记本电脑、手持电脑、智能音箱、影音播放器等。语音交互设备被唤醒后,进入唤醒状态,可以开始在收音时长内持续地进行收音。可以根据语音交互设备的类型、具体应用场景的需求等设置收音时长。在收音时长内,如果语音交互设备从收到的语音信号中识别到语音交互需求,则可以按照语音交互需求进行对应的操作。其中,语音交互设备可以在本地对语音信号进行识别,也可以将收到的语音信号发送到其他的设备例如云端的语音识别服务器中进行识别。此外,可以预先习得语音交互设备的入场需求。不同的语音交互设备,由于其所处的环境、用户习惯等特点的不同,所习得的入场需求可能不同。语音交互设备的入场需求能够体现该语音交互设备的个性化特点。在一种示例中,如果用户对语音交互设备多次连续的说出相同或相似的语音,可以将该相同或相似的语音对应的需求作为入场需求。例如:用户多次重复说出“你好”、“放首歌”、“请关机”、“快进”等语音,则将“你好”、“放首歌”、“请关机”、“快进”对应的需求作为入场需求。在另一种示例中,如果某种语音交互设备例如音箱处于演播室中,演播室中常常出现的高频语音可能包括“播XX音乐”、“打开XX视频”、“关闭”等。如果每次收到这些高频语音就响应,可能造成干扰。因此,习得的该音箱的入场需求中不包括“播XX音乐”、“打开XX视频”、“关闭”对应的需求。在另一种示例中,如果某种语音交互设备例如音箱处于饭店中,饭店中常常出现的高频语音可能包括“你好”、“欢迎光临”等问候语。如果每次收到这些高频语音就响应,可能造成干扰。因此,习得的该音箱的入场需求中不包括“你好”、“欢迎光临”等对应的需求。在一种实施方式中,该方法中,习得入场需求的方式包括多种,示例如下:方式一、如果在设定时长内连续检测到与一个语音交互需求的近似或重复表达,则将该语音交互需求作为入场需求。例如,如果在10s内多次检测到本文档来自技高网...

【技术保护点】
1.一种语音交互控制方法,其特征在于,包括:对语音交互设备收到的语音信号进行识别,得到语音交互需求;判断预先习得的入场需求中是否包括所述语音交互需求;如果所述入场需求中包括所述语音交互需求,则对所述语音交互需求进行响应。

【技术特征摘要】
1.一种语音交互控制方法,其特征在于,包括:对语音交互设备收到的语音信号进行识别,得到语音交互需求;判断预先习得的入场需求中是否包括所述语音交互需求;如果所述入场需求中包括所述语音交互需求,则对所述语音交互需求进行响应。2.根据权利要求1所述的方法,其特征在于,还包括:如果对所述语音交互需求进行响应后收到负反馈,则从所述入场需求中删除所述语音交互需求。3.根据权利要求2所述的方法,其特征在于,如果对所述语音交互需求进行响应后收到负反馈,则从所述入场需求中删除所述语音交互需求,包括:如果对所述语音交互需求进行响应后收到负反馈的次数超出设定阈值,则从所述入场需求中删除所述语音交互需求。4.根据权利要求2所述的方法,其特征在于,所述负反馈包括负反馈表述和/或负反馈行为。5.根据权利要求1至4中任一项所述的方法,其特征在于,还包括以下方式的至少一种:如果在设定时长内连续检测到与一个语音交互需求的近似或重复表达,则将该语音交互需求作为入场需求;统计所述语音交互设备对语音交互需求的响应,以及所述语音交互设备响应后的反馈,得到入场需求;将所述语音交互设备响应过的候选需求作为入场需求。6.一种语音交互控制装置,其特征在于,包括:需求识别模块,用于对语音交互设备收到的语音信号进行识别,得到语音交互需求;入场判断模块,用于判断预先习得的入场需求中是否包括所述语音交互需求;响应模块...

【专利技术属性】
技术研发人员:杨宇宁
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1