一种声源跟踪定位方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:16886524 阅读:36 留言:0更新日期:2017-12-27 04:19
本发明专利技术实施例公开了一种声源跟踪定位方法、装置、设备和计算机可读存储介质。该方法包括:接收用户语音指令;依据预设的设备唤醒位置确定是否发生位置变更;若发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;将所述用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应所述用户语音指令;否则,屏蔽所述用户语音指令。本发明专利技术实施例提供的技术方案,当用户更换了位置后,能够主动屏蔽掉其他用户发送的语音请求,直接跟踪到唤醒终端的用户发送的语音请求,并进行响应提供相应的语音服务。实现了用户在频繁移动的场景下无需再次输出预设文本的引导音来唤醒智能终端响应语音服务,大大提高了语音服务的处理效率。

A sound source tracking and positioning method, device, equipment and computer readable storage medium

An embodiment of the invention discloses a sound source tracking and positioning method, a device, a device and a computer readable storage medium. The method includes: receiving user voice commands; according to a preset position to determine whether the device to wake up position change; if the position changes, is extracted from the user voiceprint feature from the user voice commands; the user voiceprint and preset sample voiceprint matching, if the matching is successful, then the response user voice commands; otherwise, shielding the user voice commands. The technical proposal provided by the embodiment of the invention can actively shield the voice requests of other users after being changed, and directly track the voice requests sent by users, and provide corresponding voice services in response. It realizes that users do not need to output the preset text's guide voice when they move frequently, so that the intelligent terminal can respond to the voice service, which greatly improves the processing efficiency of the voice service.

【技术实现步骤摘要】
一种声源跟踪定位方法、装置、设备和计算机可读存储介质
本专利技术实施例涉及语音识别
,尤其涉及一种声源跟踪定位方法、装置、设备和计算机可读存储介质。
技术介绍
近年来,随着语音识别技术的广泛普及,越来越多的用户通过语音来控制智能终端为自身的生活需求提供服务,但是在这之前,首先需要唤醒智能终端。目前,现有的智能终端是通过用户发送预设的文本的引导音,例如“小度,小度”来唤醒智能终端,智能终端通过引导音对该用户进行定位,进而,当接收从该位置发送的语音请求时,解析所述语音请求获取用户的服务需求,并为用户提供相应的服务。当用户发生位置变更后再次发送语音服务指令之前,需要再次发送引导音,重新唤醒智能终端,进而输出后续的语音请求。由此可见,现有技术是通过每次预设的文本引导音来唤醒智能终端,进行对用户定位后响应后续的语音请求,如果用户移动更换了位置,需要再次发送的引导音唤醒智能终端响应后续的语音请求。因此,针对用户频繁移动的场景,大大降低了语音处理效率。
技术实现思路
本专利技术实施例提供一种声源跟踪定位方法、装置、设备和计算机可读存储介质,可以实现用户在频繁移动的场景下无需再次输出预设文本的引导音来唤醒智能终端响应语音服务,大大提高了语音服务的处理效率。第一方面,本专利技术实施例提供了一种声源跟踪定位方法,该方法包括:接收用户语音指令;依据预设的设备唤醒位置确定是否发生位置变更;若发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;将所述用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应所述用户语音指令;否则,屏蔽所述用户语音指令。第二方面,本专利技术实施例还提供了一种声源跟踪定位装置,该装置包括:语音指令接收模块,用于接收用户语音指令;位置变更确定模块,用于依据预设的设备唤醒位置确定是否发生位置变更;声纹特征提取模块,用于若预设的设备唤醒位置发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;声纹特征匹配模块,用于将所述用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应所述用户语音指令;否则,屏蔽所述用户语音指令。第三方面,本专利技术实施例还提供了一种设备,该设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中任一所述的声源跟踪定位方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一所述的声源跟踪定位方法。本专利技术实施例提供一种声源跟踪定位方法、装置、设备和计算机可读存储介质,在依据设备唤醒位置确定发生位置变更后,通过从用户语音指令中提取得到用户声纹特征,将用户声纹特征与样本声纹特征进行匹配,若匹配成功,则确定用户语音指令来自于唤醒设备的用户,并响应用户语音指令;若匹配失败,则确定用户语音指令来自于其他用户,屏蔽用户语音指令。在用户频繁移动的场景下无需再次对智能终端执行唤醒操作即可只响应来自唤醒设备的用户的语音指令,即在发生位置变更后实现了追踪定位唤醒设备的用户,大大提高了语音服务的处理效率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术实施例一中提供的一种声源跟踪定位方法的流程图;图2是本专利技术实施例二中提供的一种声源跟踪定位方法的流程图;图3是本专利技术实施例三中提供的一种声源跟踪定位装置的结构框图;图4是本专利技术实施例四中提供的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。实施例一图1为本专利技术实施例一提供的一种声源跟踪定位方法的流程图,本实施例可适用于根据用户需求进行声源跟踪情况,该方法可以由本专利技术实施例提供的声源跟踪定位装置/设备/计算机可读存储介质来执行,该装置/设备/计算机可读存储介质可采用软件和/或硬件的方式实现。参见图1,该方法具体包括:S110,接收用户语音指令。其中,智能终端可以对周围环境进行实时检测,当检测到所处环境有语音指令时,采集用户语音指令。智能终端是支持语音交互的多媒体功能的智能设备,如具有音频、视频、数据等方面的功能,可以是智能机器人,智能音箱等。用户通过语音向智能终端发送服务请求,智能终端接收用户的指令。S120,依据预设的设备唤醒位置确定是否发生位置变更。其中,设备唤醒位置是用户唤醒智能终端时所处的位置,唤醒智能终端指的是控制智能终端由休眠状态切换到运行状态。在用户通过向智能终端发送预设的文本的引导音,例如“小度,小度”来唤醒智能终端时,智能终端接收到用户发送的预设的文本的引导音后,进行定位得到设备唤醒位置。当处于运行状态的智能终端接收到接收用户语音指令时,采用定位技术确定当前位置,并将当前位置与设备唤醒位置进行比较,如果两者相同,则确定该用户没有移动,其位置没有变更,可以直接响应用户语音指令;如果两者不同,则确定该用户移动了,其位置发生了变更。S130,若发生位置变更,则从用户语音指令中提取得到用户声纹特征。其中,声纹特征是每个人所特有的、相对稳定的语音信息中所携带的。若用户的位置发生了变更,则智能终端从接收到的用户语音指令中提取用户声纹特征。S140,将用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应用户语音指令;否则,屏蔽用户语音指令。其中,样本声纹特征是指用户唤醒智能终端时,智能终端提取的用户语音指令中的声纹特征,即样本声纹特征属于唤醒智能终端的用户。智能终端从接收到的用户的语音指令中提取用户的声纹特征,并将其与样本声纹特征进行匹配,若匹配成功,则用户语音指令来自唤醒智能设备的用户,智能终端响应用户语音指令;若匹配失败,则用户语音指令来自其他用户,智能终端屏蔽用户语音指令。本实施例提供的声源跟踪定位方法,通过在检测到发生位置变更后,提取用户语音指令中的用户声纹特征,将用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应用户语音指令;否则,屏蔽用户语音指令,这样能够主动屏蔽掉其他用户发送的语音请求,直接跟踪到唤醒终端的用户发送的语音请求,并进行响应提供相应的语音服务。实现了用户在频繁移动的场景下无需再次输出预设文本的引导音来唤醒智能终端响应语音服务,大大提高了语音服务的处理效率。实施例二图2是本专利技术实施例二提供的一种声源跟踪定位方法的流程示意图。本专利技术实施例在上述实施例的基础上进行优化,参见图2,本实施例提供的声源跟踪定位方法包括:S210,接收用户输入的语音信息。S220,确定语音信息与预设的唤醒文本是否匹配。其中,预设的唤醒文本是指预先存储在智能终端中的用户唤醒智能终端时使用的唤醒语音指令对应的文本。当智能终端接收到用户发送的语音信息后,通过解析语音信息获得语音信息所对应的文本,将语音信息所对应的文本与预设的唤醒文本进行匹配。例如,“小度,小度”是预先存储在智能终端中的唤醒文本,用户在需要使用智能终端时向智能终端发送语音信息,智能终端接收到语音信息后,将其与预设的唤醒文本“小度,小度”进行匹配。S230,若匹本文档来自技高网...
一种声源跟踪定位方法、装置、设备和计算机可读存储介质

【技术保护点】
一种声源跟踪定位方法,其特征在于,包括:接收用户语音指令;依据预设的设备唤醒位置确定是否发生位置变更;若发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;将所述用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应所述用户语音指令;否则,屏蔽所述用户语音指令。

【技术特征摘要】
1.一种声源跟踪定位方法,其特征在于,包括:接收用户语音指令;依据预设的设备唤醒位置确定是否发生位置变更;若发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;将所述用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应所述用户语音指令;否则,屏蔽所述用户语音指令。2.根据权利要求1所述的声源跟踪定位方法,其特征在于,所述样本声纹特征的确定包括:接收用户输入的语音信息;确定所述语音信息与预设的唤醒文本是否匹配;若匹配,则提取所述语音信息的声纹特征,并将提取的声纹特征作为所述样本声纹特征。3.根据权利要求2所述的声源跟踪定位方法,其特征在于,确定所述语音信息与预设的唤醒文本是否匹配之后,还包括:若匹配,则采用定位技术得到当前位置,并将所述当前位置确定为所述设备唤醒位置。4.一种声源跟踪定位装置,其特征在于,包括:语音指令接收模块,用于接收用户语音指令;位置变更确定模块,用于依据预设的设备唤醒位置确定是否发生位置变更;声纹特征提取模块,用于若预设的设备唤醒位置发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;声纹特征匹配模块,用于将所述用户声纹特征与预设的样本声纹特征进...

【专利技术属性】
技术研发人员:高聪
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1