用于处理信息的方法和装置制造方法及图纸

技术编号:27227641 阅读:22 留言:0更新日期:2021-02-04 11:50
本公开的实施例公开了用于处理信息的方法和装置。该方法的一具体实施方式包括:获取目标用户输入的语音信息;基于语音信息,对目标用户的用户意图进行识别;响应于未获得用于表征目标用户的用户意图的识别结果,获取与目标用户相关的辅助信息;基于语音信息和辅助信息,对目标用户的用户意图进行识别,生成用于表征目标用户的用户意图的候选识别结果;将所获得的候选识别结果呈现给目标用户;响应于检测到目标用户针对所呈现的候选识别结果的选定操作,执行目标用户选定的候选识别结果所对应的操作。该实施方式可以引导用户选择符合其真实意图的候选识别结果,可以提高用户体验,并且可以提高对话效率。并且可以提高对话效率。并且可以提高对话效率。

【技术实现步骤摘要】
用于处理信息的方法和装置


[0001]本公开的实施例涉及计算机
,尤其涉及用于处理信息的方法和装置。

技术介绍

[0002]现有的任务型对话系统在获取到用户输入的语音信息后,需要首先识别用户意图,然后向用户反馈与用户意图相对应的信息。例如,用户输入语音信息“今天天气如何”,则任务型对话系统可以从语音信息“今天天气如何”中识别出用户意图为“查询天气”,进而可以获取天气信息并呈现给用户。
[0003]目前,一般采用语音识别技术对用户的语音信息进行识别,以确定用户意图。

技术实现思路

[0004]本公开的实施例提出了用于处理信息的方法和装置。
[0005]第一方面,本公开的实施例提供了一种用于处理信息的方法,该方法包括:获取目标用户输入的语音信息;基于语音信息,对目标用户的用户意图进行识别;响应于未获得用于表征目标用户的用户意图的识别结果,获取与目标用户相关的辅助信息;基于语音信息和辅助信息,对目标用户的用户意图进行识别,生成用于表征目标用户的用户意图的候选识别结果;将所获得的候选识别结果呈现给目标用户;响应于检测到目标用户针对所呈现的候选识别结果的选定操作,执行目标用户选定的候选识别结果所对应的操作。
[0006]在一些实施例中,辅助信息包括以下至少一项:目标用户的用户属性信息;对目标用户所处的环境进行拍摄所获得的图像信息;目标用户输入的、用于表征目标用户的用户意图的文本信息。
[0007]在一些实施例中,在基于语音信息,对目标用户的用户意图进行识别之后,该方法还包括:响应于获得用于表征目标用户的用户意图的识别结果,执行所获得的识别结果所对应的操作。
[0008]在一些实施例中,基于语音信息和辅助信息,对目标用户的用户意图进行识别,生成用于表征目标用户的用户意图的候选识别结果包括:基于语音信息和辅助信息,对目标用户的用户意图进行识别,获得至少两个用于表征目标用户的用户意图的候选识别结果;以及将所获得的候选识别结果呈现给目标用户包括:将所获得的至少两个候选识别结果呈现给目标用户;以及响应于检测到目标用户针对所呈现的候选识别结果的选定操作,执行目标用户选定的候选识别结果所对应的操作包括:响应于检测到目标用户从至少两个候选识别结果中选定候选识别结果的操作,执行目标用户选定的候选识别结果所对应的操作。
[0009]在一些实施例中,基于语音信息和辅助信息,对目标用户的用户意图进行识别,生成用于表征目标用户的用户意图的候选识别结果包括:利用预先训练的语音识别模型对语音信息进行识别,获得语音特征;利用预先训练的辅助识别模型对辅助信息进行识别,获得辅助特征;将所获得的语音特征和辅助特征输入预先训练的意图识别模型,生成用于表征目标用户的用户意图的候选识别结果。
[0010]第二方面,本公开的实施例提供了一种用于处理信息的装置,该装置包括:第一获取单元,被配置成获取目标用户输入的语音信息;第一识别单元,被配置成基于语音信息,对目标用户的用户意图进行识别;第二获取单元,被配置成响应于未获得用于表征目标用户的用户意图的识别结果,获取与目标用户相关的辅助信息;第二识别单元,被配置成基于语音信息和辅助信息,对目标用户的用户意图进行识别,生成用于表征目标用户的用户意图的候选识别结果;呈现单元,被配置成将所获得的候选识别结果呈现给目标用户;执行单元,被配置成响应于检测到目标用户针对所呈现的候选识别结果的选定操作,执行目标用户选定的候选识别结果所对应的操作。
[0011]第三方面,本公开的实施例提供了一种用于处理信息的系统,该系统包括:信息采集模块、技能解析模块和引导推荐模块,其中:信息采集模块,被配置成获取目标用户输入的语音信息;以及获取与目标用户相关的辅助信息;技能解析模块,被配置成基于信息采集模块发送的语音信息,对目标用户的用户意图进行识别;以及响应于未获得用于表征目标用户的用户意图的识别结果,向信息采集模块发送指令,以控制信息采集模块将语音信息和辅助信息发送给引导推荐模块;引导推荐模块,被配置成基于接收到的语音信息和辅助信息,对目标用户的用户意图进行识别,生成用于表征目标用户的用户意图的候选识别结果;将所获得的候选识别结果呈现给目标用户;响应于检测到目标用户针对所呈现的候选识别结果的选定操作,执行目标用户选定的候选识别结果所对应的操作。
[0012]第四方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述用于处理信息的方法中任一实施例的方法。
[0013]第五方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现上述用于处理信息的方法中任一实施例的方法。
[0014]本公开的实施例提供的用于处理信息的方法和装置,通过获取目标用户输入的语音信息,而后基于语音信息,对目标用户的用户意图进行识别,接着响应于未获得用于表征目标用户的用户意图的识别结果,获取与目标用户相关的辅助信息,然后基于语音信息和辅助信息,对目标用户的用户意图进行识别,生成用于表征目标用户的用户意图的候选识别结果,接着,将所获得的候选识别结果呈现给目标用户,最后响应于检测到目标用户针对所呈现的候选识别结果的选定操作,执行目标用户选定的候选识别结果所对应的操作,从而可以在基于用户输入的语音信息无法识别出用户的意图时,基于用户的语音信息和辅助信息进行用户意图的识别,获得候选识别结果,并将候选识别结果呈现给目标用户,以此,可以引导用户选择符合其真实意图的候选识别结果,相较于现有技术中在无法通过语音信息识别用户的真实意图的情况下,重复要求用户输入语音信息的方案,可以提高用户体验,并且可以提高对话效率。
附图说明
[0015]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
[0016]图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
[0017]图2是根据本公开的用于处理信息的方法的一个实施例的流程图;
[0018]图3是根据本公开的实施例的用于处理信息的方法的一个应用场景的示意图;
[0019]图4是根据本公开的用于处理信息的方法的又一个实施例的流程图;
[0020]图5是根据本公开的用于处理信息的装置的一个实施例的结构示意图;
[0021]图6是根据本公开的用于处理信息的系统的一个实施例的时序图;
[0022]图7是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0023]下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。
[0024]需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于处理信息的方法,包括:获取目标用户输入的语音信息;基于所述语音信息,对所述目标用户的用户意图进行识别;响应于未获得用于表征所述目标用户的用户意图的识别结果,获取与所述目标用户相关的辅助信息;基于所述语音信息和所述辅助信息,对所述目标用户的用户意图进行识别,生成用于表征所述目标用户的用户意图的候选识别结果;将所获得的候选识别结果呈现给所述目标用户;响应于检测到所述目标用户针对所呈现的候选识别结果的选定操作,执行所述目标用户选定的候选识别结果所对应的操作。2.根据权利要求1所述的方法,其中,所述辅助信息包括以下至少一项:所述目标用户的用户属性信息;对所述目标用户所处的环境进行拍摄所获得的图像信息;所述目标用户输入的、用于表征所述目标用户的用户意图的文本信息。3.根据权利要求1所述的方法,其中,在所述基于所述语音信息,对所述目标用户的用户意图进行识别之后,所述方法还包括:响应于获得用于表征所述目标用户的用户意图的识别结果,执行所获得的识别结果所对应的操作。4.根据权利要求1所述的方法,其中,所述基于所述语音信息和所述辅助信息,对所述目标用户的用户意图进行识别,生成用于表征所述目标用户的用户意图的候选识别结果包括:基于所述语音信息和所述辅助信息,对所述目标用户的用户意图进行识别,获得至少两个用于表征所述目标用户的用户意图的候选识别结果;以及所述将所获得的候选识别结果呈现给所述目标用户包括:将所获得的至少两个候选识别结果呈现给所述目标用户;以及所述响应于检测到所述目标用户针对所呈现的候选识别结果的选定操作,执行所述目标用户选定的候选识别结果所对应的操作包括:响应于检测到所述目标用户从所述至少两个候选识别结果中选定候选识别结果的操作,执行所述目标用户选定的候选识别结果所对应的操作。5.根据权利要求1-4之一所述的方法,其中,所述基于所述语音信息和所述辅助信息,对所述目标用户的用户意图进行识别,生成用于表征所述目标用户的用户意图的候选识别结果包括:利用预先训练的语音识别模型对所述语音信息进行识别,获得语音特征;利用预先训练的辅助识别模型对所述辅...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1