信息处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:23983680 阅读:26 留言:0更新日期:2020-04-29 12:30
本申请公开了一种信息处理方法、装置、电子设备及存储介质,通过对获得的目标文本进行标签元拆分,得到标签元;然后通过预创建的意图数据库对标签元进行意图标签匹配,得到第一意图标签;基于意图标签确定与目标文本匹配的意图标签。相比于现有技术对目标文本直接进行意图识别,通过在意图识别过程中增加了标签元的拆分过程,实现了利用标签元匹配意图标签,作为分析输入的目标文本的意图的判断基础,可以解决复杂文本标签意图分类的局限性和意图分析不准确的问题。

Information processing methods, devices, electronic equipment and storage media

【技术实现步骤摘要】
信息处理方法、装置、电子设备及存储介质
本申请涉及信息处理
,更具体的说是涉及一种信息处理方法、装置及电子设备。
技术介绍
智能客服系统是在大规模知识处理基础上发展起来的一种面向行业应用的自动服务系统,其为用户与服务提供方之间的沟通建立了一种基于自然语言处理的智能的沟通途径。在智能客服系统中,通常是采用自然语言理解技术基于用户单个轮次或者多个轮次的输入文本将用户问题映射到已定义的意图上。但是目前智能系统在解决输入的文本为复杂标签时,存在一定的局限性。例如,“我更新了我的手机系统”或者“我无法更新手机系统”在现有的智能客服系统中利用分类模型往往会错分,最终导致得到的用户意图分析不准确。
技术实现思路
有鉴于此,本申请提供如下技术方案:一种信息处理方法,包括:获取目标文本;对所述目标文本进行标签元拆分,得到标签元,所述标签元表征具有特定语义的关键词;利用所述标签元,在意图数据库中进行查询,得到与所述标签元相匹配的第一意图标签,所述意图数据库中包括标签元集合和意图标签集合,且所述标签元集合与所述意图标签集合存在预设映射关系;基于所述第一意图标签,确定与所述目标文本相匹配的意图标签。可选地,所述方法还包括:将标签元输入预构建的第一识别模型,通过所述第一识别模型确定所述标签元对应的预测的意图标签,其中,所述第一识别模型具有将所述标签元对应的意图标签趋于所述标签元对应的实际的意图标签的能力;根据所述标签元以及与所述标签元相匹配的意图标签,创建意图数据库。可选地,所述方法还包括:获得样本信息,所述样本信息包括标签元和意图标签;将获得的各个样本信息分别作为神经网络的训练输入,训练得到第一识别模型。可选地,所述基于所述第一意图标签,确定与所述目标文本相匹配的意图标签,包括:对所述目标文本进行意图识别,得到第二意图标签;将所述第一意图标签与所述第二意图标签进行融合处理,得到所述目标文本的意图标签。可选地,所述对所述目标文本进行意图识别,得到第二意图标签,包括:将所述目标文本输入预构建的第二识别模型,通过所述第二识别模型确定所述目标文本对应的预测的第二意图标签;其中,所述第二识别模型具有将所述目标文本对应的第二意图标签趋于所述目标文本对应的实际的意图标签的能力;且所述第二识别模型为将获得的各个样本信息分别作为神经网络的训练输入,训练得到的模型,所述样本信息为所述目标文本信息相匹配的信息。可选地,所述对所述目标文本进行标签元拆分,得到标签元,包括:对所述目标文本进行特征提取,依据提取到的特征确定标签元。可选地,所述对所述目标文本进行标签元拆分,得到标签元,包括:利用预创建的分类模型,对所述目标文本进行分类,得到标签元;所述预创建的分类模型表征判断所述目标文本中是否包含特定标签元的模型。一种信息处理装置,包括:获取单元,用于获取目标文本;拆分单元,用于对所述目标文本进行标签元拆分,得到标签元,所述标签元表征具有特定语义的关键词;查询单元,用于利用所述标签元,在意图数据库中进行查询,得到与所述标签元相匹配的第一意图标签,所述意图数据库中包括标签元集合和意图标签集合,且所述标签元集合与所述意图标签集合存在预设映射关系;确定单元,用于基于所述第一意图标签,确定与所述目标文本相匹配的意图标签。一种电子设备,包括:存储器,用于存储程序;处理器,用于执行所述程序,所述程序具体用于:获取目标文本;对所述目标文本进行标签元拆分,得到标签元,所述标签元表征具有特定语义的关键词;利用所述标签元,在意图数据库中进行查询,得到与所述标签元相匹配的第一意图标签,所述意图数据库中包括标签元集合和意图标签集合,且所述标签元集合与所述意图标签集合存在预设映射关系;基于所述第一意图标签,确定与所述目标文本相匹配的意图标签。一种存储介质,其特征在于,所述存储介质存储有计算机程序代码,所述计算机程序代码执行时实现如上任意一项所述的信息处理方法。经由上述的技术方案可知,本申请公开了一种信息处理方法、装置、电子设备及存储介质,通过对获得的目标文本进行标签元拆分,得到标签元;然后通过预创建的意图数据库对标签元进行意图标签匹配,得到第一意图标签;基于意图标签确定与目标文本匹配的意图标签。相比于现有技术对目标文本直接进行意图识别,通过在意图识别过程中增加了标签元的拆分过程,实现了利用标签元匹配意图标签,作为分析输入的目标文本的意图的判断基础,可以解决复杂文本标签意图分类的局限性和意图分析不准确的问题。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1示出了本申请实施例提供的一种信息处理系统的场景示意图;图2示出了本申请实施例提供的一种信息处理方法的流程示意图;图3示出了本申请实施例提供的一种构建意图数据库的场景示意图;图4示出了本申请实施例提供的一种确定目标文本意图标签的方法的流程示意图;图5示出了本申请实施例提供的一种目标文本拆分结构的示意图;图6示出了本申请实施例提供的一种信息处理装置的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在本申请各个实施例中加载的信息处理方法,可以应用在对待分析文本进行意图分析的场景中,如,在智能客服、语音助手、问答系统或者智能机器人等对应的应用系统或者实体装置的控制架构中。本申请实施例提供的信息处理系统可以对参见图1,其示出了本申请实施例提供的一种信息处理系统的场景示意图。信息处理系统100包括服务器110、网络120和终端130。服务器110可以处理与终端120有关的数据/和信息以执行一个或多个本申请实施例中描述的功能。在一些实施例中,服务器110可以包括一个或以上处理器,以处理相关数据和/或信息。在一些实施例中,服务器110可以获取终端130发送的目标文本,实现对目标文本对应的标签元拆分、意图识别的处理,从而生成与目标文本相匹配的意图标签。对应的,服务器110还可以获取终端130的权限信息,对终端130进行鉴权处理。在一些实施例中,服务器可以是一个单个的服务器或者一个服务器群组,其中服务器群组可以是集中式的或分布式的。在一些实施例中,服务器110可以是本地的或远程的。在一些实施例中,服务器110可以在一个云平台上实现,如,云本文档来自技高网...

【技术保护点】
1.一种信息处理方法,包括:/n获取目标文本;/n对所述目标文本进行标签元拆分,得到标签元,所述标签元表征具有特定语义的关键词;/n利用所述标签元,在意图数据库中进行查询,得到与所述标签元相匹配的第一意图标签,所述意图数据库中包括标签元集合和意图标签集合,且所述标签元集合与所述意图标签集合存在预设映射关系;/n基于所述第一意图标签,确定与所述目标文本相匹配的意图标签。/n

【技术特征摘要】
1.一种信息处理方法,包括:
获取目标文本;
对所述目标文本进行标签元拆分,得到标签元,所述标签元表征具有特定语义的关键词;
利用所述标签元,在意图数据库中进行查询,得到与所述标签元相匹配的第一意图标签,所述意图数据库中包括标签元集合和意图标签集合,且所述标签元集合与所述意图标签集合存在预设映射关系;
基于所述第一意图标签,确定与所述目标文本相匹配的意图标签。


2.根据权利要求1所述的方法,所述方法还包括:
将标签元输入预构建的第一识别模型,通过所述第一识别模型确定所述标签元对应的预测的意图标签,其中,所述第一识别模型具有将所述标签元对应的意图标签趋于所述标签元对应的实际的意图标签的能力;
根据所述标签元以及与所述标签元相匹配的意图标签,创建意图数据库。


3.根据权利要求2所述的方法,所述方法还包括:
获得样本信息,所述样本信息包括标签元和意图标签;
将获得的各个样本信息分别作为神经网络的训练输入,训练得到第一识别模型。


4.根据权利要求1所述的方法,所述基于所述第一意图标签,确定与所述目标文本相匹配的意图标签,包括:
对所述目标文本进行意图识别,得到第二意图标签;
将所述第一意图标签与所述第二意图标签进行融合处理,得到所述目标文本的意图标签。


5.根据权利要求4所述的方法,所述对所述目标文本进行意图识别,得到第二意图标签,包括:
将所述目标文本输入预构建的第二识别模型,通过所述第二识别模型确定所述目标文本对应的预测的第二意图标签;
其中,所述第二识别模型具有将所述目标文本对应的第二意图标签趋于所述目标文本对应的实际的意图标签的能力;且所述第二识别模型为将获得的各个样本信息分别作为神经网络的训练输入,训...

【专利技术属性】
技术研发人员:杨双涛
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1