本发明专利技术公开了一种意图识别方法及装置,所述方法包括:获取待进行意图识别的目标语句;对所述目标语句进行处理,得到所述目标语句的关键要素;将所述目标语句的每种关键要素分别与预先构建的各个意图的关键要素参数集进行匹配,得到意图识别结果。上述方法能够保证聊天机器人及时适应业务需要。
Intention recognition method and device
【技术实现步骤摘要】
意图识别方法及装置
本专利技术涉及智能聊天机器人领域,更具体的说,是涉及一种意图识别方法及装置。
技术介绍
近几年来,智能聊天机器人技术发展迅速,在各领域得到普遍应用。在人机会话过程中,聊天机器人需要准确把握对话过程中的用户意图,即对于用户输入的一句话,聊天机器人应通过意图识别技术确定用户期望完成的任务是什么,再进行后续的任务槽值提取等工作,最终完成用户交付的任务。可见意图识别决定了聊天机器人能否智能、准确地与用户进行交互,是智能聊天机器人领域的重要技术。由于业务的多样性与快速发展,为了保证聊天机器人及时适应业务需要,需要对现有的意图识别方法进行优化。
技术实现思路
有鉴于此,本专利技术提供了一种意图识别方法及装置,以保证聊天机器人及时适应业务需要。为实现上述目的,本专利技术提供如下技术方案:一种意图识别方法,所述方法包括:获取待进行意图识别的目标语句;对所述目标语句进行处理,得到所述目标语句的关键要素;将所述目标语句的每种关键要素分别与预先构建的各个意图的关键要素参数集进行匹配,得到意图识别结果。可选地,所述对所述目标语句进行处理,得到所述目标语句的关键要素,包括:对所述目标语句进行分词和词性标注,得到分词结果以及词性标注结果;对所述目标语句进行依存句法分析,得到依存句法分析结果;根据所述词性标注结果以及所述依存句法分析结果从所述目标语句中提取关键要素。可选地,所述每个意图的关键要素参数集是采用如下方式构建的:获取所述每个意图对应的语料;对所述每个语料进行分词和词性标注,得到分词结果以及词性标注结果;对所述每个语料进行依存句法分析,得到依存句法分析结果;根据所述词性标注结果以及所述依存句法分析结果从所述每个语料中提取所述每个语料的关键要素;根据所述每个语料的原始关键要素得到所述每个意图的原始关键要素参数集;对所述每个意图的原始关键要素参数集进行相似词扩展,得到所述每个意图的关键要素参数集。可选地,所述根据所述词性标注结果以及所述依存句法分析结果从所述每个语料中提取所述每个语料的关键要素,包括:对名词、动词、实体词三种词性,以及核心关系、主谓关系、动宾关系、定中关系四种依存句法关系从所述每个语料中提取核心名词、主语名词、主语修饰词、宾语名词、宾语修饰词、无主语动词、主语动词、核心实体、修饰实体九种关键要素。可选地,所述根据所述每个语料的关键要素得到所述每个意图的原始关键要素参数集,包括:将所述每个意图对应的各个语料的关键要素按照类型组合为核心名词子集、主语名词子集、主语修饰词子集、宾语名词子集、宾语修饰词子集、无主语动词子集、主语动词子集、核心实体子集、修饰实体子集九种原始关键要素子集,所述每个意图的原始关键要素参数集中包括所述九种原始关键要素子集。可选地,对所述每个意图的原始关键要素参数集进行相似词扩展,包括:获取预设词典;计算所述每个意图的原始关键要素参数集中的目标原始关键要素子集中的每个原始关键要素与所述预设词典中的各个词的相似度;确定所述预设词典中相似度大于预设相似度阈值的词为所述原始关键要素的同义词;将所述同义词添加至所述目标原始关键要素子集中。可选地,所述根据所述词性标注结果以及所述依存句法分析结果从所述目标语句中提取关键要素,包括:对名词、动词、实体词三种词性,以及核心关系、主谓关系、动宾关系、定中关系四种依存句法关系从所述目标语句中提取核心名词、主语名词、主语修饰词、宾语名词、宾语修饰词、无主语动词、主语动词、核心实体、修饰实体九种关键要素。可选地,所述将所述目标语句的每种关键要素分别与预先构建的各个意图的关键要素参数集进行匹配,得到意图识别结果,包括:将所述目标语句的每种关键要素分别与预先构建的各个意图识别关键要素参数集进行匹配,得到所述每种关键要素命中的意图集合;确定所述每种关键要素命中的意图集合的交集为所述意图识别结果。一种意图识别装置,所述装置包括:目标语句获取单元,用于获取待进行意图识别的目标语句;处理单元,用于对所述目标语句进行处理,得到所述目标语句的关键要素;匹配单元,用于将所述目标语句的每种关键要素分别与预先构建的各个意图的关键要素参数集进行匹配,得到意图识别结果。可选地,所述处理单元,包括:分词和词性标注单元,用于对所述目标语句进行分词和词性标注,得到分词结果以及词性标注结果;依存句法分析单元,用于对所述目标语句进行依存句法分析,得到依存句法分析结果;关键要素提取单元,用于根据所述词性标注结果以及所述依存句法分析结果从所述目标语句中提取关键要素。经由上述的技术方案可知,与现有技术相比,本专利技术公开了一种意图识别方法及装置,所述方法包括:获取待进行意图识别的目标语句;对所述目标语句进行处理,得到所述目标语句的关键要素;将所述目标语句的每种关键要素分别与预先构建的各个意图的关键要素参数集进行匹配,得到意图识别结果。上述方法能够保证聊天机器人及时适应业务需要。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例公开的一种意图识别方法的流程示意图;图2为本专利技术公开的一种构建每个意图的关键要素参数集的方法的流程示意图;图3为本专利技术公开的一种对所述目标语句进行处理,得到所述目标语句的关键要素的方法的流程示意图;图4为本专利技术实施例提供的一种意图识别装置的结构示意图。具体实施方式为了引用和清楚起见,下文中使用的技术名词的说明、简写或缩写总结如下:意图识别:识别出一句话中的意图,如“查天气”、“查邮编”等。依存句法分析:分析句子汇总各个词语之间的依存关系,也即指出词语之间在句法上的搭配关系。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本专利技术的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备本文档来自技高网...
【技术保护点】
1.一种意图识别方法,其特征在于,所述方法包括:/n获取待进行意图识别的目标语句;/n对所述目标语句进行处理,得到所述目标语句的关键要素;/n将所述目标语句的每种关键要素分别与预先构建的各个意图的关键要素参数集进行匹配,得到意图识别结果。/n
【技术特征摘要】
1.一种意图识别方法,其特征在于,所述方法包括:
获取待进行意图识别的目标语句;
对所述目标语句进行处理,得到所述目标语句的关键要素;
将所述目标语句的每种关键要素分别与预先构建的各个意图的关键要素参数集进行匹配,得到意图识别结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标语句进行处理,得到所述目标语句的关键要素,包括:
对所述目标语句进行分词和词性标注,得到分词结果以及词性标注结果;
对所述目标语句进行依存句法分析,得到依存句法分析结果;
根据所述词性标注结果以及所述依存句法分析结果从所述目标语句中提取关键要素。
3.根据权利要求1所述的方法,其特征在于,所述每个意图的关键要素参数集是采用如下方式构建的:
获取所述每个意图对应的语料;
对所述每个语料进行分词和词性标注,得到分词结果以及词性标注结果;
对所述每个语料进行依存句法分析,得到依存句法分析结果;
根据所述词性标注结果以及所述依存句法分析结果从所述每个语料中提取所述每个语料的关键要素;
根据所述每个语料的原始关键要素得到所述每个意图的原始关键要素参数集;
对所述每个意图的原始关键要素参数集进行相似词扩展,得到所述每个意图的关键要素参数集。
4.根据权利要求3所述的方法,其特征在于,所述根据所述词性标注结果以及所述依存句法分析结果从所述每个语料中提取所述每个语料的关键要素,包括:
对名词、动词、实体词三种词性,以及核心关系、主谓关系、动宾关系、定中关系四种依存句法关系从所述每个语料中提取核心名词、主语名词、主语修饰词、宾语名词、宾语修饰词、无主语动词、主语动词、核心实体、修饰实体九种关键要素。
5.根据权利要求4所述的方法,其特征在于,所述根据所述每个语料的关键要素得到所述每个意图的原始关键要素参数集,包括:
将所述每个意图对应的各个语料的关键要素按照类型组合为核心名词子集、主语名词子集、主语修饰词子集、宾语名词子集、宾语修饰词子集、无主语动词子集、主语动词子集、核心实体子集、修饰实体子集九种原始关键要素子集,所述每个...
【专利技术属性】
技术研发人员:陈甜甜,井玉欣,周学阳,崔妲珅,宋忠森,
申请(专利权)人:普信恒业科技发展北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。