本申请提供一种意图识别模型训练方法、意图识别方法、装置及设备,涉及自然语言处理技术领域。该方法包括:根据意图识别模型所应用的第一领域,获取第一训练语料,该第一训练语料包括该第一领域的标注的语料;使用该第一训练语料,训练得到第一训练模型;根据该意图识别模型所应用的第二领域,获取第二训练语料,该第二领域为该第一领域内的子领域,该第二训练语料包括该第二领域的标注的语料;使用该第二训练语料训练该第一训练模型,得到第二训练模型;获取第三训练语料,该第三训练语料为该第二领域内标注有意图信息的语料;使用该第三训练语料训练该第二训练模型,得到该意图识别模型。应用本申请实施例,可以提高意图识别的准确率。准确率。准确率。
【技术实现步骤摘要】
意图识别模型训练方法、意图识别方法、装置及设备
[0001]本申请涉及自然语言处理
,具体而言,涉及一种意图识别模型训练方法、意图识别方法、装置及设备。
技术介绍
[0002]随着网络技术的发展,人工智能中的自然语言处理技术在对话机器人中得到了广泛的应用,无论是封闭性的对话方式还是开放性的对话方式,意图识别的准确与否都直接关系到对话机器人的质量。
[0003]由于技术瓶颈的限制,目前对话机器人的对话质量仍是一个技术难点,为了将对话机器人做到成熟化、产品化,前提是对话机器人对于对话的意图识别需要足够准确,因此,如何进行准确的意图识别,是亟待解决的问题。
技术实现思路
[0004]本申请的目的在于,针对上述现有技术中的不足,提供一种意图识别模型训练方法、意图识别方法、装置及设备,可以提高对话机器人的意图识别准确率。
[0005]为实现上述目的,本申请实施例采用的技术方案如下:
[0006]第一方面,本申请实施例提供了一种意图识别模型训练方法,所述方法包括:
[0007]根据意图识别模型所应用的第一领域,获取第一训练语料,所述第一训练语料包括所述第一领域的标注的语料;
[0008]使用所述第一训练语料,训练得到第一训练模型;
[0009]根据所述意图识别模型所应用的第二领域,获取第二训练语料,所述第二领域为所述第一领域的子领域,所述第二训练语料包括所述第二领域的标注的语料;
[0010]使用所述第二训练语料训练所述第一训练模型,得到第二训练模型;
[0011]获取第三训练语料,所述第三训练语料为所述第二领域内标注有意图信息的语料;
[0012]使用所述第三训练语料训练所述第二训练模型,得到所述意图识别模型。
[0013]可选地,所述第三训练语料包括:训练语句、所述训练语句的关键词以及所述训练语句的意图信息。
[0014]可选地,所述第二训练语料包括表征所述第二领域的结构信息以及知识信息。
[0015]可选地,所述使用所述第一训练语料,训练得到第一训练模型之前,包括:
[0016]将数据符号为半角的第一训练语料转换为数据符号为全角的第一训练语料。
[0017]可选地,所述根据意图识别模型所应用的第二领域,获取第二训练语料,包括:
[0018]根据所述意图识别模型所应用的第二领域以及所述第一训练语料,获取所述第二训练语料。
[0019]可选地,所述根据所述意图识别模型所应用的第二领域以及所述第一训练语料,获取所述第二训练语料,包括:
[0020]根据所述第二领域的数据结构,从所述第一训练语料中筛选出符合所述数据结构的所述第二训练语料。
[0021]可选地,所述获取第三训练语料,包括:
[0022]从预设的关键词库中提取与所述训练语句匹配的关键词,得到所述训练语句的关键词;
[0023]对所述训练语句进行意图标注,得到所述训练语句的意图信息;
[0024]将所述训练语句、所述训练语句的关键词以及所述训练语句的意图信息作为所述第三训练语料。
[0025]第二方面,本申请实施例提供了一种意图识别方法,所述方法包括:
[0026]获取待识别的文本数据;
[0027]将所述文本数据输入意图识别模型,得到所述文本数据对应的意图信息,所述意图识别模型基于所述意图识别模型所应用的第一领域的第一训练语料、第二领域的第二训练语料以及第三训练语料得到,所述第二领域为所述第一领域的子领域,所述第一训练语料包括所述第一领域的标注的语料,所述第一训练语料用于训练得到第一训练模型,所述第二训练语料包括所述第二领域的标注的语料,所述第二训练语料用于对所述第一训练模型进行训练并得到第二训练模型,所述第三训练语料为所述第二领域内标注有意图信息的语料,所述第三训练语料用于对所述第二训练模型进行训练并得到所述意图识别模型。
[0028]第三方面,本申请实施例提供了一种意图识别模型训练装置,所述装置包括:
[0029]第一获取模块,用于根据意图识别模型所应用的第一领域,获取第一训练语料,所述第一训练语料包括所述第一领域的标注的语料;
[0030]第一训练模块,用于使用所述第一训练语料,训练得到第一训练模型;
[0031]第二获取模块,用于根据所述意图识别模型所应用的第二领域,获取第二训练语料,所述第二领域为所述第一领域内的子领域,所述第二训练语料包括所述第二领域的标注的语料;
[0032]第二训练模块,用于使用所述第二训练语料训练所述第一训练模型,得到第二训练模型;
[0033]第三获取模块,用于获取第三训练语料,所述第三训练语料为所述第二领域内标注有意图信息的语料;
[0034]第三训练模块,用于使用所述第三训练语料训练所述第二训练模型,得到所述意图识别模型。
[0035]可选地,所述第三训练语料包括:训练语句、所述训练语句的关键词以及所述训练语句的意图信息。
[0036]可选地,所述第二训练语料包括表征所述第二领域的结构信息以及知识信息。
[0037]可选地,所述装置还包括:
[0038]转换模块,用于将数据符号为半角的第一训练语料转换为数据符号为全角的第一训练语料。
[0039]可选地,所述第二获取模块,具体用于根据所述意图识别模型所应用的第二领域以及所述第一训练语料,获取所述第二训练语料。
[0040]可选地,所述第二获取模块,还具体用于根据所述第二领域的数据结构,从所述第
一训练语料中筛选出符合所述数据结构的所述第二训练语料。
[0041]可选地,所述第三获取模块,具体用于从预设的关键词库中提取与所述训练语句匹配的关键词,得到所述训练语句的关键词;对所述训练语句进行意图标注,得到所述训练语句的意图信息;将所述训练语句、所述训练语句的关键词以及所述训练语句的意图信息作为所述第三训练语料。
[0042]第四方面,本申请实施例提供了一种意图识别装置,所述装置包括:
[0043]第四获取模块,用于获取待识别的文本数据;
[0044]输入模块,用于将所述文本数据输入意图识别模型,得到所述文本数据对应的意图信息,所述意图识别模型基于所述意图识别模型所应用的第一领域的第一训练语料、第二领域的第二训练语料以及第三训练语料得到,所述第二领域为所述第一领域的子领域,所述第一训练语料包括所述第一领域的标注的语料,所述第一训练语料用于训练得到第一训练模型,所述第二训练语料包括所述第二领域的标注的语料,所述第二训练语料用于对所述第一训练模型进行训练并得到第二训练模型,所述第三训练语料为所述第二领域内标注有意图信息的语料,所述第三训练语料用于对所述第二训练模型进行训练并得到所述意图识别模型。
[0045]第五方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种意图识别模型训练方法,其特征在于,所述方法包括:根据意图识别模型所应用的第一领域,获取第一训练语料,所述第一训练语料包括所述第一领域的标注的语料;使用所述第一训练语料,训练得到第一训练模型;根据所述意图识别模型所应用的第二领域,获取第二训练语料,所述第二领域为所述第一领域内的子领域,所述第二训练语料包括所述第二领域的标注的语料;使用所述第二训练语料训练所述第一训练模型,得到第二训练模型;获取第三训练语料,所述第三训练语料为所述第二领域内标注有意图信息的语料;使用所述第三训练语料训练所述第二训练模型,得到所述意图识别模型。2.根据权利要求1所述的方法,其特征在于,所述第三训练语料包括:训练语句、所述训练语句的关键词以及所述训练语句的意图信息。3.根据权利要求1所述的方法,其特征在于,所述第二训练语料包括表征所述第二领域的结构信息以及知识信息。4.根据权利要求1-3任一项所述的方法,其特征在于,所述使用所述第一训练语料,训练得到第一训练模型之前,包括:将数据符号为半角的第一训练语料转换为数据符号为全角的第一训练语料。5.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述意图识别模型所应用的第二领域,获取第二训练语料,包括:根据所述意图识别模型所应用的第二领域以及所述第一训练语料,获取所述第二训练语料。6.根据权利要求5所述的方法,其特征在于,所述根据所述意图识别模型所应用的第二领域以及所述第一训练语料,获取所述第二训练语料,包括:根据所述第二领域的数据结构,从所述第一训练语料中筛选出符合所述数据结构的所述第二训练语料。7.根据权利要求2所述的方法,其特征在于,所述获取第三训练语料,包括:从预设的关键词库中提取与所述训练语句匹配的关键词,得到所述训练语句的关键词;对所述训练语句进行意图标注,得到所述训练语句的意图信息;将所述训练语句、所述训练语句的关键词以及所述训练语句的...
【专利技术属性】
技术研发人员:蔡岩松,杜新凯,牛国扬,王彦昕,刘谦,高峰,
申请(专利权)人:阳光保险集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。