一种文本意图识别方法、装置及计算设备制造方法及图纸

技术编号:33536432 阅读:14 留言:0更新日期:2022-05-19 02:18
本发明专利技术公开了一种文本意图识别方法、装置及计算设备,方法包括:获取目标文本经词槽替换后的词向量表示,所述词槽替换是指将目标文件中的实体词替换为实体词槽;获取目标文本的字向量表示;对所述词向量表示和字向量表示进行拼接,得到目标文本的文本向量表示;将所述文本向量表示输入到预设的意图识别模型进行处理,得到目标文本的文本意图。得到目标文本的文本意图。得到目标文本的文本意图。

【技术实现步骤摘要】
一种文本意图识别方法、装置及计算设备


[0001]本专利技术涉及自然语言处理领域,具体涉及一种在人机对话中的文本意图识别方法、装置及计算设备。

技术介绍

[0002]近年来,随着人工智能技术的飞速发展,智能外呼电话机器人已经越来越多地应用在企业电话营销领域,例如对用户的购车意向线索清洗、理财产品营销等。其中,意图识别是电话机器人系统中最为核心的模块,旨在对电话机器人场景中用户的回答进行自动识别,精确理解用户的意图,为电话机器人后续的流程跳转提供指导。意图识别准确与否,影响整个电话机器人系统的用户体验,因此有着重要的研究价值。
[0003]意图识别本身是一个文本分类问题,常见的方法有基于逻辑回归、朴素贝叶斯等传统机器学习方法,以及近几年常用的基于深度学习的以卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent Neural Network,RNN)等为代表的文本分类方法。
[0004]然而这些方法依赖于文本训练数据,对新来的未在训练集样本里的语句预测准确率仍有一定的提升空间。例如,在电话机器人场景中,“那个宝马”在训练集语料里,属于“说具体车”意图,而“那个保时捷”未在训练集语料里,虽然“宝马”和“保时捷”都属于汽车品牌,而之前的意图识别方法未能利用到这一层信息,因此则很可能识别错误为“无意义表达”意图。
[0005]有鉴于此,如何提高电话机器人系统的意图识别的准确率,就成为亟待解决的技术问题。

技术实现思路

[0006]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的文本意图识别方法、装置及计算设备。
[0007]根据本专利技术的一个方面,提供一种文本意图识别方法,在计算设备中执行,所述方法包括:
[0008]获取目标文本经词槽替换后的词向量表示,所述词槽替换是指将目标文件中的实体词替换为实体词槽;
[0009]获取目标文本的字向量表示;
[0010]对所述词向量表示和字向量表示进行拼接,得到目标文本的文本向量表示;
[0011]将所述文本向量表示输入到预设的意图识别模型进行处理,得到目标文本的文本意图。
[0012]可选地,在根据本专利技术的文本意图识别方法中,所述获取目标文本经词槽替换后的词向量表示,包括:对目标文本进行实体识别,得到目标文件所包括的实体词及对应的实体词槽;对目标文件经分词处理,得到第一词序列;将第一词序列中的实体词替换为实体词
槽,得到第二词序列;利用词嵌入模型对第二词序列进行编码,得到所述词向量表示。
[0013]可选地,在根据本专利技术的文本意图识别方法中,在对第二词序列进行编码之前,还通过填充padding的方式将第二词序列转换为第一预定长度。
[0014]可选地,在根据本专利技术的文本意图识别方法中,所述获取目标文本的字向量表示,包括:对目标文件进行分字处理,得到第一字序列;利用词嵌入模型对第一字序列进行编码,得到所述字向量表示。
[0015]可选地,在根据本专利技术的文本意图识别方法中,在对第一字序列进行编码之前,还通过填充padding的方式将第一字序列转换为第二预定长度。
[0016]可选地,在根据本专利技术的文本意图识别方法中,所述意图识别模型包括TextCNN模型。
[0017]根据本专利技术的另一个方面,提供一种文本意图识别装置,驻留在计算设备中,所述装置包括:
[0018]词向量获取单元,适于获取目标文本经词槽替换后的词向量表示,所述词槽替换是指将目标文件中的实体词替换为实体词槽;
[0019]字向量获取单元,适于获取目标文本的字向量表示;
[0020]拼接单元,适于对所述词向量表示和字向量表示进行拼接,得到目标文本的文本向量表示;
[0021]意图识别单元,适于将所述文本向量表示输入到预设的意图识别模型进行处理,得到目标文本的文本意图。
[0022]根据本专利技术的又一个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行上述方法的指令。
[0023]根据本专利技术的又一个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行上述的方法。
[0024]本专利技术实例给出了一种融合原始文本信息和实体词槽信息的文本意图识别方法,通过词槽替换融合了文本中的实体信息,考虑了原始文本的字符特征以及词特征,从而有效提升意图识别的准确率。
[0025]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0026]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0027]图1示出了根据本专利技术一个实施例的人机对话系统100的示意图;
[0028]图2示出了根据本专利技术一个实施例的计算设备200的示意图;
[0029]图3示出了根据本专利技术一个实施例的文本意图识别方法300的流程图;
[0030]图4示出了根据本专利技术一个实施例的文本意图识别装置400的示意图。
具体实施方式
[0031]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0032]首先对本专利技术实施例中涉及的术语解释如下。
[0033]意图:在人机对话过程中,用户一次话语的目的,即用户希望在对话场景中获取到的信息是什么,例如用户对人工智能助手说,“帮我定个闹钟”,用户的意图就是“定闹钟”。准确理解用户意图是人机对话顺畅进行的基本要求。在本专利技术实施例中,是根据用户语句(文本)进行意图识别,因此,识别出的意图也称为文本意图。
[0034]词槽:人机对话系统中预先定义的对话服务所需要的要素。例如定闹钟这个对话服务,需要闹钟时间、是否重复等词槽。在本专利技术实施例中,通过对用户语句(文本)进行实体识别,获取语句中包括的实体词,以及,实体词对应的实体类型,这里的实体类型就是词槽,又称为实体词槽。例如,“那个保时捷”中“保时捷”就是一个实体词,其对应的实体类型为“品牌”,则实体词槽即为“品牌”。
[0035]如前所述,现有技术的文本意图识别方法依赖于文本训练数据,对新来的未在训练集样本里的语句预测准确率仍有一定的提升空间。为此,在本专利技术的一个实施例中,将实体识别引入意图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本意图识别方法,在计算设备中执行,所述方法包括:获取目标文本经词槽替换后的词向量表示,所述词槽替换是指将目标文件中的实体词替换为实体词槽;获取目标文本的字向量表示;对所述词向量表示和字向量表示进行拼接,得到目标文本的文本向量表示;将所述文本向量表示输入到预设的意图识别模型进行处理,得到目标文本的文本意图。2.如权利要求1所述的方法,其中,所述获取目标文本经词槽替换后的词向量表示,包括:对目标文本进行实体识别,得到目标文件所包括的实体词及对应的实体词槽;对目标文件经分词处理,得到第一词序列;将第一词序列中的实体词替换为实体词槽,得到第二词序列;利用词嵌入模型对第二词序列进行编码,得到所述词向量表示。3.如权利要求2所述的方法,其中,在对第二词序列进行编码之前,还通过填充padding的方式将第二词序列转换为第一预定长度。4.如权利要求1所述的方法,其中,所述获取目标文本的字向量表示,包括:对目标文件进行分字处理,得到第一字序列;利用词嵌入模型对第一字序列进行编码,得到所述字向量表示。5.如权利要求4所述的方法,其中,在对第一字序列进行编码之前,还通过填充padd...

【专利技术属性】
技术研发人员:黄萧李林徐丞申刘荣
申请(专利权)人:天津车之家软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1