一种文本意图识别方法、装置及计算设备制造方法及图纸

技术编号：33536432 阅读：14 留言：0更新日期：2022-05-19 02:18

本发明专利技术公开了一种文本意图识别方法、装置及计算设备，方法包括：获取目标文本经词槽替换后的词向量表示，所述词槽替换是指将目标文件中的实体词替换为实体词槽；获取目标文本的字向量表示；对所述词向量表示和字向量表示进行拼接，得到目标文本的文本向量表示；将所述文本向量表示输入到预设的意图识别模型进行处理，得到目标文本的文本意图。得到目标文本的文本意图。得到目标文本的文本意图。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本意图识别方法、装置及计算设备

[0001]本专利技术涉及自然语言处理领域，具体涉及一种在人机对话中的文本意图识别方法、装置及计算设备。

技术介绍

[0002]近年来，随着人工智能技术的飞速发展，智能外呼电话机器人已经越来越多地应用在企业电话营销领域，例如对用户的购车意向线索清洗、理财产品营销等。其中，意图识别是电话机器人系统中最为核心的模块，旨在对电话机器人场景中用户的回答进行自动识别，精确理解用户的意图，为电话机器人后续的流程跳转提供指导。意图识别准确与否，影响整个电话机器人系统的用户体验，因此有着重要的研究价值。
[0003]意图识别本身是一个文本分类问题，常见的方法有基于逻辑回归、朴素贝叶斯等传统机器学习方法，以及近几年常用的基于深度学习的以卷积神经网络(Convolutional Neural Networks，CNN)、循环神经网络(Recurrent Neural Network，RNN)等为代表的文本分类方法。
[0004]然而这些方法依赖于文本训练数据，对新来的未在训练集样本里的语句预测准确率仍有一定的提升空间。例如，在电话机器人场景中，“那个宝马”在训练集语料里，属于“说具体车”意图，而“那个保时捷”未在训练集语料里，虽然“宝马”和“保时捷”都属于汽车品牌，而之前的意图识别方法未能利用到这一层信息，因此则很可能识别错误为“无意义表达”意图。
[0005]有鉴于此，如何提高电话机器人系统的意图识别的准确率，就成为亟待解决的技术问题。

技术实现思路

[00...

【技术保护点】

【技术特征摘要】
1.一种文本意图识别方法，在计算设备中执行，所述方法包括：获取目标文本经词槽替换后的词向量表示，所述词槽替换是指将目标文件中的实体词替换为实体词槽；获取目标文本的字向量表示；对所述词向量表示和字向量表示进行拼接，得到目标文本的文本向量表示；将所述文本向量表示输入到预设的意图识别模型进行处理，得到目标文本的文本意图。2.如权利要求1所述的方法，其中，所述获取目标文本经词槽替换后的词向量表示，包括：对目标文本进行实体识别，得到目标文件所包括的实体词及对应的实体词槽；对目标文件经分词处理，得到第一词序列；将第一词序列中的实体词替换为实体词槽，得到第二词序列；利用词嵌入模型对第二词序列进行编码，得到所述词向量表示。3.如权利要求2所述的方法，其中，在对第二词序列进行编码之前，还通过填充padding的方式将第二词序列转换为第一预定长度。4.如权利要求1所述的方法，其中，所述获取目标文本的字向量表示，包括：对目标文件进行分字处理，得到第一字序列；利用词嵌入模型对第一字序列进行编码，得到所述字向量表示。5.如权利要求4所述的方法，其中，在对第一字序列进行编码之前，还通过填充padd...

【专利技术属性】
技术研发人员：黄萧，李林，徐丞申，刘荣，
申请(专利权)人：天津车之家软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人