一种基于马氏距离和对比学习的新意图数据识别方法技术

技术编号：33635760 阅读：34 留言：0更新日期：2022-06-02 01:47

本发明专利技术提供了一种基于马氏距离和对比学习的新意图数据识别方法，本发明专利技术在分类模型的训练过程中引入对比学习来获取更完整的样本特征，并基于样本的特征向量使用马氏距离来作为打分函数，来防止特征经过分类层之后有所损失，有助于模型提升识别新意图样本的能力。有助于模型提升识别新意图样本的能力。有助于模型提升识别新意图样本的能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于马氏距离和对比学习的新意图数据识别方法

[0001]本专利技术属于人工智能领域，尤其涉及一种基于马氏距离和对比学习的新意图数据识别方法。

技术介绍

[0002]随着人工智能技术的发展，任务型对话式智能助手产品开始涌现，如手机语音助手，电商智能客服，智能音箱等产品，极大方便了人们的生活。其中，意图识别(Intent Detection)是任务型对话系统的(Task
‑
Oriented Dialogue System)的重要模块之一，负责识别当前使用者的输入中包含的意图信息，并根据识别结果执行后续的动作。因此，意图识别的准确与否直接影响了后续步骤的执行情况和用户对系统的满意度。然而，在真实的应用场景中，用户的输入的表述可能会包含一些全新的意图，这些意图从未被系统所见过，超出了系统的识别能力，被称为新意图。正确识别新意图能够防止系统执行错误的操作并给出不相关回复，从而提高用户的使用体验。
[0003]目前主流的意图识别技术方案是将新意图识别任务转化为文本分类任务，首先利用已意图样本和对应的标签训练一个文本多分类模型，并将通过文本分类模型得到的置信度分数作为新意图识别任务的打分函数，如果样本置信度分数低于某个阈值，则会被视为新意图样本。
[0004]【专利一】CN111382270A基于文本分类器的意图识别方法、装置、设备及存储介质。
[0005]该专利技术使用文本分类模型进行意图分类，同时判断文本分类模型得到的置信度分数是否大于阈值来判断当前意图是否为新意图。
[0...

【技术保护点】

【技术特征摘要】
1.一种基于马氏距离和对比学习的新意图数据识别方法，其特征在于，包括以下步骤：、步骤1，输入训练集中的所有样本和标注的标签；步骤2，为训练集中的已知意图样本构建正样本和负样本，用于对比学习训练；步骤3，结合对比学习训练意图分类模型，通过分类模型来获取样本表示；步骤4，计算类别中心；步骤5，计算样本到类别中心的最小马氏距离，并判定是否为新意图样本。2.根据权利要求1所述的方法，其特征在于，步骤2包括：步骤2
‑
1，识别所有输入样本的槽位，获取样本拥有的槽位类型；步骤2
‑
2，将训练集中拥有相同槽位类型的样本进行两两配对，即样本x1＝T1(s1＝v1，s2＝v2)，样本x2＝T2(s1＝v3，s2＝v4)，其中，s
i
代表第i个槽位类型，v
i
代表第i个槽位值，T
i
代表第i个句子模版；步骤2
‑
3，为样本x1构造正样本为样本x2构造正样本为样本x1构造负样本为样本x2构造负样本3.根据权利要求2所述的方法，其特征在于，步骤3包括：步骤3
‑
1，输入原始训练集D＝{(x，y)}和对比学习训练集D
′
＝(x，x
+
，x
‑
)；步骤3
‑
2，意图识别模型进行前向计算；步骤3
‑
3，计算样本的预测概率分布与真实标签之间的交叉熵CE；步骤3
‑
4，计算损失函数值对于每个模型参数的梯度，使用反向传播算法更新模型参数；步骤3
‑
5，使用验证集评估模型性能；步骤3
‑
6，判断模型性能是否提升，如果有提升则返回步骤3
‑
2继续迭代训练，否则执行步骤3
‑
7；步骤3
‑
7，结束训练模型。4.根据权利要求3所述的方法，其特征在于，步骤3
‑
1包括：原始训练集D用于分类任务的训练，x＝{w1，w2，...，w
n
}为原始样本，包含了n个单词w1，w2，...，w
n
，y为对应的意图标签；对比学习训练集D
‘
用于对比学习的训练，x
+
，x
‑
分别为原始样本x对应的正、负样本；其中，意图样本标签进行独热编码，记为集合其中m为已知意图数目，y
i
表示第i个意图标签，中当前正样本对应意图标签的位置为1，其余位置值为0；输入的原始样本按照4∶1的比例划分为训练集和验证集，训练集输入模型用于训练。5.根据权利要求4所述的方法，其特征在于，步骤3
‑
2包括：获取单词w
i
的词嵌入e
i
，即样本x
′
＝{e1，e2，...，e
n
}；使用门控循环单元GRU(Gate Recurrent Unit)网络编码输入原始样本x
′
，即将每个词嵌入输入一个门控单元中，得到每个词的输出，为每个词状态的隐层表示，即{h1，h2，..，h
n
}＝GRU(e1，e2，...，e
n
)，其中h
i
表示第i个词e
i
的输出，GRU()代表将一系列词嵌入输入门控循环单元网络中，即
h
...

【专利技术属性】
技术研发人员：戴新宇，陈昱，欧阳亚文，吴震，王雷，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人