一种投诉预警识别方法及相关设备技术

技术编号:36290106 阅读:15 留言:0更新日期:2023-01-13 10:02
本申请实施例公开了一种投诉预警识别方法及相关设备。该方法包括:获取训练集,训练集包括文本训练集和音频训练集;对训练集进行数据处理,得到文本编码矩阵和音频编码矩阵;将文本训练集输入文本先验知识推理模型,得到文本权重矩阵,将音频训练集输入音频先验知识推理模型,得到音频权重矩阵;将文本权重矩阵分别与文本编码矩阵、音频编码矩阵进行交互处理,将音频权重矩阵分别与文本编码矩阵、音频编码矩阵进行交互处理,得到四个信息交互矩阵;根据四个信息交互矩阵确定投诉预警识别结果。采用本申请实施例,实现在融合先验知识的多模态信息交互情况下,进行多任务小样本的投诉预警模型训练,提高识别准确率,降低模型复杂度和人力标注成本。杂度和人力标注成本。杂度和人力标注成本。

【技术实现步骤摘要】
一种投诉预警识别方法及相关设备


[0001]本专利技术涉及计算机领域,尤其涉及一种投诉预警识别方法及相关设备。

技术介绍

[0002]随着计算机技术的快速发展,许多企业采用投诉倾向识别算法对客户的通话录音进行投诉预警识别,其中,投诉倾向识别算法包括单模态投诉倾向识别方法和多模态投诉倾向识别方法两种。然而,单模态投诉倾向识别方法采用单一的文本或音频特征信息建模,信息利用率低,导致识别准确率不高,多模态投诉倾向识别方法有结合文本与音频特征信息学习的优势,但模型复杂度高,需要大量的训练样本,使得人力标注成本增加。

技术实现思路

[0003]本申请实施例提供一种投诉预警识别方法及相关设备,实现在融合先验知识的多模态信息交互情况下,进行多任务小样本的投诉预警模型训练,可以提高投诉预警识别的准确率,降低模型复杂度和人力标注成本。
[0004]第一方面,本申请实施例提供了一种投诉预警识别方法,包括:获取训练集,所述训练集包括文本训练集和所述文本训练集对应的音频训练集;对所述训练集进行数据处理,得到文本编码矩阵和音频编码矩阵;将所述文本训练集输入所述文本先验知识推理模型进行模型推理,得到文本权重矩阵,将所述音频训练集输入所述音频先验知识推理模型进行模型推理,得到音频权重矩阵;将所述文本权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,将所述音频权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,得到第一信息交互矩阵、第二信息交互矩阵、第三信息交互矩阵和第四信息交互矩阵;根据所述第一信息交互矩阵、所述第二信息交互矩阵、所述第三信息交互矩阵和所述第四信息交互矩阵,确定投诉预警识别结果。利用文本和音频的特征信息进行投诉预警模型的多任务学习,在外部先验知识的基础上获得两个模态信息的交互,使得模型在少量样本上也能充分利用输入信息,进行多任务训练,可以提高投诉预警识别的准确率,降低模型复杂度和人力标注成本。
[0005]在一种可能的设计中,将所述文本权重矩阵和所述文本编码矩阵对位相乘,得到所述第一信息交互矩阵,将所述文本权重矩阵和所述音频编码矩阵对位相乘,得到所述第二信息交互矩阵,将所述音频权重矩阵和所述文本编码矩阵对位相乘,得到所述第三信息交互矩阵,将所述音频权重矩阵和所述音频编码矩阵对位相乘,得到所述第四信息交互矩阵。信息交互有利于音频侧利用文本侧的特征信息,以及文本侧可以学习音频侧的特征信息,在不增加模型参数的情况下,小样本训练集也能让模型获取尽量多的信息,有利于小样本学习。
[0006]在另一种可能的设计中,将所述文本权重矩阵和所述文本编码矩阵相加,得到所述第一信息交互矩阵,将所述文本权重矩阵和所述音频编码矩阵相加,得到所述第二信息交互矩阵,将所述音频权重矩阵和所述文本编码矩阵相加,得到所述第三信息交互矩阵,将
所述音频权重矩阵和所述音频编码矩阵相加,得到所述第四信息交互矩阵。信息交互有利于音频侧利用文本侧的特征信息,以及文本侧可以学习音频侧的特征信息,在不增加模型参数的情况下,小样本训练集也能让模型获取尽量多的信息,有利于小样本学习。
[0007]在另一种可能的设计中,将所述第一信息交互矩阵、所述第二信息交互矩阵、所述第三信息交互矩阵和所述第四信息交互矩阵输入参数共享的第一模型进行时序特征学习,得到第一时序特征矩阵、第二时序特征矩阵、第三时序特征矩阵和第四时序特征矩阵;将所述第一时序特征矩阵、所述第二时序特征矩阵、所述第三时序特征矩阵和所述第四时序特征矩阵进行归一化处理,得到归一化特征矩阵,将所述归一化特征矩阵进行特征融合,得到特征拼接矩阵;将所述特征拼接矩阵输入第二模型,确定所述投诉预警识别结果。利用参数共享,在不影响模型效果的同时,能够减少模型训练参数,降低过拟合的影响。
[0008]在另一种可能的设计中,对所述文本训练集进行预处理,得到文本数值矩阵,对所述文本数值矩阵进行编码处理,得到文本编码矩阵;对所述音频训练集进行预处理,得到音频数值矩阵,对所述音频数值矩阵进行编码处理,得到音频编码矩阵。将文本和音频进行特征提取并转换成计算机可识别处理的数值形式,有利于后续的模型训练。
[0009]在另一种可能的设计中,获取专家词库,所述专家词库包括多个通话录音的文本数据和音频数据;基于关键词,从所述专家词库中获取目标文本数据;根据所述目标文本数据对应的ID和通话时间,从所述专家词库中获取所述目标文本数据对应的目标音频数据;对所述目标文本数据进行正负样本标注,得到文本标注数据,基于所述文本标注数据,训练得到文本先验知识推理模型;根据所述目标文本数据与所述目标音频数据的关联情况和所述文本标注数据,得到音频标注数据,基于所述音频标注数据,训练得到音频先验知识推理模型。通过引入外部数据,训练简单分类模型作为模型先验知识,能够辅助多任务小样本的投诉预警识别模型的学习。
[0010]第二方面,本申请实施例提供了一种投诉预警识别装置,包括:
[0011]获取模块,用于获取训练集,所述训练集包括文本训练集和所述文本训练集对应的音频训练集。
[0012]处理模块,用于对所述训练集进行数据处理,得到文本编码矩阵和音频编码矩阵。
[0013]所述处理模块,还用于将所述文本训练集输入所述文本先验知识推理模型进行模型推理,得到文本权重矩阵,将所述音频训练集输入所述音频先验知识推理模型进行模型推理,得到音频权重矩阵。
[0014]所述处理模块,还用于将所述文本权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,将所述音频权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,得到第一信息交互矩阵、第二信息交互矩阵、第三信息交互矩阵和第四信息交互矩阵。
[0015]所述处理模块,还用于根据所述第一信息交互矩阵、所述第二信息交互矩阵、所述第三信息交互矩阵和所述第四信息交互矩阵,确定投诉预警识别结果。
[0016]在一种可能的设计中,所述处理模块,还用于将所述文本权重矩阵和所述文本编码矩阵对位相乘,得到所述第一信息交互矩阵,将所述文本权重矩阵和所述音频编码矩阵对位相乘,得到所述第二信息交互矩阵,将所述音频权重矩阵和所述文本编码矩阵对位相乘,得到所述第三信息交互矩阵,将所述音频权重矩阵和所述音频编码矩阵对位相乘,得到
所述第四信息交互矩阵。
[0017]在另一种可能的设计中,所述处理模块,还用于将所述文本权重矩阵和所述文本编码矩阵相加,得到所述第一信息交互矩阵,将所述文本权重矩阵和所述音频编码矩阵相加,得到所述第二信息交互矩阵,将所述音频权重矩阵和所述文本编码矩阵相加,得到所述第三信息交互矩阵,将所述音频权重矩阵和所述音频编码矩阵相加,得到所述第四信息交互矩阵。
[0018]在另一种可能的设计中,所述处理模块,还用于将所述第一信息交互矩阵、所述第二信息交互矩阵、所述第三信息交互矩阵和所述第四信息交互矩阵输入参数共享的第一模型进行时序特征学习,得到第一时序特征矩阵、第二时序特征矩阵、第三时序特征矩阵和第四时序特征矩阵;将所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种投诉预警识别方法,其特征在于,包括:获取训练集,所述训练集包括文本训练集和所述文本训练集对应的音频训练集;对所述训练集进行数据处理,得到文本编码矩阵和音频编码矩阵;将所述文本训练集输入所述文本先验知识推理模型进行模型推理,得到文本权重矩阵,将所述音频训练集输入所述音频先验知识推理模型进行模型推理,得到音频权重矩阵;将所述文本权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,将所述音频权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,得到第一信息交互矩阵、第二信息交互矩阵、第三信息交互矩阵和第四信息交互矩阵;根据所述第一信息交互矩阵、所述第二信息交互矩阵、所述第三信息交互矩阵和所述第四信息交互矩阵,确定投诉预警识别结果。2.根据权利要求1所述的方法,其特征在于,所述将所述文本权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,将所述音频权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,得到第一信息交互矩阵、第二信息交互矩阵、第三信息交互矩阵和第四信息交互矩阵,包括:将所述文本权重矩阵和所述文本编码矩阵对位相乘,得到所述第一信息交互矩阵,将所述文本权重矩阵和所述音频编码矩阵对位相乘,得到所述第二信息交互矩阵,将所述音频权重矩阵和所述文本编码矩阵对位相乘,得到所述第三信息交互矩阵,将所述音频权重矩阵和所述音频编码矩阵对位相乘,得到所述第四信息交互矩阵。3.根据权利要求1所述的方法,其特征在于,所述将所述文本权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,将所述音频权重矩阵分别与所述文本编码矩阵、所述音频编码矩阵进行交互处理,得到第一信息交互矩阵、第二信息交互矩阵、第三信息交互矩阵和第四信息交互矩阵,包括:将所述文本权重矩阵和所述文本编码矩阵相加,得到所述第一信息交互矩阵,将所述文本权重矩阵和所述音频编码矩阵相加,得到所述第二信息交互矩阵,将所述音频权重矩阵和所述文本编码矩阵相加,得到所述第三信息交互矩阵,将所述音频权重矩阵和所述音频编码矩阵相加,得到所述第四信息交互矩阵。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一信息交互矩阵、所述第二信息交互矩阵、所述第三信息交互矩阵和所述第四信息交互矩阵,确定投诉预警识别结果,包括:将所述第一信息交互矩阵、所述第二信息交互矩阵、所述第三信息交互矩阵和所述第四信息交互矩阵输入参数共享的第一模型进行时序特征学习,得到第一时序特征矩阵、第二时序特征矩阵、第三时序特征矩阵和第四时序特征矩阵;将所述第一时序特征矩阵、所述第二时序特征矩阵、所述第三时序特征矩阵和所述第四时序特征矩阵进行归一化处理,得到归一化特征矩阵,将所述归一化特征矩阵进行特征融合,得到特征拼接矩阵;将所述特征拼接矩阵输入第二模型,确定所述投诉预警识别结果。5.根据权利要求1所述的方法,其特征在于,所述对所述训练集进行数据处理,得到文本编码矩阵和音频编码矩阵,包括:对所述文本训练集进行预处理,得到文本数值矩阵,对所述文本数值矩阵进行编码处
理,得到文本编码矩阵;对所述音频训练集进行预处理,得到音频数值矩阵,对所述音频数值矩...

【专利技术属性】
技术研发人员:毛宇章杨清林昊徐伟张文锋
申请(专利权)人:招联消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1