多级语义意图识别方法及其相关设备技术

技术编号:36758494 阅读:9 留言:0更新日期:2023-03-04 10:51
本申请实施例属于金融科技技术领域,应用于金融业务语义意图识别领域中,涉及一种多级语义意图识别方法及其相关设备,包括获取待识别文本;将所述待识别文本输入预训练的分词模型,进行分词处理,将分词处理结果作为所述待识别文本的特征编码;将所述特征编码输入预构建的图神经网络模型,识别出所述待识别文本中包含的多级语义意图,本申请采用ERNIE模型分词处理结果,构建多级意图层级树,再通过多级意图层级树构建图神经网络模型,能够很好的获取多级语义意图之间的依赖信息,使得预测结果更加合理,最终整体提高用户多级意图识别准确率。率。率。

【技术实现步骤摘要】
多级语义意图识别方法及其相关设备


[0001]本申请涉及金融科技
,尤其涉及一种多级语义意图识别方法及其相关设备。

技术介绍

[0002]在智能客服、多轮对话、机器人外呼场景中,能否正确识别用户的语义意图关系到机器人对用户问题回复的质量,也关系到用户的使用体验,只有正确识别了用户语义意图,才能针对具体的语义意图去构造话术,提高回复精准度。
[0003]用户的语义意图往往比较复杂,不完全是单一语义意图,经常具有多级语义意图,例如车险销售场景,“询问

保费

三者险”,“询问

保额

商业险

去年”等具有三级或三级以上的语义意图,目前用户的语义意图识别主要是通过构造神经网络进行文本分类,例如基于卷积神经网络、基于LSTM、基于Bert预训练语言模型等,这些模型大多是对用户的输入进行编码,在网络最后一层通过softmax进行类别的概率估计,取出概率值最大的类别作为预测的类别,这种方法对于单一语义意图的识别效果较好,但不能有效识别出用户的多级语义意图,且没有有效利用多级语义意图之间的依赖关系。

技术实现思路

[0004]本申请实施例的目的在于提出一种多级语义意图识别方法及其相关设备,以解决现有技术中不能有效识别出用户的多级语义意图的问题。
[0005]为了解决上述技术问题,本申请实施例提供一种多级语义意图识别方法,采用了如下所述的技术方案:
[0006]一种多级语义意图识别方法,包括下述步骤:
[0007]步骤201,获取待识别文本;
[0008]步骤202,将所述待识别文本输入预训练的分词模型,进行分词处理,将分词处理结果作为所述待识别文本的特征编码;
[0009]步骤203,获取数据训练集,其中,所述数据训练集由已标注文本中各分词对应意图的文本组成,所述数据训练集中文本为保险业务中的常用对话文本;
[0010]步骤204,将所述数据训练集输入初始化的图神经网络模型,构建多级意图层级树;
[0011]步骤205,根据预设判断条件,判断所述多级意图层级树中节点个数是否处于稳定状态;
[0012]步骤206,若所述多级意图层级树中节点个数处于不稳定状态,则获取新的数据训练集,并重复执行步骤204、步骤205,对所述多级意图层级树进行更新;
[0013]步骤207,若所述多级意图层级树中节点个数处于稳定状态,则根据所述多级意图层级树中各节点及各节点间的连接关系,完成所述图神经网络模型的预构建。
[0014]步骤208,将所述特征编码输入预构建的图神经网络模型,识别出所述待识别文本
中包含的多级语义意图。
[0015]进一步的,所述将所述数据训练集输入初始化的图神经网络模型,构建多级意图层级树的步骤,具体包括:
[0016]获取所述数据训练集中所有文本中已标记意图的分词;
[0017]若任意两个分词在所有文本中不存在句子构造连接关系,且所述两个分词不是同一语义意图的分词,则所述两个分词对应的语义意图间不存在层级关系;
[0018]将所述不存在层级关系的语义意图设置在所述多级意图层级树的同一层级,作为所述多级意图层级树中的同层节点;
[0019]若任意两个分词在同一文本中存在句子构造连接关系,且所述两个分词不是同一语义意图的分词,则所述两个分词对应的语义意图间存在层级关系;
[0020]将所述存在层级关系的语义意图按照所述层级关系设置在所述多级意图层级树的不同层级,作为所述多级意图层级树中的分层节点;
[0021]对所述分层节点根据所述层级关系进行层间连线,直到连线完成,则完成当前周期所述多级意图层级树的构建。
[0022]进一步的,所述根据所述多级意图层级树中各节点及各节点间的连接关系,完成所述图神经网络模型的预构建的步骤,具体包括:
[0023]根据所述多级意图层级树中各节点及各节点间的连接关系,构造除根节点以外其他节点对应的邻接矩阵;
[0024]对所述邻接矩阵进行求和运算,获取所述邻接矩阵的度矩阵;
[0025]根据已标记意图的分词结果和预设概率算法,统计各分词在所述数据训练集中的权重值;
[0026]根据各分词在所述数据训练集中的权重值,构建初始化的分词权重矩阵;
[0027]根据图神经网络算法公式:根据图神经网络算法公式:完成所述图神经网络模型的预构建,其中,H
(l)
为多层图神经网络中本层的输出结果,σ为非线性映射函数,n为节点总个数,A
i
为第i个节点的邻接矩阵,D
i
为第i个节点的邻接矩阵的度矩阵,W
(l

1)
为经多层图神经网络中本层神经网络的上一层神经网络训练之后的分词权重矩阵,H
(l

1)
为多层图神经网络中本层神经网络的上一层的输出结果,b
(l

1)
为经多层图神经网络中本层神经网络的上一层神经网络训练之后的偏置项。
[0028]进一步的,所述根据预设判断条件,判断所述多级意图层级树中节点个数是否处于稳定状态的步骤,具体包括:
[0029]统计同一构建周期内所述多级意图层级树的节点个数变化情况;
[0030]若在构建前后所述节点个数未发生变化,则所述多级意图层级树中节点个数已处于稳定状态;
[0031]若在构建前后所述节点个数发生变化,则所述多级意图层级树中节点个数还未处于稳定状态。
[0032]进一步的,在执行所述根据所述多级意图层级树中各节点及各节点间的连接关系,完成所述图神经网络模型的预构建的步骤之前,所述方法还包括:
[0033]根据所述多级意图层级树中各节点间的连接关系,筛选出非叶子节点,其中,所述叶子节点为不存在下级节点的节点;
[0034]对各非叶子节点分别构造对应的局部分类器,并为所述局部分类器进行区别命名,其中,所述区别命名方式可以为直接使用各非叶子节点对应的语义意图名称作为所述区别命名。
[0035]进一步的,所述将所述特征编码输入预构建的图神经网络模型,识别出所述待识别文本中包含的多级语义意图的步骤,具体包括:
[0036]将所述特征编码输入所述预构建的图神经网络模型,识别所述特征编码中各分词结果分别所对应的局部分类器;
[0037]根据所述局部分类器,获取所述特征编码中各分词结果分别所对应语义意图;
[0038]判断所述特征编码中各分词结果分别所对应语义意图间是否存在多个同级语义意图;
[0039]若存在多个同级语义意图,则使用对比学习训练方式为所述多个同级语义意图分别构建正负样本实例,其中,正样本实例的构建方式为从所述数据训练集中随机获取与当前语义意图相同的若干个文本作为正样本实例,负样本实例的构建方式为识别所述当前语义意图对应节点为兄弟节点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多级语义意图识别方法,其特征在于,包括下述步骤:步骤201,获取待识别文本;步骤202,将所述待识别文本输入预训练的分词模型,进行分词处理,将分词处理结果作为所述待识别文本的特征编码;步骤203,获取数据训练集,其中,所述数据训练集由已标注文本中各分词对应意图的文本组成,所述数据训练集中文本为保险业务中的常用对话文本;步骤204,将所述数据训练集输入初始化的图神经网络模型,构建多级意图层级树;步骤205,根据预设判断条件,判断所述多级意图层级树中节点个数是否处于稳定状态;步骤206,若所述多级意图层级树中节点个数处于不稳定状态,则获取新的数据训练集,并重复执行步骤204、步骤205,对所述多级意图层级树进行更新;步骤207,若所述多级意图层级树中节点个数处于稳定状态,则根据所述多级意图层级树中各节点及各节点间的连接关系,完成所述图神经网络模型的预构建;步骤208,将所述特征编码输入预构建的图神经网络模型,识别出所述待识别文本中包含的多级语义意图。2.根据权利要求1所述的多级语义意图识别方法,其特征在于,所述将所述数据训练集输入初始化的图神经网络模型,构建多级意图层级树的步骤,具体包括:获取所述数据训练集中所有文本中已标记意图的分词;若任意两个分词在所有文本中不存在句子构造连接关系,且所述两个分词不是同一语义意图的分词,则所述两个分词对应的语义意图间不存在层级关系;将所述不存在层级关系的语义意图设置在所述多级意图层级树的同一层级,作为所述多级意图层级树中的同层节点;若任意两个分词在同一文本中存在句子构造连接关系,且所述两个分词不是同一语义意图的分词,则所述两个分词对应的语义意图间存在层级关系;将所述存在层级关系的语义意图按照所述层级关系设置在所述多级意图层级树的不同层级,作为所述多级意图层级树中的分层节点;对所述分层节点根据所述层级关系进行层间连线,直到连线完成,则完成当前周期所述多级意图层级树的构建。3.根据权利要求2所述的多级语义意图识别方法,其特征在于,所述根据所述多级意图层级树中各节点及各节点间的连接关系,完成所述图神经网络模型的预构建的步骤,具体包括:根据所述多级意图层级树中各节点及各节点间的连接关系,构造除根节点以外其他节点对应的邻接矩阵;对所述邻接矩阵进行求和运算,获取所述邻接矩阵的度矩阵;根据已标记意图的分词结果和预设概率算法,统计各分词在所述数据训练集中的权重值;根据各分词在所述数据训练集中的权重值,构建初始化的分词权重矩阵;根据图神经网络算法公式:根据图神经网络算法公式:完
成所述图神经网络模型的预构建,其中,H
(l)
为多层图神经网络中本层的输出结果,σ为非线性映射函数,n为节点总个数,A
i
为第i个节点的邻接矩阵,D
i
为第i个节点的邻接矩阵的度矩阵,W
(l

1)
为经多层图神经网络中本层神经网络的上一层神经网络训练之后的分词权重矩阵,H
(l

1)
为多层图神经网络中本层神经网络的上一层的输出结果,b
(l

1)
为经多层图神经网络中本层神经网络的上一层神经网络训练之后的偏置项。4.根据权利要求1所述的多级语义意图识别方法,其特征在于,所述根据预设判断条件,判断所述多级意图层级树中节点个数是否处于稳定状态的步骤,具体包括:统计同一构建周期内所述多级意图层级树的节点个数变化情况;若在构建前后所述节点个数未发生变化,则所述多级意图层级树中节点个数已处于稳定状态;若在构建前后所述节点个数发生变化,则所述多级意图层级树中节点个数还未处于稳定状态。5.根据权利要求1所述的多级语义意图识别方法,其特征在于,在执行所述根据所述多级意图层级树中各节点及各节点间的连接关系,完成所述图神经网络模型的预构建的步骤之前,所述方法还包括:根据所述多级意图层级树中各节点间的连接关系,筛选出非叶子节点,其中,所述叶子节点为不存在下级节点的节点;对各非叶子节点分别构造对应的局部分类器,并为所述局部分类器进行区别命名,其中,所述区别命名方式为直接使用各非叶子节点对应的语义意图名称作为所述区别命名。6.根据权利要求5所述的多级语义意图识别方法,其特征在于,所述将所述特征编码输入预构建的图神经网络模型,识别出所...

【专利技术属性】
技术研发人员:黄勇其陈晓杰陈步闲潘劲松赖勇铨
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1