【技术实现步骤摘要】
一种数据处理方法、数据处理装置、电子设备及存储介质
[0001]本申请属于人工智能
,尤其涉及一种数据处理方法、数据处理装置、电子设备及存储介质。
技术介绍
[0002]人机交互的核心是机器识别用户的意图,以针对用户的意图输出准确的反馈信息。机器识别用户的意图通常是基于语言模型实现的,目前常用的几种语言模型的结构都极为复杂,以主流的基于转换器的双向编码器表征(Bidirectional Encoder Representations from Transformers,Bert)模型为例,型中的各种功能层可以高达数百个,参数更是达到了上亿数量级,这导致此类语言模型的运算量十分庞大,训练效率相对较低。
[0003]为此,如何在不影响模型性能的基础上,更加快捷地训练得到意图识别模型,是当前亟需解决的技术问题。
技术实现思路
[0004]本申请目的是提供一种数据处理方法、数据处理装置、电子设备及存储介质,在不影响模型性能的基础上,更加快捷地对意图识别模型完成训练。
[0005]为了实现上述目的,本申请实施例是这样实现的:
[0006]第一方面,提供一种数据处理方法,包括:
[0007]获取目标交互场景对应的微调训练样本集,所述微调训练样本集包括微调训练样本和所述微调训练样本对应的意图标签;
[0008]通过意图识别模型中的第一模块对所述微调训练样本进行语义编码,并通过所述意图识别模型中的第二模块对语义编码结果进行意图预测,得到所述微调训练样本对应的意图预测结果, ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取目标交互场景对应的微调训练样本集,所述微调训练样本集包括微调训练样本和所述微调训练样本对应的意图标签;通过意图识别模型中第一模块对所述微调训练样本进行语义编码,并通过所述意图识别模型中的第二模块对语义编码结果进行意图预测,得到所述微调训练样本对应的意图预测结果,所述第一模块是预先基于所述目标交互场景的关联场景中历史对话数据对和单头注意力机制进行无监督预训练得到的;基于所述微调训练样本对应的意图标签和所述微调训练样本对应的意图预测结果对所述第二模块进行微调训练。2.根据权利要求1所述的方法,其特征在于,所述基于所述训练样本对应的意图标签和所述训练样本对应的意图预测结果对所述第二模块进行微调训练,包括:确定所述意图标签和所述意图预测结果之间的差异;基于所述意图标签和所述意图预测结果之间的差异确定所述意图识别模型对应的微调训练损失函数;基于所述意图识别模型对应的微调训练损失函数确定微调训练的梯度,并按照所述微调训练的梯度,对所述第二模块的网络参数进行调整。3.根据权利要求1所述的方法,其特征在于,所述第一模块包括相互耦合的第一子网络和第二子网络,在所述通过意图识别模型中的第一模块对所述微调训练样本进行语义编码前,所述方法还包括:获取预训练样本集,所述预训练样本集包括所述目标交互场景相关的关联场景中历史对话数据对,所述历史对话数据对包括提问数据和回答数据;通过所述第一子网络对所述预训练样本集中的提问数据进行特征提取,得到第一文本特征,以及通过所述第二子网络对所述预训练样本集中的回答数据进行特征提取,得到第二文本特征;确定所述第一文本特征和所述第二文本特征之间的匹配度;基于所述第一文本特征和所述第二文本特征之间的匹配度,确定所述第一模块对应的预训练损失函数;基于所述第一模块对应的预训练损失函数,确定预训练的梯度,并按照所述预训练的梯度,对所述第一模块的网络参数进行调整。4.根据权利要求3所述的方法,其特征在于,所述第一子网络包括第一编码子模块和第一单头自注意力子模块,所述第二子网络包括第二编码子模块和第二单头自注意力子模块,所述第一单头自注意力模块和所述第二自注意力模块之间共享参数;所述通过所述第一子网络对所述预训练样本中的提问数据进行特征提取,得到第一文本特征,包括:通过所述第一子网络的第一子编码模块对所述预训练样本中的提问数据进行文本编码处理,并通过所述第一子网络中的第一单头自注意力子模块对提问数据的文本编码处理结果进行特征提取,得到所述第一文本特征;所述通过所述第二子网络对所述预训练样本中的回答数据进行特征提取,得到第二文本特征,包括:
通过所述第二子网络的第二编码子模块对所述预训练样本中的回答数据进行文本编码处理,并通过所述第二子网络中的第二单头自注意力子模块对回答数据的编码处理结果进行特征提取处理,得到所述第二文本特征。5.根据权利要求3所述的方法,其特征在于,所述获取目标交互场景对应的微调训练样本集,包括:确定所述目标交互场景对应的定制微调训练样本集,所述定制微调训练样本集包括定制微调训练样本和所述定制微调训练样本对应的意图标签;...
【专利技术属性】
技术研发人员:丁隆耀,王洪斌,权佳成,李宽,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。