System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及对话情感分析,特别是涉及一种对话情感分析模型的训练方法以及相关装置。
技术介绍
1、现阶段,对话情感识别模型在训练过程中已经充分考虑了对话中模态之间的融合,但是仍然存在不可靠的预测置信度的问题。在某些情况下,当部分信息被破坏时,模型预测的置信度会增加,使得对于不确定性样本的理解下降。
技术实现思路
1、本申请提供一种对话情感分析模型的训练方法以及相关装置,能够提升模型对不确定性样本的理解和处理。
2、本申请第一方面提供一种对话情感分析模型的训练方法,所述训练方法包括:获取当前轮次的训练样本;其中,所述训练样本与对话相关且包括多种模态的数据,所述训练样本对应生成数据的生成对象,所述训练样本中每个对话段设有用于指示真实情感的训练标签;利用多种数据屏蔽方式对所述训练样本进行调整,得到多种调整样本,并将所述训练样本及其对应的调整样本输入对话情感分析模型,得到多种情感下所述训练样本中每个对话段对应的第一预测分布,以及每个所述调整样本中每个对话段对应的第二预测分布;其中,所述数据屏蔽方式与所述数据的模态和生成对象中的至少一者相关;基于所述训练标签、所述第一预测分布和所述第二预测分布,调整所述对话情感分析模型的参数,直至满足预设收敛条件,得到训练后的所述对话情感分析模型。
3、在一实施方式中,所述基于所述训练标签、所述第一预测分布和所述第二预测分布,调整所述对话情感分析模型的参数,包括:基于每个对话段对应的第一预测分布和第二预测分布中所述真实情感的分布值,确定每
4、在一实施方式中,所述基于每个对话段对应的第一预测分布和第二预测分布中所述真实情感的分布值,确定每个对话段的对比损失和置信度损失,包括:获取每个对话段对应的第一预测分布和第二预测分布中所述真实情感的变化值,基于所述变化值,得到每个对话段的所述置信度损失;以及,获取每个对话段对应的第一预测分布和第二预测分布中所述真实情感的变化趋势,基于相同变化趋势的对话段,得到每个对话段的所述对比损失。
5、在一实施方式中,所述获取每个对话段对应的第一预测分布和第二预测分布中所述真实情感的变化趋势,基于相同变化趋势的对话段,得到每个对话段的所述对比损失,包括:响应于当前对话段对应所述第一预测分布值大于所述第二预测分布的分布值,为对应的对话段设置第一标签;响应于当前对话段对应所述第一预测分布值小于或等于所述第二预测分布的分布值,为对应的对话段设置第二标签;基于具有所述第一标签的每个对话段的表征,得到对应的对话段的对比损失,基于具有所述第二标签的每个对话段的表征,得到对应的对话段的对比损失。
6、在一实施方式中,所述利用多种数据屏蔽方式对所述训练样本进行调整,得到多种调整样本,包括:利用预设的每种数据屏蔽方式分别对所述训练样本进行调整,得到每种所述数据屏蔽方式对应的调整样本;其中,所述数据的模态包括文本、音频和视觉,所述生成对象包括目标发言对象和非目标发言对象,所述数据屏蔽方式包括至少屏蔽一种模态的数据或至少屏蔽至少一个生成对象的数据。
7、在一实施方式中,所述训练过程包括多个训练样本,每个所述训练样本对应各自的训练难度,每个轮次包括至少一个所述训练样本,所述当前轮次的所述训练样本的数量与当前轮次的循环次数正相关,当前轮次新增的训练样本的训练难度与当前轮次的循环次数正相关。
8、在一实施方式中,所述训练样本的训练难度的确定过程包括:基于每个所述调整样本中每个对话段对应的第二预测分布与所述训练样本中每个对话段对应的第一预测分布,得到不同数据屏蔽方式对应的置信度差异;至少根据每个对话段的不同数据屏蔽方式对应的置信度差异,得到每个所述训练样本的训练难度。
9、在一实施方式中,所述至少根据每个对话段的不同数据屏蔽方式对应的置信度差异,得到每个所述训练样本的训练难度,包括:
10、根据每个对话段的不同数据屏蔽方式、每个所述训练样本中的发言对象的数量以及每个所述训练样本中的对话段的数量,得到每个所述训练样本的训练难度。
11、本申请第二方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如上述任一实施例中所述的对话情感分析模型的训练方法。
12、本申请第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行以实现如上述任一实施例中所述方法中的步骤。
13、区别与现有技术,本申请的有益效果是:本申请的对话情感分析模型的训练方法是在获取到当前轮次的训练样本后,对训练样本采用多种的数据屏蔽方式进行屏蔽,得到对应的多种调整样本,再将训练样本和调整样本输入模型中进行训练,虽然调整样本是经过不同的数据屏蔽方式屏蔽后的样本,但是调整样本的基本结构相较于训练样本的基本结构并没有改变,并且调整样本相较于训练样本的不确定性增加,能够提升模型对不确定性样本的理解和处理。
本文档来自技高网...【技术保护点】
1.一种对话情感分析模型的训练方法,其特征在于,所述训练方法包括:
2.根据权利要求1所述的训练方法,其特征在于,
3.根据权利要求2所述的训练方法,其特征在于,所述基于每个对话段对应的第一预测分布和第二预测分布中所述真实情感的分布值,确定每个对话段的对比损失和置信度损失,包括:
4.根据权利要求3所述的训练方法,其特征在于,所述获取每个对话段对应的第一预测分布和第二预测分布中所述真实情感的变化趋势,基于相同变化趋势的对话段,得到每个对话段的所述对比损失,包括:
5.根据权利要求1所述的训练方法,其特征在于,所述利用多种数据屏蔽方式对所述训练样本进行调整,得到多种调整样本,包括:
6.根据权利要求1所述的训练方法,其特征在于,所述训练过程包括多个训练样本,每个所述训练样本对应各自的训练难度,每个轮次包括至少一个所述训练样本,所述当前轮次的所述训练样本的数量与当前轮次的循环次数正相关,当前轮次新增的训练样本的训练难度与当前轮次的循环次数正相关。
7.根据权利要求6所述的训练方法,其特征在于,所述训练样本的训练难
8.根据权利要求7所述的训练方法,其特征在于,所述至少根据每个对话段的不同数据屏蔽方式对应的置信度差异,得到每个所述训练样本的训练难度,包括:
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1-8中任意一项所述的对话情感分析的训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行以实现如权利要求1-8任一项所述方法中的步骤。
...【技术特征摘要】
1.一种对话情感分析模型的训练方法,其特征在于,所述训练方法包括:
2.根据权利要求1所述的训练方法,其特征在于,
3.根据权利要求2所述的训练方法,其特征在于,所述基于每个对话段对应的第一预测分布和第二预测分布中所述真实情感的分布值,确定每个对话段的对比损失和置信度损失,包括:
4.根据权利要求3所述的训练方法,其特征在于,所述获取每个对话段对应的第一预测分布和第二预测分布中所述真实情感的变化趋势,基于相同变化趋势的对话段,得到每个对话段的所述对比损失,包括:
5.根据权利要求1所述的训练方法,其特征在于,所述利用多种数据屏蔽方式对所述训练样本进行调整,得到多种调整样本,包括:
6.根据权利要求1所述的训练方法,其特征在于,所述训练过程包括多个训练样本,每个所述训练样本对应各自的训练难度,...
【专利技术属性】
技术研发人员:徐睿峰,涂耿,熊峰,梁斌,秦兵,
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。