System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 情绪识别模型的训练方法、装置、设备及存储介质制造方法及图纸_技高网

情绪识别模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:41834208 阅读:2 留言:0更新日期:2024-06-27 18:17
本申请实施例公开了一种情绪识别模型的训练方法、装置、设备及存储介质,属于情绪识别技术领域。该方法包括:通过情绪识别模型对训练数据集中的样本文本进行情绪识别,得到各个样本文本对应的样本情绪识别结果,训练数据集中包括样本文本以及样本文本对应的情绪真值标签;根据样本文本的样本特征以及样本情绪识别结果,确定样本文本对应的损失调节权重,样本特征包括样本类型和样本文本对应情绪真值标签的标签样本数中的至少一种;基于损失调节权重、样本情绪识别结果以及情绪真值标签,确定样本文本的情绪识别损失;基于情绪识别损失训练情绪识别模型;采用本申请实施例提供的方案,能够优化情绪识别模型的训练效果,并提高情绪识别的准确性。

【技术实现步骤摘要】

本申请实施例涉及情绪识别,特别涉及一种情绪识别模型的训练方法、装置、设备及存储介质


技术介绍

1、影视剧剧本理解需要对作家投稿或待拍摄的剧本进行情绪分析,从而了解剧本人物尤其是男女主的情绪走势以此评价剧本是否跌宕起伏、或把握拍摄中的情绪点。由于人类的情绪是复杂的,故一句话可表现多种情绪,如乐极生悲、喜极而泣,而在多标签预测时常常容易漏预测某些标签。

2、相关技术中,采用均衡采样的方式,通过统计每个标签类别的样本数量n,然后在样本抽样时,以1/n的概率抽取该标签类别的样本,从而对于数据量少的标签类别可以获得更大的抽样覆盖度。

3、而在数据极度不均衡的情况下,则会导致头部标签(样本数量较多的标签类别)的某些样本一直无法被抽样学习,造成头部标签泛化性降低,且具有多个标签类别的样本也会带来采样冗余而标签学习收益不足的问题,进而降低情绪识别的准确性。


技术实现思路

1、本申请实施例提供了一种情绪识别模型的训练方法、装置、设备及存储介质,能够优化情绪识别模型的训练效果,并提高情绪识别的准确性。所述技术方案如下:

2、一方面,本申请实施例提供了一种情绪识别模型的训练方法,所述方法包括:

3、通过情绪识别模型对训练数据集中的样本文本进行情绪识别,得到各个样本文本对应的样本情绪识别结果,所述训练数据集中包括所述样本文本以及所述样本文本对应的情绪真值标签;

4、根据所述样本文本的样本特征以及所述样本情绪识别结果,确定所述样本文本对应的损失调节权重,所述样本特征包括样本类型和所述样本文本对应情绪真值标签的标签样本数中的至少一种,所述样本类型包括容易样本和困难样本,所述标签样本数指所述训练数据集中具有所述情绪真值标签的样本文本数量;

5、基于所述损失调节权重、所述样本情绪识别结果以及所述情绪真值标签,确定所述样本文本的情绪识别损失;

6、基于所述情绪识别损失训练所述情绪识别模型。

7、另一方面,本申请实施例提供了一种情绪识别模型的训练装置,所述装置包括:

8、第一情绪识别模块,用于通过情绪识别模型对训练数据集中的样本文本进行情绪识别,得到各个样本文本对应的样本情绪识别结果,所述训练数据集中包括所述样本文本以及所述样本文本对应的情绪真值标签;

9、权重确定模块,用于根据所述样本文本的样本特征以及所述样本情绪识别结果,确定所述样本文本对应的损失调节权重,所述样本特征包括样本类型和所述样本文本对应情绪真值标签的标签样本数中的至少一种,所述样本类型包括容易样本和困难样本,所述标签样本数指所述训练数据集中具有所述情绪真值标签的样本文本数量;

10、损失确定模块,用于基于所述损失调节权重、所述样本情绪识别结果以及所述情绪真值标签,确定所述样本文本的情绪识别损失;

11、模型训练模块,用于基于所述情绪识别损失训练所述情绪识别模型。

12、另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述方面所述的情绪识别模型的训练方法。

13、另一方面,本申请实施例提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述方面所述的情绪识别模型的训练方法。

14、另一方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品包括至少一条指令,所述至少一条指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述至少一条指令,所述处理器执行所述至少一条指令,使得所述计算机设备执行上述方面所述的情绪识别模型的训练方法。

15、本申请实施例中,通过情绪识别模型对训练数据集中的样本文本进行情绪识别,得到各个样本文本的样本情绪识别结果之后,并没有直接根据样本情绪识别结果和情绪真值标签确定情绪识别损失,而是充分考虑到训练数据集中各个样本文本的样本特征,先根据样本文本的样本特征以及样本情绪识别结果,确定损失调节权重,再结合损失调节权重、样本情绪识别结果以及情绪真值标签共同确定情绪识别损失,进而基于该情绪识别损失训练情绪识别模型。采用本申请实施例提供的方案,通过利用损失调节权重确定情绪识别损失,可以实现对容易样本以及困难样本的情绪识别损失的调节,并在不同情绪真值标签的样本文本数量不均衡的情况下,实现对不均衡标签样本的情绪识别损失的调节,从而基于经过调节后的情绪识别损失训练情绪识别模型,能够优化情绪识别模型的训练效果,提高情绪识别模型输出的准确性。

本文档来自技高网...

【技术保护点】

1.一种情绪识别模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述情绪识别模型通过二阶段训练得到;所述基于所述情绪识别损失训练所述情绪识别模型,包括:

3.根据权利要求2所述的方法,其特征在于,在所述第一训练阶段,所述根据所述样本文本的样本特征以及所述样本情绪识别结果,确定所述样本文本对应的损失调节权重,包括:

4.根据权利要求2所述的方法,其特征在于,在所述第二训练阶段,所述根据所述样本文本的样本特征以及所述样本情绪识别结果,确定所述样本文本对应的损失调节权重,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述样本文本具有的样本标签类别数、所述情绪真值标签的标签样本数以及所述第二训练数据集中的第二标签类别数,确定所述样本文本对应的第二损失调节权重,包括:

6.根据权利要求1所述的方法,其特征在于,所述通过情绪识别模型对训练数据集中的样本文本进行情绪识别,得到各个样本文本对应的样本情绪识别结果,包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括

8.根据权利要求7所述的方法,其特征在于,所述基于各个关键人物的目标对话文本对应的目标情绪标签对所述剧本进行质量评估,得到剧本质量评估结果,包括:

9.根据权利要求8所述的方法,其特征在于,所述基于同一剧本场次内各个关键人物的目标对话文本对应的目标情绪标签,以及所述目标情绪标签对应的情绪预测概率,生成各个关键人物在所述剧本场次中的情绪发展曲线,包括:

10.根据权利要求9所述的方法,其特征在于,所述基于各个目标情绪标签对应的情绪预测概率,确定各个目标情绪标签的情绪显著程度,包括:

11.根据权利要求8所述的方法,其特征在于,所述基于各个关键人物对应的情绪发展曲线对所述剧本进行质量评估,得到所述剧本质量评估结果,包括:

12.一种情绪识别模型的训练装置,其特征在于,所述装置包括:

13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器;所述存储器存储有至少一条指令,所述至少一条指令用于被所述处理器执行以实现如权利要求1至11任一所述的情绪识别模型的训练方法。

14.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令,所述至少一条指令用于被处理器执行以实现如权利要求1至11任一所述的情绪识别模型的训练方法。

15.一种计算机程序产品,其特征在于,所述计算机程序产品包括至少一条指令,所述至少一条指令存储在计算机可读存储介质中;计算机设备的处理器从所述计算机可读存储介质读取所述至少一条指令,所述处理器执行所述至少一条指令,使得所述计算机设备实现如权利要求1至11任一所述的情绪识别模型的训练方法。

...

【技术特征摘要】

1.一种情绪识别模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述情绪识别模型通过二阶段训练得到;所述基于所述情绪识别损失训练所述情绪识别模型,包括:

3.根据权利要求2所述的方法,其特征在于,在所述第一训练阶段,所述根据所述样本文本的样本特征以及所述样本情绪识别结果,确定所述样本文本对应的损失调节权重,包括:

4.根据权利要求2所述的方法,其特征在于,在所述第二训练阶段,所述根据所述样本文本的样本特征以及所述样本情绪识别结果,确定所述样本文本对应的损失调节权重,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述样本文本具有的样本标签类别数、所述情绪真值标签的标签样本数以及所述第二训练数据集中的第二标签类别数,确定所述样本文本对应的第二损失调节权重,包括:

6.根据权利要求1所述的方法,其特征在于,所述通过情绪识别模型对训练数据集中的样本文本进行情绪识别,得到各个样本文本对应的样本情绪识别结果,包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,所述基于各个关键人物的目标对话文本对应的目标情绪标签对所述剧本进行质量评估,得到剧本质量评估结果,包括:

9.根据权利要求8所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:郭卉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1