层级分类和模型训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号：37422311 阅读：8 留言：0更新日期：2023-04-30 09:44

本发明专利技术实施例提供了一种层级分类和模型训练方法、装置、电子设备和存储介质。所述模型训练方法包括：分别基于多个分类层级，提取第一图像样本的多个图像特征，其中，分类层级越高，分类粒度越大；分别融合所述多个分类层级的多个语义标签与所述多个图像特征，得到所述多个分类层级对应的多组融合数据；将按照分类层级从高到低排序的多组融合数据作为输入，将所述多个语义标签作为输出，训练第一序列神经网络，得到层级分类模型。本发明专利技术实施例的方案即使在图像样本较少的情况下，仍然通过分类层级之间的依赖关系给出了可靠的分类结果，实现了可靠的小样本学习。了可靠的小样本学习。了可靠的小样本学习。

全部详细技术资料下载

【技术实现步骤摘要】
层级分类和模型训练方法、装置、电子设备和存储介质

[0001]本专利技术实施例涉及计算机
，尤其涉及一种层级分类和模型训练方法、装置、电子设备和存储介质。

技术介绍

[0002]随着全球互联网快速发展，社交网络、电子商务、直播以及短视频等领域每天生产出海量的数据信息，一些潜在的风险信息也会参杂其中，而互联网的快速传播使得一些违禁信息能够快速扩散，造成社会上不良的价值观引导甚至导致一些经济的损失。除此之外，这些风险也具备了一些特殊属性导致了识别、防控难度提升。
[0003]在大量的多媒体信息中，虽然存在大量的数据样本，但是在复杂内容治理场景由于治理风险类别复杂、部分特殊风险黑数据匮乏、风险变化快、人工标注难度高等原因，用于模型训练、优化等标签数据受到了制约。
[0004]因此，针对标注数据受限场景的模型，急需一套有效的小样本学习方法，以符合场景定制化要求。

技术实现思路

[0005]有鉴于此，本专利技术实施例提供一种层级分类和模型训练方法、装置、电子设备和存储介质，以至少部分解决上述问题。
[0006]根据本专利技术实施例的第一方面，提供了一种模型训练方法，包括：分别基于多个分类层级，提取第一图像样本的多个图像特征，其中，分类层级越高，分类粒度越大；分别融合所述多个分类层级的多个语义标签与所述多个图像特征，得到所述多个分类层级对应的多组融合数据；将按照分类层级从高到低排序的多组融合数据作为输入，将所述多个语义标签作为输出，训练第一序列神经网络，得到层级分类模型。
[...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：分别基于多个分类层级，提取第一图像样本的多个图像特征，其中，分类层级越高，分类粒度越大；分别融合所述多个分类层级的多个语义标签与所述多个图像特征，得到所述多个分类层级对应的多组融合数据；将按照分类层级从高到低排序的多组融合数据作为输入，将所述多个语义标签作为输出，训练第一序列神经网络，得到层级分类模型。2.根据权利要求1所述的方法，其中，所述分别融合所述多个分类层级的多个语义标签与所述多个图像特征，得到所述多个分类层级对应的多组融合数据，包括：获取所述多个分类层级的多个语义标签各自的语义特征向量和所述多个图像特征各自的图像特征向量；分别拼接每个语义标签的语义特征向量和对应的图像特征向量，得到每个分类层级的拼接向量；确定每个分类层级的拼接向量，作为每个分类层级的一组融合数据。3.根据权利要求2所述的方法，其中，所述获取所述多个语义标签各自的语义特征向量，包括：将所述多个语义标签输入到预先训练的语义向量编码模型中，得到多个语义标签各自的语义特征向量。4.根据权利要求1所述的方法，其中，所述第一序列神经网络为多个传播单元构成的长短期记忆神经网络；所述将按照分类层级从高到低排序的多组融合数据作为输入，将所述多个语义标签作为输出，训练第一序列神经网络，得到层级分类模型，包括：将按照分类层级从高到低排序的多组融合数据分别作为所述多个传播单元的输入，将所述多个语义标签分别作为所述多个传播单元的输出，训练所述长短期记忆神经网络，其中，每个传播单元的单元状态和隐状态基于输入与上游传播单元的单元状态和隐状态确定，每个传播单元的输出基于对应的隐状态确定。5.根据权利要求4所述的方法，其中，所述分别基于多个语义标签，提取第一图像样本的多个图像特征，包括：将第一图像样本输入到特征提取模型中，得到所述第一图像样本的多个图像特征，所述特征提取模型用于基于从高到低的多个分类层级进行特征提取。6.根据权利要求5所述的方法，其中，所述特征提取模型包括主干网络和多个分支网络，所述主干网络的输出连接到所述多个分支网络各自的输入；所述方法还包括：在锁定预先训练的主干网络的各个参数的同时，将所述第一图像样本作为所述主干网络的输入，分别将所述多个语义标签作为所述多个分支网络的输出，训练所述多个分支网络。7.根据权利要求6所述的方法，其中，所述方法还包括：解除所述主干网络的各个参数的锁定；将所述第一图像样本作为所述主干网络的输入，将所述多个语义标签作为所述多个分
支网络的输出，进一步训练所述主干网络和所述多个分支网络。8.根据权利要求4所述的方法，其中，所述方法还包括：基于第二图像样本和第三图像样本各自的目标分类...

【专利技术属性】
技术研发人员：金炫，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人