标签处理模型训练方法、标签确定方法及装置制造方法及图纸

技术编号:39300469 阅读:6 留言:0更新日期:2023-11-12 15:51
本申请涉及机器学习技术领域,尤其涉及一种标签处理模型训练方法、标签确定方法及装置,标签处理模型训练方法包括:获取训练样本以及待训练模型;基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征;基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征;基于所述标签特征交互层对所述多种特征属性下的标签属性特征进行特征交互处理,得到标签交互特征;基于所述标注关联信息以及预测关联信息对所述待训练模型进行训练,得到目标标签处理模型。本申请能够提高多媒体资源标签预测的准确性。请能够提高多媒体资源标签预测的准确性。请能够提高多媒体资源标签预测的准确性。

【技术实现步骤摘要】
标签处理模型训练方法、标签确定方法及装置


[0001]本申请涉及机器学习
,尤其涉及一种标签处理模型训练方法、标签确定方法及装置。

技术介绍

[0002]标签作为多媒体资源的有效载体,能够有效地反映多媒体资源内容的主体信息,在多媒体资源的推荐场景中具有重要作用。由于多媒体资源的标签数量较大,从而直接使用分类模型对多媒体资源进行标签预测,可能会导致标签预测不准确的问题。

技术实现思路

[0003]本申请所要解决的技术问题在于,提供一种标签处理模型训练方法、标签确定方法及装置,能够提高多媒体资源标签预测的准确性。
[0004]为了解决上述技术问题,一方面,本申请提供了一种标签处理模型训练方法,包括:
[0005]获取训练样本以及待训练模型;所述训练样本包括样本多媒体资源、所述样本多媒体资源对应的候选标签,以及样本多媒体资源与所述候选标签的标注关联信息;所述待训练模型包括资源内容模型和资源标签模型;所述资源标签模型包括标签特征提取层以及标签特征交互层;
[0006]基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征;
[0007]基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征;
[0008]基于所述标签特征交互层对所述多种特征属性下的标签属性特征进行特征交互处理,得到标签交互特征;
[0009]基于所述资源内容特征以及所述标签交互特征进行特征融合,得到所述多媒体资源与所述候选标签的预测关联信息;
[0010]基于所述标注关联信息以及所述预测关联信息对所述待训练模型进行训练,得到目标标签处理模型。
[0011]另一方面,本申请提供了一种标签确定方法,包括:
[0012]获取与目标多媒体资源对应的多个预测标签;
[0013]将所述目标多媒体资源以及所述多个预测标签输入到目标标签处理模型进行标签处理,得到所述目标多媒体资源与所述多个预测标签分别对应的目标关联信息;所述目标标签处理模型基于上述的标签处理模型训练方法得到;
[0014]基于所述目标多媒体资源与所述多个预测标签分别对应的目标关联信息,从所述多个预测标签中确定出目标标签。
[0015]另一方面,本申请提供了一种标签处理模型训练装置,包括:
[0016]第一获取模块,用于获取训练样本以及待训练模型;所述训练样本包括样本多媒体资源、所述样本多媒体资源对应的候选标签,以及样本多媒体资源与所述候选标签的标注关联信息;所述待训练模型包括资源内容模型和资源标签模型;所述资源标签模型包括标签特征提取层以及标签特征交互层;
[0017]资源内容特征提取模块,用于基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征;
[0018]标签特征提取模块,用于基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征;
[0019]特征交互模块,用于基于所述标签特征交互层对所述多种特征属性下的标签属性特征进行特征交互处理,得到标签交互特征;
[0020]关联信息预测模块,用于基于所述资源内容特征以及所述标签交互特征进行特征融合,得到所述多媒体资源与所述候选标签的预测关联信息;
[0021]训练模块,用于基于所述标注关联信息以及所述预测关联信息对所述待训练模型进行训练,得到目标标签处理模型。
[0022]另一方面,本申请提供了一种标签确定装置,包括:
[0023]第二获取模块,用于获取与目标多媒体资源对应的多个预测标签;
[0024]标签处理模块,用于将所述目标多媒体资源以及所述多个预测标签输入到目标标签处理模型进行标签处理,得到所述目标多媒体资源与所述多个预测标签分别对应的目标关联信息;所述目标标签处理模型基于上述的标签处理模型训练装置得到;
[0025]目标标签确定模块,用于基于所述目标多媒体资源与所述多个预测标签分别对应的目标关联信息,从所述多个预测标签中确定出目标标签。
[0026]另一方面,本申请提供了一种电子设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的标签处理模型训练方法,或标签确定方法。
[0027]另一方面,本申请提供了一种计算机存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行如上述的标签处理模型训练方法,或标签确定方法。
[0028]实施本申请实施例,具有如下有益效果:
[0029]本申请基于多个预设标签预测模型对样本多媒体资源所预测的候选标签,以及候选标签与样本多媒体资源的标注关联信息进行模型训练;具体地,通过待训练模型的特征交互层对候选标签在多种特征属性下的标签属性特征进行特征交互处理,使得多种特征属性下的标签属性特征能够相互影响,从而提高了候选标签特征的特征表达能力;进一步基于特征交互后的标签交互特征与样本多媒体资源的资源内容特征进行特征融合,得到预测关联信息,能够提高预测关联信息的准确性;进而基于预测关联信息与标注关联信息进行模型训练,能够提高待训练模型对样本多媒体资源以及候选标签的关联信息表达能力,从而提高目标标签处理模型对标签处理的准确性。
附图说明
[0030]为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施
例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0031]图1是本申请实施例提供的实施环境示意图;
[0032]图2是本申请实施例提供的一种标签处理模型训练方法流程图;
[0033]图3是本申请实施例提供的基于标签来源信息生成标签属性特征的方法流程图;
[0034]图4是本申请实施例提供的基于标签置信度信息生成标签属性特征的方法流程图;
[0035]图5是本申请实施例提供的基于标签内容统计特征生成标签属性特征的方法流程图;
[0036]图6是本申请实施例提供的一种资源内容特征提取方法流程图;
[0037]图7是本申请实施例提供的一种特征融合方法流程图;
[0038]图8是本申请实施例提供的一种标签属性特征变换方法流程图;
[0039]图9是本申请实施例提供的一种标签确定方法流程图;
[0040]图10是本申请实施例提供的目标标签处理模型的结构示意图;
[0041]图11是本申请实施例提供的一种标签处理模型训练装置示意图;
[0042]图12是本申请实施例提供的一种标签确定装置示意图;
[0043]图13是本申请实施例提供的电子设备结构示意图。
具体实施方式
...

【技术保护点】

【技术特征摘要】
1.一种标签处理模型训练方法,其特征在于,包括:获取训练样本以及待训练模型;所述训练样本包括样本多媒体资源、所述样本多媒体资源对应的候选标签,以及样本多媒体资源与所述候选标签的标注关联信息;所述待训练模型包括资源内容模型和资源标签模型;所述资源标签模型包括标签特征提取层以及标签特征交互层;基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征;基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征;基于所述标签特征交互层对所述多种特征属性下的标签属性特征进行特征交互处理,得到标签交互特征;基于所述资源内容特征以及所述标签交互特征进行特征融合,得到所述多媒体资源与所述候选标签的预测关联信息;基于所述标注关联信息以及所述预测关联信息对所述待训练模型进行训练,得到目标标签处理模型。2.根据权利要求1所述的方法,其特征在于,所述候选标签基于多个预设标签预测模型对所述样本多媒体资源进行标签预测得到;所述多个预设标签预测模型基于不同的标签预测算法进行训练得到;所述候选标签携带有模型标识,所述模型标识用于表征所述候选标签的来源信息;所述特征属性包括标签来源属性;所述基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征,包括:基于所述标签特征提取层对所述候选标签携带的模型标识进行特征提取,得到所述标签来源属性对应的标签来源特征;基于所述标签来源特征,得到所述候选标签在所述多种特征属性下的标签属性特征。3.根据权利要求2所述的方法,其特征在于,所述候选标签携带有置信度信息;所述特征属性包括标签置信度属性;所述基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征,包括:基于所述标签特征提取层对所述候选标签携带的置信度信息进行特征提取,得到所述标签置信度属性对应的标签置信度特征;基于所述标签置信度特征,得到所述候选标签在所述多种特征属性下的标签属性特征。4.根据权利要求1所述的方法,其特征在于,所述特征属性包括标签内容统计属性;所述基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征,包括:基于所述标签特征提取层对所述候选标签进行特征内容统计特征提取,得到所述标签内容统计属性对应的标签内容统计特征;基于所述标签内容统计特征,得到所述候选标签在所述多种特征属性下的标签属性特征。
5.根据权利要求1

4任一项所述的方法,其特征在于,所述基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征之前,所述方法还包括:基于所述样本多媒体资源对应的文本内容布局信息,对所述样本多媒体资源进行文本区域划分,得到多个文本区域;所述基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征,包括:基于所述资源内容模型对所述多个文本区域分别对应的文本内容进行内容特征提取,得到与所述多个文本区域分别对应的资源内容特征。6.根据权利要求5所述的方法,其特征在于,所述基于所述资源内容特征以及所述标签交互特征进行特征融合,得到所述多媒体资源与所述候选标签的预测关联信息,包括:将所述标签交互特征与所述多个文本区域分别对应...

【专利技术属性】
技术研发人员:杨皓
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1