【技术实现步骤摘要】
标签处理模型训练方法、标签确定方法及装置
[0001]本申请涉及机器学习
,尤其涉及一种标签处理模型训练方法、标签确定方法及装置。
技术介绍
[0002]标签作为多媒体资源的有效载体,能够有效地反映多媒体资源内容的主体信息,在多媒体资源的推荐场景中具有重要作用。由于多媒体资源的标签数量较大,从而直接使用分类模型对多媒体资源进行标签预测,可能会导致标签预测不准确的问题。
技术实现思路
[0003]本申请所要解决的技术问题在于,提供一种标签处理模型训练方法、标签确定方法及装置,能够提高多媒体资源标签预测的准确性。
[0004]为了解决上述技术问题,一方面,本申请提供了一种标签处理模型训练方法,包括:
[0005]获取训练样本以及待训练模型;所述训练样本包括样本多媒体资源、所述样本多媒体资源对应的候选标签,以及样本多媒体资源与所述候选标签的标注关联信息;所述待训练模型包括资源内容模型和资源标签模型;所述资源标签模型包括标签特征提取层以及标签特征交互层;
[0006]基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征;
[0007]基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征;
[0008]基于所述标签特征交互层对所述多种特征属性下的标签属性特征进行特征交互处理,得到标签交互特征;
[0009]基于所述资源内容特征以及所述标签交互特征进行特征融合,得到所述多媒体资源与所述候选标
【技术保护点】
【技术特征摘要】
1.一种标签处理模型训练方法,其特征在于,包括:获取训练样本以及待训练模型;所述训练样本包括样本多媒体资源、所述样本多媒体资源对应的候选标签,以及样本多媒体资源与所述候选标签的标注关联信息;所述待训练模型包括资源内容模型和资源标签模型;所述资源标签模型包括标签特征提取层以及标签特征交互层;基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征;基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征;基于所述标签特征交互层对所述多种特征属性下的标签属性特征进行特征交互处理,得到标签交互特征;基于所述资源内容特征以及所述标签交互特征进行特征融合,得到所述多媒体资源与所述候选标签的预测关联信息;基于所述标注关联信息以及所述预测关联信息对所述待训练模型进行训练,得到目标标签处理模型。2.根据权利要求1所述的方法,其特征在于,所述候选标签基于多个预设标签预测模型对所述样本多媒体资源进行标签预测得到;所述多个预设标签预测模型基于不同的标签预测算法进行训练得到;所述候选标签携带有模型标识,所述模型标识用于表征所述候选标签的来源信息;所述特征属性包括标签来源属性;所述基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征,包括:基于所述标签特征提取层对所述候选标签携带的模型标识进行特征提取,得到所述标签来源属性对应的标签来源特征;基于所述标签来源特征,得到所述候选标签在所述多种特征属性下的标签属性特征。3.根据权利要求2所述的方法,其特征在于,所述候选标签携带有置信度信息;所述特征属性包括标签置信度属性;所述基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征,包括:基于所述标签特征提取层对所述候选标签携带的置信度信息进行特征提取,得到所述标签置信度属性对应的标签置信度特征;基于所述标签置信度特征,得到所述候选标签在所述多种特征属性下的标签属性特征。4.根据权利要求1所述的方法,其特征在于,所述特征属性包括标签内容统计属性;所述基于所述标签特征提取层对所述候选标签进行标签特征提取,得到所述候选标签在多种特征属性下的标签属性特征,包括:基于所述标签特征提取层对所述候选标签进行特征内容统计特征提取,得到所述标签内容统计属性对应的标签内容统计特征;基于所述标签内容统计特征,得到所述候选标签在所述多种特征属性下的标签属性特征。
5.根据权利要求1
‑
4任一项所述的方法,其特征在于,所述基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征之前,所述方法还包括:基于所述样本多媒体资源对应的文本内容布局信息,对所述样本多媒体资源进行文本区域划分,得到多个文本区域;所述基于所述资源内容模型对所述样本多媒体资源进行内容特征提取,得到资源内容特征,包括:基于所述资源内容模型对所述多个文本区域分别对应的文本内容进行内容特征提取,得到与所述多个文本区域分别对应的资源内容特征。6.根据权利要求5所述的方法,其特征在于,所述基于所述资源内容特征以及所述标签交互特征进行特征融合,得到所述多媒体资源与所述候选标签的预测关联信息,包括:将所述标签交互特征与所述多个文本区域分别对应...
【专利技术属性】
技术研发人员:杨皓,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。