类别确定方法、装置、设备、存储介质和产品制造方法及图纸

技术编号:33956776 阅读:16 留言:0更新日期:2022-06-29 23:42
本申请实施例公开了一种类别确定方法、装置、设备、存储介质和产品,属于计算机技术领域,可应用于计算机技术中的视频分类、人工智能以及车载等场景。方法包括:获取目标视频的第一视频描述信息,所述第一视频描述信息用于描述所述目标视频的视频内容;对所述第一视频描述信息进行实体识别,得到所述第一视频描述信息中的第一实体;获取所述第一实体的第一知识扩展信息;基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的类别。该方案通过引入知识扩展信息使得实体的信息更加丰富,也使得该实体能够被更加准确地理解,因此,基于该知识扩展信息和视频描述信息能够更加准确地确定视频类别,提高了视频类别的准确性。的准确性。的准确性。

Category determination method, device, equipment, storage medium and product

【技术实现步骤摘要】
类别确定方法、装置、设备、存储介质和产品


[0001]本申请涉及计算机
,特别涉及一种类别确定方法、装置、设备、存储介质和产品。

技术介绍

[0002]随着计算机技术和互联网技术的不断发展,互联网中传播的视频数据越来越多。为了方便用户检索到想要的视频数据,检索系统会对互联网中传播的视频的标题信息进行分类来得到视频的类别,基于视频的类别,为用户提供检索数据。
[0003]目前,大多通过类别识别模型对标题信息进行类别识别,得到视频的类别。但是标题信息普遍比较简短,包含的信息十分有限,因此,通过这种方式得到的类别的准确性较低。

技术实现思路

[0004]本申请实施例提供了类别确定方法、装置、设备、存储介质和产品,能够提高视频类别的准确性。所述技术方案如下:
[0005]一方面,提供了一种类别确定方法,所述方法包括:
[0006]获取目标视频的第一视频描述信息,所述第一视频描述信息用于描述所述目标视频的视频内容;
[0007]对所述第一视频描述信息进行实体识别,得到所述第一视频描述信息中的第一实体;
[0008]获取所述第一实体的第一知识扩展信息;
[0009]基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的类别。
[0010]另一方面,提供了一种类别确定装置,所述装置包括:
[0011]第一获取模块,用于获取目标视频的第一视频描述信息,所述第一视频描述信息用于描述所述目标视频的视频内容;
[0012]识别模块,用于对所述第一视频描述信息进行实体识别,得到所述第一视频描述信息中的第一实体;
[0013]第二获取模块,用于获取所述第一实体的第一知识扩展信息;
[0014]确定模块,用于基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的类别。
[0015]在一些实施例中,所述目标视频的类别包括一级类别和二级类别;所述确定模块,包括:
[0016]第一确定单元,用于基于所述第一视频描述信息,确定所述目标视频的一级类别;
[0017]第二确定单元,用于基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的二级类别。
[0018]在一些实施例中,所述第一确定单元,用于确定所述第一视频描述信息的描述语义特征,基于所述描述语义特征,确定所述目标视频的一级类别;
[0019]所述第二确定单元,用于确定所述第一知识扩展信息的扩展语义特征,对所述描述语义特征和所述扩展语义特征进行融合,得到融合特征,基于所述融合特征,确定所述目标视频的二级类别。
[0020]在一些实施例中,所述目标视频的类别包括一级类别和二级类别;所述确定模块,用于将所述第一视频描述信息和所述第一知识扩展信息输入类别识别模型,输出所述目标视频的一级类别和二级类别,所述类别识别模型用于基于所述第一视频描述信息,确定所述目标视频的一级类别,基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的二级类别。
[0021]在一些实施例中,所述装置还包括:
[0022]第三获取模块,用于获取样本数据,所述样本数据包括样本视频的第二视频描述信息、所述样本视频的样本一级类别和样本二级类别;
[0023]所述第二获取模块,还用于获取第二实体的第二知识扩展信息,所述第二实体为所述第二视频描述信息中的实体;
[0024]所述确定模块,还用于通过训练前的类别识别模型,对所述第二视频描述信息和所述第二知识扩展信息进行类别识别,得到所述样本视频的预测一级类别和预测二级类别;
[0025]训练模块,用于基于所述预测一级类别、所述样本一级类别、所述预测二级类别和所述样本二级类别,对所述训练前的类别识别模型进行训练,得到所述类别识别模型。
[0026]在一些实施例中,所述训练模块,包括:
[0027]第一确定单元,用于基于所述预测一级类别和所述样本一级类别,确定第一损失值;
[0028]第二确定单元,用于基于所述预测二级类别和所述样本二级类别,确定第二损失值;
[0029]融合单元,用于将所述第一损失值与所述第二损失值进行融合,得到第三损失值;
[0030]训练单元,用于基于所述第三损失值,对所述训练前的类别识别模型进行训练,得到所述类别识别模型。
[0031]在一些实施例中,所述训练模块,还用于确定第一概率和第二概率,所述类别识别模型用于确定所述目标视频属于多个一级类别的概率和所述目标视频属于多个二级类别的概率,所述第一概率为所述类别识别模型确定的至少一个一级类别的概率,所述第二概率为所述类别识别模型确定的至少一个二级类别的概率;
[0032]所述训练模块,用于基于所述预测一级类别、所述样本一级类别、所述预测二级类别、所述样本二级类别、所述第一概率和所述第二概率,对所述训练前的类别识别模型进行训练,得到所述类别识别模型。
[0033]在一些实施例中,所述训练模块,用于执行以下任一项:
[0034]将所述类别识别模型确定的正确一级类别的概率确定为所述第一概率,将所述类别识别模型确定的正确二级类别的概率确定为所述第二概率,所述正确一级类别是与所述样本一级类别相同的类别,所述正确二级类别是与所述样本二级类别相同的类别;
[0035]将所述预测一级类别的概率确定为所述第一概率,将所述预测二级类别的概率确定为所述第二概率;
[0036]将所述预测一级类别的概率确定为所述第一概率,将所述类别识别模型确定的多个二级类别的概率确定为所述第二概率;
[0037]将所述类别识别模型确定的多个一级类别的概率确定为所述第一概率,将所述类别识别模型确定的多个二级类别的概率确定为所述第二概率。
[0038]在一些实施例中,所述训练模块,包括:
[0039]第一确定单元,用于基于所述预测一级类别和所述样本一级类别,确定第一损失值;
[0040]第二确定单元,用于基于所述预测二级类别和所述样本二级类别,确定第二损失值;
[0041]第三确定单元,用于基于所述第一概率和所述第二概率,确定第四损失值;
[0042]融合单元,用于将所述第一损失值、所述第二损失值和所述第四损失值进行融合,得到第五损失值;
[0043]训练单元,用于基于所述第五损失值,对所述类别识别模型进行训练。
[0044]在一些实施例中,所述第三确定单元,用于在所述第一概率小于所述第二概率的情况下,基于所述第一概率和所述第二概率的差值,确定所述第四损失值,所述第四损失值与所述差值呈正相关;在所述第一概率不小于所述第二概率的情况下,确定所述第四损失值为0。
[0045]另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器用于存储至少一段计算机程序,所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中的类别确定方法。
[0046]另一方面,提供了一种计算机可读存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种类别确定方法,其特征在于,所述方法包括:获取目标视频的第一视频描述信息,所述第一视频描述信息用于描述所述目标视频的视频内容;对所述第一视频描述信息进行实体识别,得到所述第一视频描述信息中的第一实体;获取所述第一实体的第一知识扩展信息;基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的类别。2.根据权利要求1所述的方法,其特征在于,所述目标视频的类别包括一级类别和二级类别;所述基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的类别,包括:基于所述第一视频描述信息,确定所述目标视频的一级类别;基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的二级类别。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一视频描述信息,确定所述目标视频的一级类别,包括:确定所述第一视频描述信息的描述语义特征,基于所述描述语义特征,确定所述目标视频的一级类别;所述基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的二级类别,包括:确定所述第一知识扩展信息的扩展语义特征,对所述描述语义特征和所述扩展语义特征进行融合,得到融合特征,基于所述融合特征,确定所述目标视频的二级类别。4.根据权利要求1所述的方法,其特征在于,所述目标视频的类别包括一级类别和二级类别;所述基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的类别,包括:将所述第一视频描述信息和所述第一知识扩展信息输入类别识别模型,输出所述目标视频的一级类别和二级类别,所述类别识别模型用于基于所述第一视频描述信息,确定所述目标视频的一级类别,基于所述第一视频描述信息和所述第一知识扩展信息,确定所述目标视频的二级类别。5.根据权利要求4所述的方法,其特征在于,所述类别识别模型的训练过程包括:获取样本数据,所述样本数据包括样本视频的第二视频描述信息、所述样本视频的样本一级类别和样本二级类别;获取第二实体的第二知识扩展信息,所述第二实体为所述第二视频描述信息中的实体;通过训练前的类别识别模型,对所述第二视频描述信息和所述第二知识扩展信息进行类别识别,得到所述样本视频的预测一级类别和预测二级类别;基于所述预测一级类别、所述样本一级类别、所述预测二级类别和所述样本二级类别,对所述训练前的类别识别模型进行训练,得到所述类别识别模型。6.根据权利要求5所述的方法,其特征在于,所述基于所述预测一级类别、所述样本一级类别、所述预测二级类别和所述样本二级类别,对所述训练前的类别识别模型进行训练,得到所述类别识别模型,包括:
基于所述预测一级类别和所述样本一级类别,确定第一损失值;基于所述预测二级类别和所述样本二级类别,确定第二损失值;将所述第一损失值与所述第二损失值进行融合,得到第三损失值;基于所述第三损失值,对所述训练前的类别识别模型进行训练,得到所述类别识别模型。7.根据权利要求5所述的方法,其特征在于,所述基于所述预测一级类别、所述样本一级类别、所述预测二级类别和所述样本二级类别,对所述训练前的类别识别模型进行训练,得到所述类别识别模型,包括:确定第一概率和第二概率,所述类别识别模型用于确定所述目标视频属于多个一级类别的概率和所述目标视频属于多个二级类别的概率,所述第一概率为所述...

【专利技术属性】
技术研发人员:黄剑辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1