The embodiment of the application discloses a video tag generation method, device and computer storage medium, wherein the method provides a tag library, wherein the tag library includes a video tag and a description vocabulary group associated with the video tag, wherein the description vocabulary group includes at least two description vocabularies, and the method comprises: obtaining video information of the target video; according to The video information in the same scene in the target video is identified to obtain the feature vocabulary group, which includes the feature vocabulary used to represent the content of the target video; the description vocabulary group included in the feature vocabulary group is determined, and the video label associated with the description vocabulary group in the tag library is used as the video label of the target video Sign. The technical scheme provided by the application can improve the generation efficiency of the video tag while generating the video tag corresponding to the video content.
【技术实现步骤摘要】
一种视频标签的生成方法、装置及计算机存储介质
本申请涉及互联网
,特别涉及一种视频标签的生成方法、装置及计算机存储介质。
技术介绍
当前,为了让用户在短时间内获知视频的内容,视频播放平台通常会为上传的视频制作对应的视频标签。目前,为视频添加标签的方式有多种:一种是让观看视频的用户为视频添加标签,这种方式比较快捷,但是添加的标签是否与视频内容相契合则无法把控;一种是通过视频播放平台的管理人员手动添加标签,这种方式需要耗费相当大的人力物力,由于管理人员的数量有限,这种方式效率太低。
技术实现思路
本申请实施方式的目的是提供一种视频标签的生成方法、装置及计算机存储介质,能够在生成与视频内容相契合的视频标签的同时,提高视频标签的生成效率。为实现上述目的,本申请实施方式提供一种视频标签的生成方法,提供有标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述方法包括:获取目标视频的视频信息,所述视频信息中包括所述目标视频的语音信息、图像信息、字幕信息以及标题信息;根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。为实现上述目的,本申请实施方式还提供一种视频标签的生成装置,所述装置包括存储器和处理器,所述存储器中存储计算机程序和标签库,所述标签库中包 ...
【技术保护点】
1.一种视频标签的生成方法,其特征在于,提供有标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述方法包括:/n获取目标视频的视频信息,所述视频信息中包括所述目标视频的语音信息、图像信息、字幕信息以及标题信息;/n根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;/n确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。/n
【技术特征摘要】
1.一种视频标签的生成方法,其特征在于,提供有标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述方法包括:
获取目标视频的视频信息,所述视频信息中包括所述目标视频的语音信息、图像信息、字幕信息以及标题信息;
根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;
确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。
2.根据权利要求1所述的方法,其特征在于,根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组包括:
从所述目标视频中依次提取场景切换帧,并将相邻两个场景切换帧之间的视频帧作为相同场景帧;
从所述相同场景帧对应的视频信息中识别表征所述相同场景帧的内容的多个特征词汇;其中,所述多个特征词汇构成所述相同场景帧对应的特征词汇组。
3.根据权利要求2所述的方法,其特征在于,从所述目标视频中依次提取场景切换帧包括:
在所述目标视频中确定基准帧,并依次计算所述基准帧之后的视频帧与所述基准帧之间的相似度;
若当前帧与所述基准帧之间的相似度小于或者等于指定阈值时,将所述当前帧确定为一个场景切换帧;
将所述当前帧作为新的基准帧,并依次计算所述新的基准帧之后的视频帧与所述新的基准帧之间的相似度,并根据计算的所述相似度确定下一个场景切换帧。
4.根据权利要求1或2所述的方法,其特征在于,从视频信息中识别特征词汇的步骤包括:
将所述语音信息转换为文字信息,并将转换得到的所述文字信息和所述字幕信息、所述标题信息作为待识别的文本;
将所述待识别的文本拆分为多个词汇,并将拆分得到的所述词汇作为所述视频信息中包含的特征词汇;
识别所述图像信息中包含的对象,并将表征所述对象的词汇作为所述视频信息中包含的特征词汇。
5.根据权利要求4所述的方法,其特征在于,在将所述待识别的文本拆分为多个词汇之后以及识别所述图像信息中包含的对象之后,所述方法还包括:
分别计算拆分得到的所述词汇的权重值以及表征所述对象的词汇的权重值,并从拆分得到的所述词汇以及表征所述对象的词汇中筛选出权重值满足指定关系的目标词汇,并将所述目标词汇作为所述视频信息中包含的特征词汇。
6.根据权利要求1所述的方法,其特征在于,确定所述特征词汇组中包含的描述词汇组包括:
在所述标签库中查询与所述特征词汇组中的特征词汇相匹配的描述词汇,并判断查询得到的所述描述词汇中是否存在处于同一个目标描述词汇组中的描述词汇;
若存在,判断查询得到的所述描述词汇中处于所述目标描述词汇组中的描述词汇的数量是否达到所述目标描述词汇组中包含的描述词汇的标准数量;
若达到,将所述目标描述词汇组作为所述特征词汇组中包含的描述词汇组。
7.根据权利要求6所述的方法,其特征在于,在所述标签库中查询与所述特征词汇组中的特征词汇相匹配的描述词汇包括:
针对所述特征词汇组中的当前特征词汇,计算所述当前特征词汇与所述标签库中描述词汇之间的相似度;
将计算得到的最高相似度对应的描述词汇作为所述当前特征词汇在所述标签库中相匹配的描述词汇。
8.根据权利要求1所述的方法,其特征在于,所述标签库中包括多个按照视频的类型进行划分的子标签库;
相应地,确定所述特征词汇组中包含的描述词汇组包括:
在所述标签库中识别与所述目标视频的类型相适配的目标子标签库;
在所述目标子标签库中查询与所述特征词汇组中的特征词汇相匹配的描述词汇,并判断查询得到的所述描述词汇中是否存在处于同一个目标描述词汇组中的描述词汇;
若存在,判断查询得到的所述描述词汇中处于所述目标描述词汇组中的描述词汇的数量是否达到所述目标描述词汇组中包含的描述词汇的标准数量;
若达到,将所述目标描述词汇组作为所述特征词汇组...
【专利技术属性】
技术研发人员:盛骁杰,
申请(专利权)人:优酷网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。