一种视频标签的生成方法、装置及计算机存储介质制造方法及图纸

技术编号:22783801 阅读:16 留言:0更新日期:2019-12-11 04:14
本申请实施方式公开了一种视频标签的生成方法、装置及计算机存储介质,其中,所述方法提供有标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述方法包括:获取目标视频的视频信息;根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。本申请提供的技术方案,能够在生成与视频内容相契合的视频标签的同时,提高视频标签的生成效率。

A video label generation method, device and computer storage medium

The embodiment of the application discloses a video tag generation method, device and computer storage medium, wherein the method provides a tag library, wherein the tag library includes a video tag and a description vocabulary group associated with the video tag, wherein the description vocabulary group includes at least two description vocabularies, and the method comprises: obtaining video information of the target video; according to The video information in the same scene in the target video is identified to obtain the feature vocabulary group, which includes the feature vocabulary used to represent the content of the target video; the description vocabulary group included in the feature vocabulary group is determined, and the video label associated with the description vocabulary group in the tag library is used as the video label of the target video Sign. The technical scheme provided by the application can improve the generation efficiency of the video tag while generating the video tag corresponding to the video content.

【技术实现步骤摘要】
一种视频标签的生成方法、装置及计算机存储介质
本申请涉及互联网
,特别涉及一种视频标签的生成方法、装置及计算机存储介质。
技术介绍
当前,为了让用户在短时间内获知视频的内容,视频播放平台通常会为上传的视频制作对应的视频标签。目前,为视频添加标签的方式有多种:一种是让观看视频的用户为视频添加标签,这种方式比较快捷,但是添加的标签是否与视频内容相契合则无法把控;一种是通过视频播放平台的管理人员手动添加标签,这种方式需要耗费相当大的人力物力,由于管理人员的数量有限,这种方式效率太低。
技术实现思路
本申请实施方式的目的是提供一种视频标签的生成方法、装置及计算机存储介质,能够在生成与视频内容相契合的视频标签的同时,提高视频标签的生成效率。为实现上述目的,本申请实施方式提供一种视频标签的生成方法,提供有标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述方法包括:获取目标视频的视频信息,所述视频信息中包括所述目标视频的语音信息、图像信息、字幕信息以及标题信息;根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。为实现上述目的,本申请实施方式还提供一种视频标签的生成装置,所述装置包括存储器和处理器,所述存储器中存储计算机程序和标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述计算机程序被所述处理器执行时,实现以下步骤:获取目标视频的视频信息,所述视频信息中包括所述目标视频的语音信息、图像信息、字幕信息以及标题信息;根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。为实现上述目的,本申请实施方式还提供一种计算机存储介质,所述计算机存储介质中存储计算机程序和标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述计算机程序被处理器执行时,实现以下步骤:获取目标视频的视频信息,所述视频信息中包括所述目标视频的语音信息、图像信息、字幕信息以及标题信息;根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。由上可见,本申请提供的技术方案,可以通过描述词汇的组合来确定目标视频的视频标签。在本申请中,可以通过对大量的视频信息进行分析,从而归纳出标签库。在该标签库中,可以包括各个视频标签以及与视频标签相关联的描述词汇组,所述描述词汇组中可以包括多个描述词汇。这样,多个描述词汇的组合可以最终确定视频标签。举例来说,标签库中包括“惊险”这样的标签,该标签关联的描述词汇组中包括“大叫”、“惊恐”这两个描述词汇,那么“大叫”和“惊恐”这两个描述词汇的组合可以生成对应的标签“惊险”。那么在生成目标视频的标签时,可以预先对目标视频的视频信息进行分析,从而根据同一场景下的视频信息识别得到特征词汇组。该特征词汇组中的特征词汇可以表征目标视频的内容。这样,通过将特征词汇组中的特征词汇与标签库中的描述词汇进行对比,可以确定出特征词汇组中包含的描述词汇组,从而可以将确定出的描述词汇组关联的视频标签作为所述目标视频的视频标签。由上可见,本申请提供的技术方案,能够在生成与视频内容相契合的视频标签的同时,提高视频标签的生成效率。附图说明为了更清楚地说明本申请实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施方式中标签库的示意图;图2为本申请实施方式中视频标签的生成方法流程图;图3为本申请实施方式中描述词汇组的示意图;图4为本申请实施方式中视频标签的生成装置的结构示意图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都应当属于本申请保护的范围。本申请提供一种视频标签的生成方法,所述方法可以应用于视频播放网站的业务服务器中。所述业务服务器在接收到用户或者管理员上传的视频之后,可以生成该视频的视频标签。在本实施方式中,所述业务服务器可以针对大量的视频信息,归纳出包含视频标签的标签库。其中,所述视频信息可以是与视频相关的文字、图像、语音等信息。具体地,所述视频信息可以包括视频的语音信息、图像信息、字幕信息以及标题信息。其中,所述语音信息可以是视频中的背景音和人物发出的声音,所述字幕信息可以是视频画面中出现的字幕以及注释,所述图像信息可以是视频的画面,所述标题信息可以是视频的标题。在本实施方式中,通过对所述视频信息进行分析,可以识别出与视频内容相符的一系列词汇。具体地,针对语音信息,可以通过自动化语音识别(AutomaticSpeechRecognition,ASR)的技术,将语音信息转换为机器能够识别的二进制编码或者字符序列,然后通过语义识别的技术,识别出与视频内容相符的词汇;针对字幕信息,可以通过光学字符识别(OpticalCharacterRecognition,OCR)的技术,从视频画面中提取出文字信息,然后通过语义识别的技术提取出能够表征文字信息含义的词汇;针对图像信息,则可以通过图像识别技术,识别出图像信息中包含的目标对象,并确定能够表征目标对象的词汇;对于标题信息,可以通过语义识别的技术提取出能够表征标题信息含义的词汇。在本实施方式中,在从视频信息中识别出与视频内容相符的词汇之后,可以基于这些词汇,构建出上述的标签库。具体地,可以采用知识图谱(KnowledgeGraph/Vault)的方式,将多个词汇进行组合,并将构成组合的多个词汇共同表征的含义作为视频标签。例如,在图1中,“帮忙”和“妈妈”这两个词汇组合在一起,可以表征“孝顺”的含义,因此“孝顺”可以作为“帮忙”和“妈妈”这两个词汇的组合表征的视频标签。又例如,在图1中,“大叫”和“害怕”这两个词汇的组合可以对应视频标签“惊险”。这样,通过知识图谱的方式表现的标签库中,可以包含多个视频标签本文档来自技高网
...

【技术保护点】
1.一种视频标签的生成方法,其特征在于,提供有标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述方法包括:/n获取目标视频的视频信息,所述视频信息中包括所述目标视频的语音信息、图像信息、字幕信息以及标题信息;/n根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;/n确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。/n

【技术特征摘要】
1.一种视频标签的生成方法,其特征在于,提供有标签库,所述标签库中包括视频标签以及所述视频标签关联的描述词汇组,所述描述词汇组中包括至少两个描述词汇,所述方法包括:
获取目标视频的视频信息,所述视频信息中包括所述目标视频的语音信息、图像信息、字幕信息以及标题信息;
根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组,所述特征词汇组中包括用于表征所述目标视频的内容的特征词汇;
确定所述特征词汇组中包含的描述词汇组,并将确定的所述描述词汇组在所述标签库中关联的视频标签作为所述目标视频的视频标签。


2.根据权利要求1所述的方法,其特征在于,根据在所述目标视频中处于同一场景下的视频信息识别得到特征词汇组包括:
从所述目标视频中依次提取场景切换帧,并将相邻两个场景切换帧之间的视频帧作为相同场景帧;
从所述相同场景帧对应的视频信息中识别表征所述相同场景帧的内容的多个特征词汇;其中,所述多个特征词汇构成所述相同场景帧对应的特征词汇组。


3.根据权利要求2所述的方法,其特征在于,从所述目标视频中依次提取场景切换帧包括:
在所述目标视频中确定基准帧,并依次计算所述基准帧之后的视频帧与所述基准帧之间的相似度;
若当前帧与所述基准帧之间的相似度小于或者等于指定阈值时,将所述当前帧确定为一个场景切换帧;
将所述当前帧作为新的基准帧,并依次计算所述新的基准帧之后的视频帧与所述新的基准帧之间的相似度,并根据计算的所述相似度确定下一个场景切换帧。


4.根据权利要求1或2所述的方法,其特征在于,从视频信息中识别特征词汇的步骤包括:
将所述语音信息转换为文字信息,并将转换得到的所述文字信息和所述字幕信息、所述标题信息作为待识别的文本;
将所述待识别的文本拆分为多个词汇,并将拆分得到的所述词汇作为所述视频信息中包含的特征词汇;
识别所述图像信息中包含的对象,并将表征所述对象的词汇作为所述视频信息中包含的特征词汇。


5.根据权利要求4所述的方法,其特征在于,在将所述待识别的文本拆分为多个词汇之后以及识别所述图像信息中包含的对象之后,所述方法还包括:
分别计算拆分得到的所述词汇的权重值以及表征所述对象的词汇的权重值,并从拆分得到的所述词汇以及表征所述对象的词汇中筛选出权重值满足指定关系的目标词汇,并将所述目标词汇作为所述视频信息中包含的特征词汇。


6.根据权利要求1所述的方法,其特征在于,确定所述特征词汇组中包含的描述词汇组包括:
在所述标签库中查询与所述特征词汇组中的特征词汇相匹配的描述词汇,并判断查询得到的所述描述词汇中是否存在处于同一个目标描述词汇组中的描述词汇;
若存在,判断查询得到的所述描述词汇中处于所述目标描述词汇组中的描述词汇的数量是否达到所述目标描述词汇组中包含的描述词汇的标准数量;
若达到,将所述目标描述词汇组作为所述特征词汇组中包含的描述词汇组。


7.根据权利要求6所述的方法,其特征在于,在所述标签库中查询与所述特征词汇组中的特征词汇相匹配的描述词汇包括:
针对所述特征词汇组中的当前特征词汇,计算所述当前特征词汇与所述标签库中描述词汇之间的相似度;
将计算得到的最高相似度对应的描述词汇作为所述当前特征词汇在所述标签库中相匹配的描述词汇。


8.根据权利要求1所述的方法,其特征在于,所述标签库中包括多个按照视频的类型进行划分的子标签库;
相应地,确定所述特征词汇组中包含的描述词汇组包括:
在所述标签库中识别与所述目标视频的类型相适配的目标子标签库;
在所述目标子标签库中查询与所述特征词汇组中的特征词汇相匹配的描述词汇,并判断查询得到的所述描述词汇中是否存在处于同一个目标描述词汇组中的描述词汇;
若存在,判断查询得到的所述描述词汇中处于所述目标描述词汇组中的描述词汇的数量是否达到所述目标描述词汇组中包含的描述词汇的标准数量;
若达到,将所述目标描述词汇组作为所述特征词汇组...

【专利技术属性】
技术研发人员:盛骁杰
申请(专利权)人:优酷网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1