视频标签生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：17912627 阅读：23 留言：0更新日期：2018-05-10 18:24

本发明专利技术提出一种视频标签生成方法、装置、计算机设备和存储介质，其中，方法包括：根据视频的标题提取得到主题词，以及确定主题词所属的主题类别词，根据视频的标题进行页面搜索，得到多个匹配页面，从每一个匹配页面的内容中提取关键词，根据主题词，对关键词进行筛选，以保留与主题词不重复的关键词，根据主题词、主题类别词和保留的关键词，生成视频的标签。通过对视频标签进行页面检索，获取匹配页面，从匹配页面中提取关键词，并对关键词筛选，增加了视频资源的文本信息，丰富了生成的视频标签的内容和种类，解决了现有技术中，视频资源的文本信息较少，致使生成的视频标签种类较少，准确性较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
视频标签生成方法、装置、计算机设备和存储介质
本申请涉及视频处理
，尤其涉及一种视频标签生成方法、装置、计算机设备和存储介质。
技术介绍
随着网络多媒体技术的快速发展，互联网上的视频等多媒体内容的数量正在以指数级的速度迅猛增长。视频资源通过标签标注视频内容核心点以及用户关注的核心内容，随着视频资源的检索需求越来愈大，丰富视频标签的内容，提高视频标签的准确度显的尤为重要。相关技术中，对于视频内容的标签标注，一种方法是通过固有的标签体系进行标注；另一种方法是利用视频资源的内容生成标签。第一种方法固有的标签数量有限，无法覆盖全网视频标签的需求。第二种方法，因视频资源携带的文本内容有限，可生成的标签的内容和类别有限，使得生成的视频标签数量较少，准确度较低的问题。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的第一个目的在于提出一种视频标签生成方法，以实现通过对视频标签进行页面检索，获取匹配页面，从匹配页面中提取关键词，并对关键词筛选，使得筛选出的关键词增加了视频资源的文本信息，丰富了生成的视频标签的内容和种类，解决了现有技术中，视频资源的文本信息较少，致使生成的视频标签种类较少，准确性较低的问题。本专利技术的第二个目的在于提出一种视频标签生成装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的，本专利技术第一方面实施例提出了一种视频标签生成方法，包括：根据视频的标题提取得到主题词，以及确定所述主...
视频标签生成方法、装置、计算机设备和存储介质

【技术保护点】
一种视频标签生成方法，其特征在于，包括以下步骤：根据视频的标题提取得到主题词，以及确定所述主题词所属的主题类别词；根据视频的标题进行页面搜索，得到多个匹配页面；从每一个匹配页面的内容中提取关键词；根据所述主题词，对所述关键词进行筛选，以保留与所述主题词不重复的关键词；根据所述主题词、所述主题类别词和保留的关键词，生成所述视频的标签。

【技术特征摘要】
1.一种视频标签生成方法，其特征在于，包括以下步骤：根据视频的标题提取得到主题词，以及确定所述主题词所属的主题类别词；根据视频的标题进行页面搜索，得到多个匹配页面；从每一个匹配页面的内容中提取关键词；根据所述主题词，对所述关键词进行筛选，以保留与所述主题词不重复的关键词；根据所述主题词、所述主题类别词和保留的关键词，生成所述视频的标签。2.根据权利要求1所述的视频标签生成方法，其特征在于，所述从每一个匹配页面的内容中提取关键词，包括：从搜索引擎获取每一个匹配页面的标题和摘要；对所述标题和摘要提取关键词，所述关键词包括实体词、网络热词和网络新词中的一个或多个组合。3.根据权利要求1所述的视频标签生成方法，其特征在于，所述根据视频的标题进行页面搜索，得到多个匹配页面，包括：将所述视频的标题作为搜索词，采用搜索引擎进行页面搜索；对所述搜索引擎搜索得到的多个页面进行筛选，保留页面的标题或摘要与所述视频的标题之间的相关度高于第一阈值的匹配页面。4.根据权利要求3所述的视频标签生成方法，其特征在于，所述从每一个匹配页面的内容中提取关键词之前，还包括：确定所述匹配页面在所述搜索引擎搜索得到的多个页面中的占比高于第二阈值。5.根据权利要求3所述的视频标签生成方法，其特征在于，所述从每一个匹配页面的内容中提取关键词之后，还包括：根据所述匹配页面的数量，确定提取到的各关键词的权重和；所述权重和与所述匹配页面的数量具有正向关系；根据确定的权重和，以及各匹配页面的标题或摘要与所述视频的标题之间的相关度，确定从各匹配页面提取到的关键词的权重；各关键词的权重与所述相关度具有正向关系...

【专利技术属性】
技术研发人员：薛成龙，史亚冰，梁海金，张扬，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人